2472件の用語
Positional Skip-wisE fine-tuning の略。元の短いコンテキスト長で継続訓練しながら、スキップ的な位置インデックスの割り当てで長いコンテキストへの適応を実現する省コストなコンテキスト拡張手法。
LLM API管理のための商用AIゲートウェイプラットフォーム。リクエストルーティング・セマンティックキャッシング・プロンプトバージョン管理・リアルタイムオブザーバビリティを統合し、本番LLMアプリケーションの信頼性とコスト効率を向上させる。
LLMルーティング・フォールバック・キャッシュ・可観測性をオールインワンで提供するエンタープライズ向けAIゲートウェイ。OpenAI互換API・詳細なトレース・コスト管理を統合。
2023年Shouyuan Chen et al. (Meta AI)発表Position Interpolation・Industry-leading PI foundation method + Industry-leading Linear interpolation RoPE + Industry-leading 32K LLaMA + Industry-leading RoPE-based extension foundation。
Metaが2023年に提案した、RoPEの位置インデックスを線形スケールダウンすることで、わずか1000ステップのファインチューニングで事前学習済みLLaMAモデルのコンテキスト長を最大32kトークンまで拡張する手法。
2024年Voyage AI(Anthropic推奨)公開Embedding 3 series。voyage-3-large/voyage-code-3+RAG最適化+1024-2048次元+Multi-language+Code Specific+Anthropic公式Recommendation+OpenAI Ada-002代替候補搭載。
2024年9月Voyage AI発表voyage-3・Industry-leading retrieval-focused embedding model + Industry-leading 1024d default + Industry-leading 32k context + Industry-leading $0.06/1M tokens Voyage AI voyage-3 enterprise embedding 2024。
Voyage Embedding(Voyage AI埋め込みモデル)とは、Voyage AI社が開発・提供するテキスト埋め込みモデルシリーズである。Voyage-3を筆頭に、コード特化のVoyage-code-3やファイナンス特化のVoyage-finance-2など、ドメイン特化モデルを展開し、MTEBベンチマークで最高水準の検索性能を達成している。
Voyage AI社が2024年9月にリリースした高性能テキスト埋め込みモデル。MTEBベンチマークで最高水準のスコアを達成し、特にRetrieval(情報検索)タスクでOpenAIのtext-embedding-3-largeを上回る精度を示した商用埋め込みAPIだ。
Voyage AI(Anthropic出資)が提供する高精度テキスト埋め込みモデル。RAGや意味検索向けに最適化され、長コンテキスト対応の voyage-3-large も展開している。
Voyage AI社が2024年に公開した商用テキスト埋め込みモデル。1,024次元・最大16,000トークン入力対応で、MTEB英語ベンチマークでトップクラスの性能を持つAPI提供型 Embedding サービス。
Voyage-3-Largeは、テキストの複雑な意味構造や文脈的なニュアンスを極めて高い精度で捉えるための大規模埋め込みモデルです。単なるキーワードではなく、「真の意味」に基づいたベクトル表現を提供します。
AnthropicのAI子会社VoyageAIが提供する高速・低コスト埋め込みモデル。Voyage-3のライト版で1M tokens $0.02・英語特化で高いコスパを実現。
WebContainers技術を核とし、ブラウザ上でのプロンプト入力のみでフルスタックアプリの生成から実行、デプロイまでを完結させるAIエージェント型開発プラットフォーム。
2024年10月3日StackBlitz公開Bolt.new。Pro 業界Pro Mainstream Full-Stack Web AI Coding + Pro WebContainer Pro Famous + Pro Browser-based Full-Stack + Pro Eric Simons Pro CEO主導 + Pro $20-$200 Subscription + Pro $40M ARR Pro Famous類無し + 2025-Pro Bolt.diy + Pro Bolt for Mobile + 累計Heritage。
StackBlitz 2024年10月発表のフルスタック AI 開発プラットフォーム。Claude 3.5 Sonnet 主流 + Web プレビュー + デプロイ統合・$20/月.
LLMモデルマージのためのオープンソースツールキット(Charles Goddard開発、2023年公開)。SLERP、TIES、DARE、線形補間、タスクベクトル等の主要マージ手法をYAML設定ファイルで統一的に実行できる。HuggingFaceモデルハブとのシームレスな連携が特徴。
リクエストの内容・複雑度に基づいてLLMモデルを動的に選択するインテリジェントルーティングサービス。コスト削減と品質維持を両立するために、タスクごとに最適なモデルへ自動振り分けを行う。
GPTQ INT4量子化×FP16行列乗算に特化したNVIDIA CUDA最適化カーネル。Ampere/Hopper GPUのTensor Coreを活用し、非量子化FP16比で2倍以上のスループットを達成する。
2023年Microsoft Research公開AutoGen。Pro 業界Pro Mainstream Multi-Agent Framework先駆 + Pro Microsoft Research + Pro Chi Wang Pro主要研究員 + Pro Conversable Agent Pro Famous + Pro Multi-Agent Conversation + Pro MIT License + Pro AutoGen 0.4 Magentic-One + 累計2023-2026年3年Heritage継承代表機。