2472件の用語
LLMのKVキャッシュを「過去に重要だったトークンは将来も重要」という持続性仮説に基づいて動的に圧縮するキャッシュ退去アルゴリズム。
2023年Liu et al. + CMU発表Scissorhands paper・Industry-leading Persistent KV cache compression paradigm + Industry-leading persistence-based KV eviction + Industry-emerging CMU KV cache compression。
LLMのプロンプトを少数の「gist token(要旨トークン)」に蒸留する手法。長いシステムプロンプトや指示文を数トークンに圧縮してKVキャッシュとして保存・再利用することでトークン消費を大幅削減できる。
MetaがDiplomacyゲームで人間レベルの性能を達成した初のAIエージェント。自然言語交渉とゲーム戦略を統合。
2024年9月Jina AI (ドイツ・ベルリン拠点・2020年Han Xiao創業) 発表のJina Embeddings v3・XLM-RoBERTa 570M base + LoRA adapter + Multilingual (89言語対応) + 8,192 max sequence + Matryoshka Representation Learning (32-1024次元可変) + Task-specific instruction prefix (Retrieval/Clustering/Classification/Separation等) ・CC BY-NC 4.0 License (非商用) + Jina Cloud API商用 ($0.02/1M tokens) ・MTEB 65.52 + MIRACL Multilingual 8位・小型 + 高速 + Multilingual特化のEmbedding Model。
2024年6月Jina AI公開Reranker v2-Base-Multilingual。Pro 業界Pro Mainstream German Reranker Top + Pro Jina AI主導 + Pro Berlin発 + Pro 100+言語対応 + Pro 278M Parameters + Pro CC BY-NC License + Pro 8K Token Context + 累計2023-2025年2年Heritage継承代表機。
参照モデルを使わず、シーケンス長で正規化した平均対数確率を報酬代理として使うアライメント手法。DPOやORPOより実装がシンプルで、2024年Princeton大学が提案。長い応答への偏りを防ぐ長さペナルティも内蔵し、AlpacaEval 2.0で当時SOTA達成。
LLMのトークンを逐次ではなく並列に推測・検証するデコーディング手法。Jacobi反復法を応用してドラフトと検証を同時実行する。
Jasper AIのクリエイティブライティング機能。マーケティングコピー特化から進化し、短編小説・キャラクター構築・ブランドストーリーテリングに対応するLLMベースの文章生成ツール。
Google Brain 2018年OSS化の自動微分+XLAコンパイラ統合数値計算ライブラリ。NumPy互換+JIT+functional+Google AI研究主要ツール。
2023年6月Jan AI公開Janitor AI。Pro 業界Pro Mainstream Open Roleplay AI Top + Pro Custom Character Top独占 + Pro NSFW対応 + Pro Free Tier + Pro Multi-LLM Backend(GPT/Claude/Llama) + Pro 累計世界月間1000万+ User Pro Reference + 2024-Pro Janitor LLM公開 + 累計2023-2025年2年Heritage。
日本LLM動向。Sakana AI EvoVLM-JP-v2・TinySwallow-1.5B・Sarashina2 (SB Intuitions・70B/13B/8x70B MoE)・PLaMo 100B (Preferred Networks・PFE)・PLaMo Prime・RakutenAI 7B/RakutenAI 2.0・Karakuri-LM-70B-v0.1・SwallowLM (東工大・Llama Fork)・Stockmark LLM・ELYZA-tasks-100・llm-jp-3 (国立情報学研究所 NII・172B予告)・¥0 OSS・¥¥¥¥¥ API、2026年llm-jp 172B GA予告。
Local LLM GUI App。Jan(OSS・Mac/Win/Linux・Nitro Engine・OpenAI互換API)・LM Studio(Mac/Win/Linux・MLX engine 2024年)・Msty($0 Solo・$8/mo Pro・Parallel chat)・Open WebUI(Docker・Ollama backend GUI)・AnythingLLM($0 Desktop・RAG workflow)・Chatbox(multi-provider)・LibreChat(self-host)・Enchanted(Mac macOS native)・Ollama GUI・BoltAI($29 one-time)・2026年 Mac M4 Max + LM Studio MLX で 70B Q4実用化、プライバシー重視層急拡大。
AI21 Labsが2024年3月にリリースしたTransformer+Mambaハイブリッドアーキテクチャ採用のMoEモデル。256Kコンテキストと高スループット推論を特徴とし、SSMとAttentionを組み合わせた革新的設計を持つ。
AI21 Labsが2024年3月に公開したMamba(SSM)とTransformerのハイブリッドMoEモデル。52Bパラメータ(アクティブ12B)で、Mambaの線形計算量とTransformerのアテンション精度を組み合わせた新アーキテクチャ。256Kコンテキストウィンドウと低メモリ推論が特長。
2024年3月AI21 Labs発表Jamba・Industry-leading Mamba + Transformer hybrid + MoE + Industry-leading 52B total + 12B active + Industry-leading 256K context + Industry-leading AI21 Labs Jamba Apache 2.0 hybrid Mamba-Transformer MoE 2024。
AI21 Labsが2025年に公開したSSM-Transformer-MoEハイブリッドLLM。Jamba 1.5 Largeは総パラメータ398B・アクティブ94B・コンテキスト256Kトークンを実現。Mambaアーキテクチャと注意機構を交互に配置した独自ハイブリッド設計で長コンテキスト処理効率に優れる。
AI21 Labsが2024年発表したMamba SSMとTransformer AttentionをMixture-of-Experts(MoE)と組み合わせたハイブリッドLLM。52B総パラメータ・12Bアクティブで256Kコンテキスト長を実現した商用オープン重み公開モデル。
AI21 Labs製のハイブリッドSSM-TransformerモデルJambaの第2世代。MoEとMamba-2を組み合わせ、256KトークンコンテキストとTransformer比5倍のスループットを実現。2025年7月公開の52Bアクティブ/398Bトータルパラメータモデル。
2018年Anil et al. + Google発表Shampoo paper・Industry-leading Second-order Preconditioned Stochastic Tensor Optimization paradigm + Industry-leading block diagonal second-order + Industry-leading Google internal LLM adoption。