1978件の用語
Kirchenbauer・Geiping・Wenらが提案したLLMテキストへの統計的透かし手法。トークンをgreen/redリストに分割し生成時にgreenリストを優遇、z検定で検出する。
K Means Clusteringは、人工知能・機械学習分野における重要な概念・技術です。
2023年Kirchenbauer et al. (Maryland)発表KGW Watermark・Industry-leading LLM watermark green list red list signature + Industry-leading Z-statistic detection + Industry-leading first practical LLM watermark。
Thomson Reutersが2023年に6.5億ドルで買収した法律リサーチAIアシスタント。Westlawの膨大な判例・法令データベースとLLMを統合し、判例調査・デポジション準備・文書レビュー・契約分析を自然言語インターフェースで提供する。引用ハルシネーションを防ぐためWestlawソース直結設計を採用。
2024年Ethayarajh et al. + Contextual AI発表KTO paper・Industry-leading Kahneman-Tversky Optimization paradigm + Industry-leading prospect theory-based alignment + Industry-emerging KTO Contextual AI Pioneer。
ペアの選好データを必要とせずスカラー品質シグナル(良い/悪い)だけでLLMをアライメントできる手法。行動経済学のカーネマン・テベルスキー理論を損失関数に応用し、DPOより少ないデータで実用的なアライメントを実現する。2024年発表。
Ethayarajh ら ContextualAI 2024年 LLM alignment 手法。プロスペクト理論ベースで unpaired データ(thumbs up/down)で学習可
ペアデータ不要でLLMをアライメントする手法。好ましい/好ましくない応答を個別に使用し、行動経済学のKahneman-Tversky理論(プロスペクト理論)に基づく損失関数を採用。ペアデータが少ない場合に特に有効。
Transformer 推論で Attention の Key/Value ベクトルを再計算せず保持する仕組み。長文推論で GPU メモリを消費するが生成速度を大幅に向上。
LLM推論KV Cache最適化。PagedAttention (vLLM・OS Page Table類似)・Flash Attention 3 (Hopper H100)・Flash Attention 2.7 (Ampere/Ada/Blackwell)・Multi-Query Attention (MQA)・Group Query Attention (GQA・Llama 3)・Sliding Window Attention・KV Cache Quantization (q8_0/q4_0)・Prefix Caching・Speculative Decoding・Lookahead Decoding・¥0 OSS、2026年Hybrid Attention主流化。
LLM推論時に生成したKVキャッシュをGPUメモリからCPU DRAMやNVMe SSDに退避させてGPUメモリを節約する技術。
2024年成熟KV Cache Compression・Industry-leading H2O+SnapKV+StreamingLLM techniques + Industry-leading 50-90% KV cache reduction + Industry-leading minimal quality loss + Industry-leading 2024 KV cache compression inference optimization 2024。
Keras Frameworkは、人工知能・機械学習分野における重要な概念・技術です。
2016年Hendrycks + Gimpel発表GELU paper・Industry-leading Gaussian Error Linear Unit paradigm + Industry-leading BERT + GPT-2 + GPT-3 dominant activation + Industry-leading 8年heritage Transformer Industry-standard。
LLMが特定の事実(「エッフェル塔はパリにある」等)をどの層・どのトークン位置に格納しているかを因果介入実験で特定する手法。ROMEモデル編集の基盤技術。ROME論文(2022)で提唱。
2024年7月Alibaba FunAudioLLM発表CosyVoice・Industry-leading multilingual TTS + Industry-leading 5-language Chinese+English+Japanese+Korean+Cantonese + Industry-leading zero-shot voice cloning + Industry-leading Alibaba FunAudioLLM CosyVoice Apache 2.0 multilingual TTS 2024。
2024年Mistral AI発表Codestral・Industry-leading Mistral code generation LLM + Industry-leading 22B / Mamba 7B + Industry-leading 80+ programming languages + Industry-leading 32K context + Industry-leading Non-Production License。
2024年7月Mistral AI発表Codestral Mamba 7B・Industry-leading Mamba state-space code LLM + Industry-leading linear-time scaling + Industry-leading 256K context + Industry-leading Mistral AI Codestral Mamba 7B Apache 2.0 Mamba code LLM 2024。
Codeium 2024年11月発売の VS Code 派生 AI エディタ Windsurf。Cascade 独自 LLM + Computer Use + $15/月・「Cursor の競合」.
LLMエージェントがPythonコードを実行手段として使い、ツール呼び出しの代わりにコードで環境と対話するエージェントフレームワーク。