AI・機械学習

2472件の用語

Transformerモデルの推論時に過去のKey-Valueペアをメモリに保持し、同じ計算の繰り返しを回避して生成速度を高速化するメカニズム。

上級

AI・機械学習

KVキャッシュ（プロンプトキャッシング）（ケーブイキャッシュ）

Transformer の Self-Attention 層で計算される Key-Value ペアを保存・再利用する仕組みで、プロンプトキャッシングの中核技術。

上級

AI・機械学習

KVキャッシュエビクション（ケーブイキャッシュエビクション）

KVキャッシュから重要度の低いトークンのKey-Valueペアを動的に破棄し、メモリ使用量を削減しながら生成品質を維持する技術。H2OやSnapKVが代表的手法。

上級

AI・機械学習

KVキャッシュオフローディング（LLM）（ケーブイキャッシュオフローディング）

LLM推論時に生成したKVキャッシュをGPUメモリからCPU DRAMやNVMe SSDに退避させてGPUメモリを節約する技術。

上級

AI・機械学習

KVキャッシュ管理（ケーブイキャッシュカンリ）

KVキャッシュ管理は、Transformer系LLMの推論時に各Attention層で生成されるKey-Valueペアを効率的に格納・再利用・共有するメモリ管理技術。PagedAttention・Prefix Caching・Radix Attention・Token Eviction（トークン退避）などの手法があり、GPUメモリの利用効率を60〜80%改善して同時処理可能なリクエスト数を数倍に増加させる。LLM推論エンジンのスループットとコスト効率を決定する最重要コンポーネント。

上級

AI・機械学習

KV Cache Compression (2024年)（ケーブイキャッシュコンプレッション）

2024年成熟KV Cache Compression・Industry-leading H2O+SnapKV+StreamingLLM techniques + Industry-leading 50-90% KV cache reduction + Industry-leading minimal quality loss + Industry-leading 2024 KV cache compression inference optimization 2024。

上級

AI・機械学習

KVキャッシュ最適化（ケーブイキャッシュサイテキカ）

Transformerモデルの推論時にKey-Valueペアを再利用することでトークン生成速度を大幅に向上させる技術。メモリ効率と推論レイテンシのトレードオフを最適化する。

上級

AI・機械学習

KVキャッシュ最適化（ケーブイキャッシュサイテキカ）

LLM推論時にTransformerのAttention計算で生成されるKey-Value（KV）ペアをGPUメモリ上に効率的にキャッシュ・管理する技術群で、メモリ使用量とレイテンシの両方を削減する

上級

AI・機械学習

KVキャッシュ最適化（ケーブイキャッシュサイテキカ）

LLM推論時のKVキャッシュのメモリ消費・帯域幅・レイテンシを削減するための技術群。量子化、エビクション、アーキテクチャ改良、システム最適化など多層的なアプローチがある。

上級

AI・機械学習

KVキャッシュ量子化（ケーブイキャッシュリョウシカ）

KVキャッシュに格納されるKey-Valueテンソルのデータ精度をFP16からINT8/INT4に低減し、メモリ使用量を50〜75%削減する技術。KIVIやAtomが代表的手法。

初級

AI・機械学習

Keras Framework（ケラスフレームワーク）

Keras Frameworkは、人工知能・機械学習分野における重要な概念・技術です。

上級

AI・機械学習

GELU (Gaussian Error Linear Unit・Hendrycks + Gimpel 2016年-2024年)（ゲルー）

2016年Hendrycks + Gimpel発表GELU paper・Industry-leading Gaussian Error Linear Unit paradigm + Industry-leading BERT + GPT-2 + GPT-3 dominant activation + Industry-leading 8年heritage Transformer Industry-standard。

上級

AI・機械学習

Causal Tracing（因果追跡）（コーザルトレーシング）

LLMが特定の事実（「エッフェル塔はパリにある」等）をどの層・どのトークン位置に格納しているかを因果介入実験で特定する手法。ROMEモデル編集の基盤技術。ROME論文（2022）で提唱。

上級

AI・機械学習

CosyVoice Alibaba (2024年)（コージーボイス）

2024年7月Alibaba FunAudioLLM発表CosyVoice・Industry-leading multilingual TTS + Industry-leading 5-language Chinese+English+Japanese+Korean+Cantonese + Industry-leading zero-shot voice cloning + Industry-leading Alibaba FunAudioLLM CosyVoice Apache 2.0 multilingual TTS 2024。

上級

AI・機械学習

Codestral Code Generation (Mistral 2024年)（コーデストラル）

2024年Mistral AI発表Codestral・Industry-leading Mistral code generation LLM + Industry-leading 22B / Mamba 7B + Industry-leading 80+ programming languages + Industry-leading 32K context + Industry-leading Non-Production License。

上級

AI・機械学習

Codestral Mamba Mistral (2024年)（コーデストラルマンバ）

2024年7月Mistral AI発表Codestral Mamba 7B・Industry-leading Mamba state-space code LLM + Industry-leading linear-time scaling + Industry-leading 256K context + Industry-leading Mistral AI Codestral Mamba 7B Apache 2.0 Mamba code LLM 2024。

上級

AI・機械学習

Codeium Windsurf (新ブランド)（コーデュムウィンドサーフ）

Codeium 2024年11月発売の VS Code 派生 AI エディタ Windsurf。Cascade 独自 LLM + Computer Use + $15/月・「Cursor の競合」.

上級

AI・機械学習

CodeAct（コードアクト）

LLMエージェントがPythonコードを実行手段として使い、ツール呼び出しの代わりにコードで環境と対話するエージェントフレームワーク。

上級

AI・機械学習

Code Editor 4強詳細比較（コードエディター4強）

AI Code Editor 4強詳細比較(2026年)。Claude Code(Anthropic公式 CLI・$20-200/mo・Claude Opus 4.7専用・MCP統合・Skills/Hooks/Subagents・Terminal-first・Computer Use・Mac/Win/Linux)・Cursor IDE(VS Code fork・$20-40/mo・Claude/GPT/Gemini選択・Composer agent・Tab autocomplete・@Docs/@Codebase context・MCP対応 2024年12月-)・Windsurf(Codeium・$15-60/mo・Cascade agent・Claude/GPT・MCP対応・$15 Pro tier最安)・Zed(OSS・Rust製・Mac/Linux/Windows・Claude/GPT/Gemini integration・MCP native・collaborative editing・10倍 fast performance)・選択: Terminal自由 = Claude Code・IDE標準 = Cursor・Mid budget = Windsurf・OSS performance = Zed・2026年 Claude Code市場リーダー、Cursor mass appeal Premium。

上級

AI・機械学習

Code LLM DeepSeek/Qwen/Codestral 2026（コードエルエルエム）

Code Generation特化LLM。DeepSeek Coder V3 671B/V2.5・Qwen2.5-Coder 32B/14B/7B・Qwen3-Coder予告・Codestral 25.01 (Mistral)・Codestral Mamba 7B・Llama 3.3 Code・StarCoder 2 15B BigCode・Codeium Cosmos 7B・Yi-Coder 9B・Granite Code Models 34B IBM・Qodo-Embed-1 1.5B (Code Embedding)・¥0 OSS-API・SWE-Bench Verified 50%+、2026年Open Code LLM 70B+主流。

2472件中 1061 - 1080件を表示（全124ページ）