2472件の用語
IBM社2024年公開156qubit量子プロセッサ。Heron r1(2023)→r2(2024)で誤り3-5倍低減、Quantum System Two搭載。2025年Quantum Starling 200 logical qubit目標。
2024年IBM公開Docling OSS。Pro 業界Pro Mainstream Enterprise Doc Parser OSS Top + Pro 米国Armonk IBM + Pro 1911-IBM設立 + Pro PDF→Markdown/HTML変換 + Pro Layout-aware抽出 + Pro Apache 2.0 OSS + Pro RAG/LLM前処理特化 + 累計1911-2026年114年Heritage継承代表機。
2024年Azar et al. + DeepMind発表IPO paper・Industry-leading Identity Preference Optimization paradigm + Industry-leading DPO refinement + Industry-emerging IPO DeepMind Pioneer + Industry-leading 2024年latest emerging alignment。
DPOのオーバーフィット問題を解決するため正則化項を追加した改良アライメント手法。DPOが大規模データで過学習しやすい問題をIPO損失関数で抑制し、分布外データへの汎化性能を向上させる。2023年Google DeepMindが発表。
DPOの過学習問題を解決するアライメント手法。ブラッドリー・テリーモデルへの依存を排除し、(margin)^2ベースの二乗損失でポリシーを最適化。Google DeepMindが2024年に提案。データ量が少ない場合に特に安定。
Azar ら DeepMind 2024年 LLM alignment 手法。DPO の過剰最適化問題を理論的に修正・Identity mapping で deterministic preference を扱える
IRISはEPFLが2022年に発表したVQ-VAEトークナイザとGPT系自己回帰Transformerを組み合わせた世界モデルで、Atari 100kで当時SOTAを達成。離散トークン空間でのゲーム環境シミュレーションを確立した。
LLMが生成した応答を最終的にユーザーへ返す前に検査し、有害コンテンツ・ハルシネーション・機密情報漏洩・フォーマット違反を検出・修正する出力側の防御機構。
dottxtチームが開発するPythonライブラリ。有限状態機械(FSM)ベースの文法制約デコーディングでLLMからJSON・正規表現・型安全なPydanticモデルを確実に生成する。
GoogleがCLIPを転用したゼロショット物体検出モデル。OWL-ViT(2022)→OWLv2(2023)と進化し、自己学習で3.4B画像を活用。COCO AP 44.6を達成。
中国Axera Semi社2023年公開Edge AI SoC。Cortex-A55 8コア + 72 TOPS NPU INT8 @ 8W、Hailo-8/Jetson Orin の競合台頭。
2024年Q2 Axelera AI (Netherlands Eindhoven・2021年Fabrizio Del Maffeo (元IBM Watson AI) 創業・Edge AI Server用途特化・累計funding $120M+) 発表のMetis AI・Edge AI Server向け214 TOPS INT8 (Hailo-10H 40 TOPS の 5倍以上) AI推論Chip・Digital In-Memory Computing (D-IMC) Architecture (独自Patent技術・SRAM内Computing) + LPDDR4x onboard memory + 7-10W TDP + M.2 + PCIe HHHL (Half-Height Half-Length card) Multi form factor + Vision AI / Generative AI / LLM対応・$400-$800・Edge AI Server / AI Workstation / Smart City Camera Infrastructure用途主軸。
OpenAccess AI Collectiveが開発するLLMファインチューニング統合フレームワーク。LoRA/QLoRA/DPO/ReLoRA等の多様な学習手法をYAML設定ファイル1つで使い分けられ、Hugging Face ecosystemと完全統合する。
深層学習の学習時に中間活性化値をすべてメモリに保持する代わりに、一部のレイヤーの出力のみを保存し、逆伝播時に必要な活性化値を再計算する手法。GPUメモリ使用量を大幅に削減し、より大きなモデルやバッチサイズでの学習を可能にする。
LLMの推論時に特定レイヤーの活性化ベクトルに方向ベクトルを加算する最もシンプルなActivation Steering手法。コントラストペアから得た差分ベクトルを加えるだけで、ファインチューニングなしにモデルの振る舞いを変更できる。
ニューラルネットワークの内部活性化ベクトル(activation)を直接操作・解析することでモデルの振る舞いを制御・理解する技術分野の総称。プロンプトエンジニアリングがテキスト入力を調整するのに対し、Activation Engineeringはモデル内部の表現空間に直接介入する。
LLMの推論時に特定の方向ベクトル(ステアリングベクトル)を活性化に加算・減算することで、ファインチューニングなしにモデルの出力傾向を制御する手法。コントラストペア(対照的なプロンプト対)から抽出した方向で「正直さ」「創造性」「言語」などを調整できる。
ニューラルネットワークの特定レイヤー・特定位置の活性化ベクトルを別の入力から得た活性化で置換(パッチ)することで、その活性化が出力に与える因果的影響を測定する解釈可能性の実験手法。
Shanghai AI Labが提案したLLMコンテキスト延長手法。コンテキストを固定ブロックに分割し、ビーコントークンで段階的にKVキャッシュを圧縮・凝縮することで、長文処理の効率化とメモリ削減を実現する。
HKU(香港大学)が2024年に発表した純粋視覚ベースの自律GUI操作エージェント。LLM依存のDOM解析を排除し、スクリーンショットのみで72Bビジョンモデルを使ってOSレベルの複雑タスクを実行する。