1978件の用語
2023年Hugging Face公開Text Generation Inference(TGI)。Pro 業界Pro Mainstream Production LLM Serving Top + Pro 米国/フランスHugging Face + Pro Rust実装 + Pro Apache 2.0 + Pro Hugging Face Hub統合 + Pro Continuous Batching + 累計2023-2026年3年Heritage継承代表機。
Hugging FaceがオープンソースLLMのプロダクション向け高速推論に特化して開発したサービングフレームワーク。continuous batching・Flash Attention・tensor parallelismを統合し、単一APIで多数モデルを効率的に提供する。
Figma→Code AI生成。Builder.io Visual Copilot・Anima (React/Next.js Export)・Locofy 1.x・Tempo (Visual+AI)・Figma Dev Mode 2.0・FigCharm (Cursor統合)・Tempo Stack・Visual Copilot (Builder.io)・OpenLLMetry・Quest AI・Animaapp・¥¥¥¥¥/月-¥¥¥¥¥¥/月・Tailwind+shadcn/ui Output・¥0 Free Tier、2026年Figma Sites+AI Code完全統合。
推論時に計算量を増やすことでLLMの出力精度を向上させる技法。学習コストを増やさずに「考える時間」を与えることでモデルの能力を引き上げる。
推論時(テスト時)に計算資源を追加投入してLLMの出力品質を向上させる手法の総称。学習時スケーリング則の補完として2024年末以降急速に注目が集まっている。
推論時に入力データを使ってモデルを一時的に更新する技術。訓練後の静的モデルでは対応できない分布外データへの適応を可能にし、長文脈・ドメイン外タスクで効果を発揮する。
2024年Cognition Labs発表Devin・Industry-leading autonomous software engineer AI + Industry-leading multi-step task + browser+terminal+editor + Industry-leading first autonomous SWE agent 2024年3月 viral。
Mistral AIとAll Hands AIが2025年5月に共同公開したソフトウェアエンジニアリングエージェント向けLLM。24Bパラメータで、SWE-Bench VerifiedスコアSWE 46.8%を記録し、GPT-4oやDeepSeek-Coder-V2を上回るエージェントコーディング性能を示した。
Mistral AI が 2025 年 12 月公開したエージェント特化型コーディング LLM。SWE-Bench Verified で高スコア、Aider/Cline/Continue 等の自律コーディングエージェント用途向けに最適化された 24B 級軽量オープンモデル。
DuolingoがGPT-4oを組み込んだプレミアム語学学習サービスで、Roleplay(ロールプレイ会話練習)とExplain My Answer(誤答解説)の2つのAI機能を提供する。
NeurIPS 2024採択のDelta Rule線形注意モデル。KV状態を完全上書き可能にしたことで、MQAR精度98.5%(Mambaの85.3%比)を達成。連想記憶タスクで線形SSMを大きく上回る。
デルタルール(差分更新)に基づく線形アテンション機構。ヘッブ学習との理論的関連を持ち、GLAやBasedと比較して競合する記憶能力をシンプルな数式で実現する。
2024年成熟Tensor Parallelism・Industry-leading Megatron-LM partition weights + Industry-leading column/row-wise sharding + Industry-leading multi-GPU LLM inference + Industry-leading NVIDIA Megatron-LM Tensor Parallelism distributed inference 2024。
2024年Tenstorrent (カナダToronto・2016年Ljubisa Bajic + Ivan Hamer + Milos Trajkovic創業・Jim Keller (元Apple A4-A6 + AMD Zen + Tesla Autopilot CTO) 2021年CEO就任・累計funding $1B+) 発表のGrayskull・RISC-V Computing chip (256 RISC-V cores per chip) + AI workload specialized design + Wormhole next-gen + Blackhole flagship + Tenstorrent Multi-product portfolio・$599-$1,499 (Multiple variants)・Nvidia H100 / AMD MI300X RISC-V alternative position + Jim Keller CEO industry veteran leadership + AI Computing + Server-class RISC-V hybrid。
2024年Tenstorrent公開のRISC-V AI Accelerator。Blackhole p150 PCIe Card+SiFive X280 RISC-V core+Tensix Architecture+TT-Metalium SDK+Wormhole後継。
NVIDIAが開発するGPU最適化LLM推論ライブラリ。Tensor Core活用・量子化(FP8/INT8/INT4)・In-flight Batching・Paged KV Cacheを組み合わせてNVIDIA GPU上での推論スループットを最大化する。
NVIDIAが開発したLLM推論特化のオープンソースライブラリ。FP8/INT4量子化・In-Flight Batching・FlashAttention統合・Tensor Parallelism等を組み合わせ、A100/H100 GPU上でHuggingFace Transformersより4〜8倍の推論スループットを実現する本番環境向け推論エンジン。
NVIDIAが開発するLLM特化の高性能推論ライブラリ。TensorRTの最適化エンジンにLLM固有のIn-Flight Batching・FP8/INT4量子化・テンソル並列化を統合し、NVIDIA GPU上で最高水準のスループットを実現する。
NVIDIAが提供する、大規模言語モデル(LLM)の推論性能を極限まで引き出すためのオープンソース・ライブラリ。量子化や高度なバッチング技術により、データセンター級の高速推論を実現する。
NVIDIA 2023年10月発表 LLM 推論最適化スタック。Tensor Core 専用最適化・FP8/INT4 量子化・MultiGPU/MultiNode 対応