1978件の用語
MiniMaxが大規模実用化した線形アテンション機構。Softmaxを使わず計算順序を組み替えることで計算量を系列長に対して線形O(n)に抑え、超長文脈を低コストで処理する。MiniMax-01で本格採用された。
訓練・推論の両フェーズで線形計算量を維持するフル線形アテンション実装。TransNormerLLMで採用されTriton/CUDAカーネル最適化で実用的な速度を実現。
HKU 2024年 GraphRAG 軽量改良版。グラフ + ベクトルハイブリッド・インデックス構築コスト GraphRAG の 10%・性能同等
Codeforces・LeetCode・AtCoder等から継続的に新問題を収集するLLMコード生成評価ベンチマーク。時系列分割によりデータ汚染を防ぎ、モデルの真の汎化性能を測定する。
2024年Naman Jain et al. (UC Berkeley)発表LiveCodeBench・Industry-leading live coding contamination-free benchmark + Industry-leading LeetCode+CodeForces+AtCoder + Industry-leading rolling update + Industry-leading contamination-free coding benchmark standard。
問題セットを月次更新してデータ汚染を防ぐ LLM ベンチマーク。MATH・コーディング・推論を含む 18 タスクで構成され、2024 年に公開された汚染フリー評価として注目される。
LLMの汚染(contamination)問題を回避するため毎月新問題を追加するLLM評価ベンチマーク。数学・コーディング・推論・言語など18カテゴリで2024年公開。
データ汚染を防ぐため毎月新問題を追加するLLM評価ベンチマーク。数学・コーディング・推論など6カテゴリを継続的に評価する。
2024年6月Abacus.AI + NYU発表LiveBench・Industry-leading contamination-free monthly-refreshed + Industry-leading 6 categories reasoning/math/coding/data analysis/instruction/language + Industry-leading LiveBench AI dynamic benchmark 2024。
LLM/RAG評価フレームワーク。RAGAS(Retrieval-Augmented Generation Assessment・Faithfulness/Answer Relevance/Context Precision)・LLM-as-Judge(Claude/GPT-5 judge・Bias対策注意)・Ragas metrics・DeepEval(Python・14+ metric)・Promptfoo(CLI・YAML test)・Giskard・TruLens・PhoenixArize・LangSmith Evaluator・Braintrust Eval・Confident AI・2026年RAG品質測定標準。
Retrieval-Augmented Generation の略で、LLM の出力生成時に外部知識ベースから関連情報を検索し、コンテキストとして与える手法。ハルシネーション削減と最新情報対応の主要技術。
Retrieval-Augmented Generation。Vector Search+LLM生成統合。Naive RAG・Advanced(Pre/Post retrieval)・Modular RAG・Agentic RAG・GraphRAG(Microsoft)・HyDE・Contextual Retrieval(Anthropic)・RAG Fusion・Self-RAG・Corrective RAG・LlamaIndex・LangChain・Haystack・RAGFlow・DSPy・R2R対応、2026年LLM応用定番。
RAGシステムが生成した回答の各文が、検索された参照文書によって支持されているかを測定する評価指標。RAGAsフレームワークの中核指標の一つ。
ユーザークエリを複数のサブクエリに変換し並列検索した後、RRF(Reciprocal Rank Fusion)で結果を統合するRAG手法。単一クエリの検索盲点を補完し、より網羅的な文書召喚を実現する。
RAG (Retrieval-Augmented Generation)主要Framework。LangChain 0.3+/LangGraph 0.2 (Stateful Agent)・LlamaIndex 0.12+ (Workflows・Property Graph)・Haystack 2.x by deepset・DSPy by Stanford (Auto Prompt Optimize)・PydanticAI 0.2・LiteLLM 1.55・Phidata/Agno・LangFlow GUI・Flowise・¥0 OSS、2026年Agentic RAG+GraphRAG主流化。
RAG用ベクトルデータベース。Qdrant 1.12(Rust・オンプレ無料)・Pinecone(SaaS・$70/month起)・Weaviate 1.27(Go・ハイブリッド)・Milvus 2.5・Chroma DB 0.6・pgvector 0.8(PostgreSQL拡張)・Redis Stack・Typesense Cloud・Turbopuffer(Elasticsearch類似)・LanceDB(Rust・Serverless)・Cloudflare Vectorize・SurrealDB対応、2026年オンプレQdrant+Postgres pgvector定着。
RAG検索結果並び替え。Cohere Rerank 3.5(100言語・5x高速)・Voyage rerank-2.5・Jina Reranker v2・BGE reranker v2-m3・Qwen3-Reranker-4B・ColBERT v2・Cohere Rerank 3.5 Lite・LLM Rerank(LlamaIndex)・MMR(Maximum Marginal Relevance)・Cross-Encoder vs Bi-Encoder・Hybrid(BM25+Dense) + Rerank 3段構成、2026年RAG品質改善必須。
2023年Haotian Liu et al. (UW-Madison+MS Research)発表LLaVA・Industry-leading open-source vision-language model + Industry-leading visual instruction tuning + Industry-leading CLIP + LLaMA + Industry-leading first open VLM foundation。
ByteDanceが2024年発表のLLaVA系動画理解モデル。AIRキュレーションデータセットとフレーム圧縮技術で長時間動画を効率的に処理。Video-MMEで最高水準を達成。
2024年4月Lovable公開(旧GPT Engineer)。Pro 欧州Mainstream Full-Stack AI Coding Top + Pro Sweden発祥 + Pro Anton Osika Pro CEO主導 + Pro Supabase統合 + Pro $20-$200 Subscription + Pro $17M Series A + Pro $200M ARR Pro Famous + 2024-11 Pro Lovable 2.0 + 2025-Pro Mobile + 累計2024-2025年Heritage。