2472件の用語
GraphRAGの軽量・高速版として2024年に提案されたRAG手法。文書からキーワードと関係を抽出してグラフを構築するが、GraphRAGのコミュニティ検出・階層要約を省略し、構築コストを1/10に抑えつつマルチホップ検索と高速なインクリメンタル更新を実現する。
HKU 2024年 GraphRAG 軽量改良版。グラフ + ベクトルハイブリッド・インデックス構築コスト GraphRAG の 10%・性能同等
Codeforces・LeetCode・AtCoder等から継続的に新問題を収集するLLMコード生成評価ベンチマーク。時系列分割によりデータ汚染を防ぎ、モデルの真の汎化性能を測定する。
2024年Naman Jain et al. (UC Berkeley)発表LiveCodeBench・Industry-leading live coding contamination-free benchmark + Industry-leading LeetCode+CodeForces+AtCoder + Industry-leading rolling update + Industry-leading contamination-free coding benchmark standard。
LLMの汚染(contamination)問題を回避するため毎月新問題を追加するLLM評価ベンチマーク。数学・コーディング・推論・言語など18カテゴリで2024年公開。
汚染フリーを設計原則とするLLMベンチマーク。毎月新しい問題を自動生成・差し替えすることで、学習データへのリーク(データ汚染)を構造的に排除。数学・コーディング・推論・データ分析・言語理解・指示追従の6カテゴリで客観的に自動スコアリングする。
問題セットを月次更新してデータ汚染を防ぐ LLM ベンチマーク。MATH・コーディング・推論を含む 18 タスクで構成され、2024 年に公開された汚染フリー評価として注目される。
毎月新しい問題を追加し、データ汚染(data contamination)を防ぐ LLM 自動評価ベンチマーク。客観的・検証可能な正解基準を持ち、LLM 審判への依存を排除した設計が特徴。
月次で問題を更新する動的LLMベンチマーク。データ汚染(contamination)を構造的に回避し、math・reasoning・coding・language・data analysis・instruction followingの6カテゴリでLLMを客観評価する。LLM judge を使用せず自動採点のみで評価する。
データ汚染を防ぐため毎月新問題を追加するLLM評価ベンチマーク。数学・コーディング・推論など6カテゴリを継続的に評価する。
2024年6月Abacus.AI + NYU発表LiveBench・Industry-leading contamination-free monthly-refreshed + Industry-leading 6 categories reasoning/math/coding/data analysis/instruction/language + Industry-leading LiveBench AI dynamic benchmark 2024。
Google出身チームが開発したオープンソースのデータキュレーションツール。LLM学習データの可視化・検索・クリーニング・フィルタリングをWeb UIで対話的に実行でき、高品質なファインチューニングデータセット構築を支援する。
LLM/RAG評価フレームワーク。RAGAS(Retrieval-Augmented Generation Assessment・Faithfulness/Answer Relevance/Context Precision)・LLM-as-Judge(Claude/GPT-5 judge・Bias対策注意)・Ragas metrics・DeepEval(Python・14+ metric)・Promptfoo(CLI・YAML test)・Giskard・TruLens・PhoenixArize・LangSmith Evaluator・Braintrust Eval・Confident AI・2026年RAG品質測定標準。
Retrieval-Augmented Generation の略で、LLM の出力生成時に外部知識ベースから関連情報を検索し、コンテキストとして与える手法。ハルシネーション削減と最新情報対応の主要技術。
Retrieval-Augmented Generation。Vector Search+LLM生成統合。Naive RAG・Advanced(Pre/Post retrieval)・Modular RAG・Agentic RAG・GraphRAG(Microsoft)・HyDE・Contextual Retrieval(Anthropic)・RAG Fusion・Self-RAG・Corrective RAG・LlamaIndex・LangChain・Haystack・RAGFlow・DSPy・R2R対応、2026年LLM応用定番。
RAGシステムが生成した回答の各文が、検索された参照文書によって支持されているかを測定する評価指標。RAGAsフレームワークの中核指標の一つ。
ユーザークエリを複数のサブクエリに変換し並列検索した後、RRF(Reciprocal Rank Fusion)で結果を統合するRAG手法。単一クエリの検索盲点を補完し、より網羅的な文書召喚を実現する。
RAG (Retrieval-Augmented Generation)主要Framework。LangChain 0.3+/LangGraph 0.2 (Stateful Agent)・LlamaIndex 0.12+ (Workflows・Property Graph)・Haystack 2.x by deepset・DSPy by Stanford (Auto Prompt Optimize)・PydanticAI 0.2・LiteLLM 1.55・Phidata/Agno・LangFlow GUI・Flowise・¥0 OSS、2026年Agentic RAG+GraphRAG主流化。
RAG用ベクトルデータベース。Qdrant 1.12(Rust・オンプレ無料)・Pinecone(SaaS・$70/month起)・Weaviate 1.27(Go・ハイブリッド)・Milvus 2.5・Chroma DB 0.6・pgvector 0.8(PostgreSQL拡張)・Redis Stack・Typesense Cloud・Turbopuffer(Elasticsearch類似)・LanceDB(Rust・Serverless)・Cloudflare Vectorize・SurrealDB対応、2026年オンプレQdrant+Postgres pgvector定着。
RAG検索結果並び替え。Cohere Rerank 3.5(100言語・5x高速)・Voyage rerank-2.5・Jina Reranker v2・BGE reranker v2-m3・Qwen3-Reranker-4B・ColBERT v2・Cohere Rerank 3.5 Lite・LLM Rerank(LlamaIndex)・MMR(Maximum Marginal Relevance)・Cross-Encoder vs Bi-Encoder・Hybrid(BM25+Dense) + Rerank 3段構成、2026年RAG品質改善必須。