概要
LlamaIndex は 元 Uber 機械学習エンジニア Jerry Liu (米国) が2022年11月発表した LLM RAG 特化フレームワーク。Python + JavaScript/TypeScript 対応・MIT ライセンス + 完全無料・100+ データソース対応 (PDF + Notion + Slack + GitHub + Salesforce + 各種) + Vector DB (Chroma + Pinecone + Qdrant + Weaviate + LanceDB) 統合・「データ重視 RAG 業界主流フレームワーク 35K+ stars」。LlamaIndex は2022-2026年データ重視 RAG (Retrieval-Augmented Generation) 業界主流フレームワークで、「データ取り込み (Data Ingestion) + インデックス (Indexing) + Vector DB 統合 + クエリ (Querying) + RAG パイプライン」でLangChain (汎用 LLM フレームワーク) と差別化。LlamaIndex の革新点: ① データ取り込み + インデックス特化 で100+ データソース (PDF + Notion + Slack + GitHub + Salesforce + Web Scraping + 各種) ② Vector DB 統合 (Chroma + Pinecone + Qdrant + Weaviate + LanceDB + Milvus + 主要全 Vector DB) ③ RAG パイプライン抽象化 で**「データ取り込み → 埋め込み → Vector DB 投入 → クエリ → LLM 回答生成」を統一 API** ④ LlamaCloud (マネージド RAG) でProduction RAG サービス + チーム連携 + 監査 ⑤ LlamaParse でPDF (複雑な表 + 画像 + 数式) を高精度解析 + Adobe Acrobat レベルのPDF 解析品質。主要利用パターン: ① 企業内ナレッジベース RAG (Confluence + Notion + SharePoint + Slack 等を LLM で検索可能化) ② PDF + Word + 各種ドキュメント解析 ③ 法務 + 医療 + 金融業界の文書検索 ④ チャットボット + AI アシスタント (RAG ベース)。
主な特徴・仕組み
- 発表: Jerry Liu (米国・元 Uber)・2022年11月
- ライセンス: MIT (完全無料 + 商用 OK)
- 対応言語: Python (主流) + JavaScript/TypeScript
- 対応 LLM: OpenAI + Anthropic + Google Gemini + Meta Llama + Hugging Face + 主要全 LLM ベンダ
- データソース: 100+ (PDF + Notion + Slack + GitHub + Salesforce + Confluence + SharePoint + Web Scraping + 各種)
- Vector DB 統合: Chroma + Pinecone + Qdrant + Weaviate + LanceDB + Milvus + Redis + 主要全 Vector DB
- GitHub: 35K+ stars (Python)・データ重視 RAG 業界主流
- 資金調達: 2024年 Series A $19M ($300M+ 評価額)
- LlamaCloud (マネージド): $0-$500/月 (Free + Pro + Enterprise)
- LlamaParse (PDF パーサ): $0-$0.003/page・Adobe Acrobat レベル品質
- 競合: LangChain (汎用 LLM・300K+ stars) + Haystack (deepset・17K+ stars) + Cohere RAG
スペック比較表
| RAG フレームワーク | 提供 | スター数 | 特徴 |
|---|
| LlamaIndex | LlamaIndex Inc. |