1978件の用語
Anthropic Claude API高度機能。Prompt Caching(2024年8月-・cached input 90%割引・最低1024 token・5min cache・1h cache extended)・cache_control field(ephemeral type)・System prompt/Tools/Messages cache・Extended Thinking(Claude 3.7+/Opus 4.7・thinking budget設定 1k-32k token・推論時間scaling)・Visible thinking trace・Interleaved thinking(2025年・tool use間考察)・Batch API(50%割引・24h処理)・Files API(100MB upload)・Citations・Computer Use・2026年 caching必須でcost管理、Extended Thinking推論力倍増。
入力シーケンス先頭に学習可能なソフトプロンプトトークンのみを追加してファインチューニングする最軽量 PEFT 手法。モデル重みは一切変更しない。
2023年Ian Webster (元Cognition AI Devin Pre-Training Lead・元Discord/Google AI) 発表のPromptfoo・OSS CLIベースのLLM Application Evaluation framework。Y Combinator W23採択 (一部・Independent Project)・GitHub Star 5k+ (2024年Q4)・MIT License・YAML設定でPrompt vs Modelの自動Eval実行 (Custom Assertion/LLM-as-Judge/Cosine Similarity/Factuality等) + CI/CD統合 (GitHub Actions/GitLab CI) + Web UI Viewer・Red Team Security testing (Jailbreak/Prompt Injection検出)・OpenAI/Anthropic/Google/Llama/Ollama/Bedrock/Vertex AI/HuggingFace対応の Local-first LLMOps tool。
AI Prompt実例集。Anthropic Prompt Library(50+役立ちテンプレ・docs.anthropic.com)・Anthropic Cookbook(GitHub)・OpenAI Cookbook・OpenAI Prompting Guide・Llama 3 Prompt Guide(Meta)・Chain-of-Thought Examples・Few-shot Templates・Meta-Prompter(prompt optimize)・LangChain Hub・PromptHero・Awesome ChatGPT Prompts・System Prompt collection・2026年Claude Skill/Cursor ruleとして統合進行。
Tencentが2024年12月にリリースした13Bパラメータのオープンソース動画生成モデル。3D Causal VAE+Dual-stream DiTで720p高品質動画をApache 2.0で提供する。
Chao et al.(2023、ETH Zurich)が提案したLLMを使って別のLLMをジェイルブレイクする手法。攻撃者LLM(Attacker)がターゲットLLMの応答を見てプロンプトを反復改良し、人手なしに有害出力を誘導するプロンプトを自動生成する。GCGと異なりgradient不要の黒箱攻撃。
2019年deepset公開Haystack。Pro 業界Pro Mainstream RAG Framework先駆 + Pro ドイツBerlin deepset + Pro Milos Rusic Pro Co-founder + Pro Python実装 + Pro Apache 2.0 + Pro Pipeline Architecture + Pro $30M Series B + 累計2018-2026年8年Heritage継承代表機。
2020年deepset発表Haystack・Industry-leading production-ready NLP+RAG framework + Industry-leading German enterprise + Industry-leading Pipeline architecture + Industry-leading Haystack production NLP+RAG framework 2020+。
2024年deepset発表Haystack 2.0・Industry-leading production-ready RAG pipelines + Industry-leading pipeline-first design + Industry-leading deepset Cloud SaaS + Industry-leading deepset Haystack Apache 2.0 production-ready RAG framework 2024。
2023年Nakajima発表BabyAGI・Industry-leading minimal LLM agent framework + Industry-leading task management loop simple + Industry-leading 19k+ GitHub stars + Industry-leading Python script <200 lines minimalist。
2024年成熟BabyAGI・Industry-leading task-driven autonomous agent + Industry-leading task creation+prioritization+execution loop + Industry-leading 19,000+ GitHub stars + Industry-leading Yohei Nakajima BabyAGI MIT task-driven autonomous agent 2024。
Yohei Nakajima 2023年4月発表自律 AI Agent。Task Queue + 自己創造で AutoGPT の代替・140 行 Python・GitHub 21k
vLLMが2023年に提案したLLM推論のためのKVキャッシュ管理手法。OSの仮想メモリ・ページングと同じ原理でKVキャッシュをブロック単位で管理し、メモリの断片化を排除してGPU VRAM利用率を最大化する技術。
LLMの自己回帰生成で蓄積されるKVキャッシュをOSのページング方式で管理する技術。非連続メモリブロックに分散配置することでVRAMの断片化を解消し、同時処理できるシーケンス数を最大化する。
Stanford Hazy Researchが2024年に発表した線形注意+Short Convolutionのハイブリッドアーキテクチャ。Taylor Soft-Maxによる近似とRecall-Throughputトレードオフ分析が特徴。
Stanford HAIが開発したTaylor展開ベースの線形アテンション近似モデル。短距離畳み込みと組み合わせてFlashAttentionに近い推論速度を実現するハイブリッドアーキテクチャ。
Vector Database SaaS。Pinecone Serverless (¥¥¥/M Vector)・Weaviate Cloud Service WCS・Zilliz Cloud (Milvus商用)・Qdrant Cloud (¥¥¥¥¥¥/月)・Marqo Cloud・Turbopuffer (Cloud Native S3+Object Storage)・LanceDB Cloud・MongoDB Atlas Vector Search・PostgreSQL+pgvector Cloud (Neon/Supabase/Aiven)・Cloudflare Vectorize・Upstash Vector・¥0 OSS Self-Host-¥¥¥¥¥/月、2026年Turbopuffer S3 Native急成長。
Vector Database。Qdrant($0 OSS・Rust・HNSW・Cloud $25/mo・1.10+ 2024年)・Weaviate(GraphQL API・Python/Go)・Milvus(LF AI・Distributed・Zilliz Cloud)・Pinecone(SaaS・$0 starter・$70/mo・Serverless)・Chroma(in-memory Python)・LanceDB(Rust・Embedded)・pgvector(Postgres extension)・Redis Vector・MongoDB Atlas Vector Search・SurrealDB Vector・MeiliSearch hybrid search・Elasticsearch+Dense Vector・2026年 Qdrant + pgvector主流、RAG essential infra。
Vector DBプラットフォーム比較。Qdrant 1.13+ (Rust・gRPC/HTTP)・Weaviate 1.28・Milvus 2.5 (Zilliz Cloud)・Chroma 0.5・LanceDB 0.18 (Rust+Apache Arrow)・pgvector 0.8 (Postgres Extension)・Pinecone Serverless・Vespa 8・Marqo・Turbopuffer (Cloud Native)・Qdrant Hybrid Search・¥0 OSS、2026年Hybrid+Reranking標準。
高次元の埋め込みベクトルを格納し、近似最近傍探索(ANN)を用いて高速な類似度検索を実現するデータベース。LLMを用いたRAGやセマンティック検索の基盤技術として、現代のAIアプリケーション開発において不可欠な役割を担う。