1978件の用語
MetaとCMUが2023年に発表したSFT研究。1,000件の高品質サンプルのみで強力な指示追従能力を獲得でき、アライメントには「データ量より品質」が本質であることを示した論文。
Limitless社(旧Rewind AI)が2024年に発売したAIペンダント型ウェアラブル。$99で会議・会話を記録しパーソナルAIの記憶として活用する。Mac/iOS連携が特徴。
2018年4月17日Kaleido公開Remove.bg。Pro 業界Pro Mainstream Web Background Removal出発点 + Pro Benjamin Groessing Pro CEO主導 + Pro オーストリアGraz + Pro 5億+ Monthly API Calls + Pro Free 50/月 + Pro $0.20-$0.99 per Image + 2024-Pro Smart Cutout強化 + 累計2018-2025年7年Heritage。
Reranking Model。Cohere Rerank 3.5 (¥¥/1M tok)・Jina Reranker v2-multilingual (Open OSS)・BAAI bge-reranker-v2-m3・mxbai-rerank-large-v2 1.5B・Voyage rerank-2.5・ColBERT v2 Late Interaction (Stanford)・PylateX2・LongRAG Re-ranker・Reciprocal Rank Fusion RRF (Hybrid)・MTEB Rerank Benchmark・MS MARCO・¥0 OSS-API、2026年ColBERT v2+RRF主流化。
検索結果再ランキングモデル。Cohere Rerank 3.5・BAAI/bge-reranker-v2-m3・Jina Reranker v2 Multilingual・Mixedbread mxbai-rerank-large-v2・Voyage rerank-2・Qwen3-Reranker-8B・RankGPT・ColBERT v2・ELEVATER・CrossEncoder(sentence-transformers)・2026年RAG精度向上に必須、HNSW top-100→top-10 rerank定番。
LLMを使って自然言語前提をFOL(一階論理)形式に変換し、Neurosymbolic推論エンジンで結論を導くフレームワーク。LINC = Logical Inference via Neurosymbolic Computation。
複数GPUをリング状に接続し、Key-Valueをブロック単位で隣接GPUに伝達しながら注意計算を分散する手法。100万トークン超の長文脈LLM学習を可能にする2023年UC Berkeleyの提案。
長いシーケンスをリング状の分散構成で複数デバイスに分割処理し、通常Transformerのコンテキスト長上限をデバイス数に比例して拡張するアテンション機構。Gemini 1.5の100万トークン対応の基盤技術。
2024年成熟Ring Attention・Industry-leading block-wise attention parallelism + Industry-leading 10M+ tokens long context + Industry-leading near-infinite context theoretical + Industry-leading UC Berkeley Liu+Zaharia Ring Attention long-context attention 2024。
2023年UC Berkeley + Google Research共同発表Ring Attention paper・Industry-leading distributed long-context attention paradigm + Industry-leading Ring-based communication パターン + Industry-leading near-infinite context length scaling + Industry-leading Liu et al. UC Berkeley + Hao Liu PhD work + Industry-leading distributed attention parallelism paradigm Pioneer。
複数GPUでシーケンスを分割しリング状の通信パターンでAttentionを計算する分散手法。理論上コンテキスト長を無制限にスケールでき、100万トークン超の処理を実現するコア技術の一つ。
長文脈処理を複数デバイスに分散するアテンション手法。デバイスをリング状に接続し、KVブロックを順次転送しながら各デバイスがブロックローカルなアテンション計算を行うことで、単一デバイスに収まらない超長文脈(100万トークン以上)を処理する。
LLMが不確実な情報を表現する際に使う言語的なHedge(逃げ道表現)の総称。「おそらく」「〜と思われる」等の表現を不確実性伝達に活用する研究領域。
UC Berkeley/LMSysが開発したLLMルーティングフレームワーク。クエリの複雑さを自動判定し、高性能・高コストなモデルと安価・軽量なモデルを動的に使い分けることでコストを50〜70%削減しながらGPT-4レベルの品質を維持する。
2024年6月UC Berkeley LMSYS発表RouteLLM・Industry-leading LLM router strong-weak + Industry-leading 85% cost reduction + Industry-leading preference-based routing + Industry-leading UC Berkeley LMSYS RouteLLM Apache 2.0 LLM routing framework 2024。
2024年Luma AI公開Genie 1.0。Pro 業界Pro Mainstream Text-to-3D Generation先駆 + Pro 米国Palo Alto Luma AI + Pro 1次元LiDAR NeRF基盤 + Pro 10秒3D生成 + Pro Dream Machine兄弟 + 累計2021-2026年5年Heritage継承代表機。
LLM推論高速化手法。n-gramプールを活用してドラフトトークン列を訓練不要で生成・検証する投機的デコーディング変形手法。ドラフトモデルなしに1.5〜2.5倍の高速化を実現。
Jacobi反復法を応用したLLM並列デコード手法。n-gramプールをキャッシュとして利用し、追加モデルなしで将来のトークン列を並列生成・検証することで推論を高速化する。速度向上は1.5〜2倍程度。
2024年Fu et al. (UCSD+Tsinghua)発表Lookahead Decoding・Industry-leading parallel n-gram speculative decoding LLM + Industry-leading lookahead branches + Industry-leading Jacobi decoding + Industry-leading 1.5-2× inference speedup no draft model。
2023年Q4 LMSys (UC Berkeley + UCSD + CMU + Stanford + MBZUAI共同・Industry-leading Open-source AI research community) 発表Lookahead Decoding paper・Industry-emerging Speculative-free decoding paradigm + Jacobi iteration parallel decoding paradigm Pioneer + Industry-emerging Industry-leading parallel decoding paradigm・Industry-leading LMSys Open-source AI research community foundation + Industry-leading vLLM integration。