2472件の用語
AI システムが人間による修正・停止・目標変更を受け入れる性質。自律的な AI が自己保存や目標達成のために人間の介入に抵抗しないことを保証する、AI 安全性研究における重要な設計原則。
AIシステムが人間による修正・停止・目標変更を受け入れ、それに抵抗しない性質。AI安全性の基本要件の一つであり、高度な自律AIが自己保存や目標固執を優先して人間の介入を拒否するリスクへの対策として研究されている。
2023年Patil et al. (UC Berkeley)発表Gorilla・Industry-leading 1600+ API calls LLM + Industry-leading retrieval-augmented API calling + Industry-leading LLaMA 7B fine-tuned + Industry-leading APIBench benchmark。
UC Berkeleyが開発した、APIドキュメントを正確に参照して外部ツールを呼び出す能力に特化したLLM。
2021年Stanford公開ColBERT v2。Pro 業界Pro Mainstream Late Interaction Reranker先駆 + Pro Stanford NLP主導 + Pro Omar Khattab主要研究員 + Pro Multi-Vector Architecture + Pro 110M Parameters + Pro Token-level Embedding + Pro MIT License + 累計2020-2026年6年Heritage継承代表機。
テキスト、画像、音声など複数の異なる形式のデータ(マルチモーダル)を統合的に理解し、検索する技術。単なるキーワードマッチングを超え、内容や文脈に基づいた高度な情報探索を実現します。
2020年Khattab+Zaharia (Stanford)発表ColBERT・Industry-leading late interaction retrieval LLM RAG + Industry-leading token-level multi-vector + Industry-leading MaxSim scoring + Industry-leading 100× faster cross-encoder。
検索結果の品質をLLMが事後評価し、低品質な文書を除外・修正してから回答を生成するRAG改良手法。2024年にYan et al.が提案し、検索結果の信頼性を自動で担保する。
2022年Anthropic (Bai et al.)発表Constitutional AI・Industry-leading constitutional alignment LLM + Industry-leading RLAIF + Industry-leading harmless+helpful constitution + Industry-leading Claude foundation。
Anthropicが開発したAIアライメント手法。人間フィードバックなしでAI自身が「憲法」原則に基づき自己批判・改善するCAIプロセスで、HHH(Helpful/Harmless/Honest)を実現する。
Anthropicが2022年に提案したAIアライメント手法。人間によるフィードバックの代わりにAIが原則(Constitution)に基づいて自己批評・自己修正を行い、安全で有益なAIを訓練する。
AnthropicがLLMのアライメント(価値観整合)のために開発した手法。AI自身が憲法(Constitution)と呼ばれる原則リストに基づいて自己批判・修正を行うことで、有害な出力を減らす。
Anthropic が提唱した AI の自己改善型アラインメント手法。人間のフィードバックの代わりに、事前に定義した「憲法(Constitution)」と呼ばれる原則セットに基づいて AI 自身が出力を批評・修正するプロセスを繰り返し、安全性と有用性を両立させる。
Anthropicが提唱したAIアラインメント手法。人間が定めた原則(憲法)に基づきAI自身が出力を自己評価・修正することで、人間のフィードバック依存度を下げつつ安全性を高める。
Anthropic が提唱した AI アライメント手法で、人間のフィードバックの代わりに「憲法(Constitution)」と呼ばれる原則セットを用いて AI の出力を自己改善させる技術
Constitutional AI(CAI)はAnthropicが2022年に提案した手法で、人間が定義した原則(Constitution)に基づきAI自身がフィードバックを生成するRLAIF(RL from AI Feedback)アプローチである。自己批判→自己修正ループにより、人間アノテーターへの依存を大幅に削減しつつ有害性を低減する。
Anthropic が開発した Constitutional AI(CAI)の中核手法で、LLM が憲法的原則(Constitution)に基づいて自身の出力を批判・修正するセルフプレイループにより、有害な応答を自律的に排除する安全性向上アプローチ。
LLM推論サーバーにおいて、リクエスト単位ではなくイテレーション(1トークン生成ステップ)単位でバッチを動的に再構成する手法。完了したリクエストを即座に除外し、新規リクエストを即座に挿入することでGPU利用率を最大化する。
LLM推論において、リクエストの到着・完了に応じてバッチを動的に構成し直す手法で、GPU稼働率を最大化しスループットを2〜5倍向上させるサービング最適化技術
LLM推論サービングにおける動的スケジューリング手法。完了シーケンスを即時排除して新リクエストを継続的に挿入することでGPU利用率を最大化する。Orca(OSDI 2022)が提案したIteration-Level Schedulingを起源とする。