2472件の用語
Attention計算時にクエリとキーの距離に比例した線形バイアスを減算することで、位置情報を注入する手法。訓練時より長いシーケンスへの外挿能力に優れ、BLOOM-176BやMPT-7B/30Bで採用された。
LLMのファインチューニングやRLHFに必要な人間のフィードバックデータを効率的に収集・管理するオープンソースアノテーションプラットフォーム。HuggingFaceエコシステムと深く統合し、高品質な教師データの作成を支援する。
2023年Rohan Taori et al. (Stanford)発表Alpaca・Industry-leading Stanford Alpaca 52K dataset + Industry-leading Self-Instruct method使用 + Industry-leading LLaMA 7B fine-tune + Industry-leading open instruction tuning democratization。
GPT-4を活用してAlpacaの52,000件SFTデータを自動スコアリングし、高品質9,000件に絞ることでベースラインを上回ることを示した2023年のデータ選定手法。
Stanford Alpacaが2023年に公開したLLMファインチューニング用データ形式。instruction・input・outputの3フィールドでタスク指示データを構造化する。
StanfordのAlpacaプロジェクトが普及させたLLM命令応答フォーマット。`### Instruction:`/`### Input:`/`### Response:` の3セクションで指示・入力・応答を構造化し、instruction tuningの標準テンプレートとなった。
金融向けRAGフレームワーク。リアルタイム市場データ・研究レポート・財務書類を統合的に検索しLLMに提供することで、投資分析・ポートフォリオ管理に特化した高精度な回答生成を実現する。
DeepMindが2024年に発表した第3世代タンパク質構造予測モデル。タンパク質だけでなくDNA・RNA・低分子化合物との複合体構造も予測可能。
Ensemble Learningは、人工知能・機械学習分野における重要な概念・技術です。
Unsupervised Learningは、人工知能・機械学習分野における重要な概念・技術です。
2023年Unstructured Technologies公開Unstructured.io 1.0。Pro 業界Pro Mainstream RAG前処理OSS先駆 + Pro 米国SF Unstructured + Pro 2022-Unstructured設立 + Pro Apache 2.0 OSS + Pro 商用Pro Tier + Pro 50+言語対応 + Pro Multi-format(35+) + 累計2022-2026年4年Heritage継承代表機。
LLMのLoRA/QLoRAファインチューニングを2〜5倍高速化するライブラリ。TritonとCUDAカーネルを手書き最適化し、同じGPUでAxolotl/HuggingFaceより少ないVRAMで速く学習できる。Llama・Mistral・Gemma・Qwen・Phi等に対応。
QLoRAファインチューニングをカスタムCUDAカーネルで最適化したオープンソースライブラリ。HuggingFace PEFT比で学習速度2〜5倍高速化・メモリ使用量60〜70%削減を実現し、無料Google Colabでも70Bモデルのファインチューニングを可能にする。
Claude API cost削減機能(2024年8月)。Prompt Caching(入力cache・90% cost reduction・TTL 5min)・Cache write cost 1.25x・Cache read 0.1x・cache_control ephemeral・max 4 cache block・Context Caching(Gemini同等・24h TTL・1M tok min)・OpenAI Prompt Caching(2024年10月・50%割引・自動)・Claude Message Batches API(50% off・24h)・Haiku/Sonnet/Opus全対応・2026年繰返しプロンプト必須。
2021年Dario Amodei + Daniela Amodei共同創業Anthropic。米国California州San Francisco + 元OpenAI VP Research + Pro AI Safety Lab代表 + Pro Constitutional AI + Pro Claude 1 2023-03/Claude 2 2023-07/Claude 3 2024-03/Claude 3.5 2024-06/Claude 3.7 2025-02 + Pro Amazon $8B投資 + Pro Google $2B投資。
Claude API供給経路。Anthropic API(api.anthropic.com・Direct・Pricing $15/$75 Opus・Latency最小・Region US/EU)・AWS Bedrock(IAM authentication・PrivateLink VPC・SOC 2/HIPAA・Multi-region・Pricing same)・Google Vertex AI(GCP integration・Same pricing)・Azure ChatGPT(GPT-4o)別経路・Choose: Anthropic Direct = simple/Bedrock = Enterprise AWS infra/Vertex = GCP・SDK同一(anthropic-sdk-python・anthropic-bedrock・anthropic-vertex)・Region availability差(Vertex US-Central1・Bedrock 多region)・Bedrock Knowledge Base/Vertex AI Search組合せ可・2026年 Enterprise Bedrock主流。
AnthropicのClaude 3.7 Sonnet以降で利用可能な拡張推論機能。APIパラメータ`thinking`を有効化することで、モデルが回答前に最大数万トークンの内部思考プロセスを実行し、複雑な問題への精度を向上させる。
Anthropic 2024年10月発表 Claude reasoning 機能。Claude 3.5 Sonnet 派生・interleaved thinking・MATH-500 96.4%
2024年Anthropic公開Model Context Protocol。Pro 業界Pro Mainstream LLM Tool Connection標準業界先駆 + Pro 米国SF Anthropic + Pro 2021-Anthropic設立 + Pro Open Standard + Pro JSON-RPC Protocol + Pro Apache 2.0 OSS + Pro Claude/Cursor/Cline等対応 + 累計2021-2026年5年Heritage継承代表機。
Anthropic公式リソース。Quickstart(GitHub・anthropics/anthropic-quickstart・Computer Use Demo Docker・5min start)・Cookbook(GitHub・anthropic-cookbook・Multi-modal/Tool Use/RAG examples)・Anthropic Console($0 Free trial $5 credit)・Claude Code GitHub(anthropics/claude-code)・Anthropic SDK Python/TypeScript・Bedrock/Vertex AI integration・Claude Apps mobile/desktop・Claude API documentation・Workbench(Prompt testing)・Computer Use Demo(VMware/Docker desktop env)・MCP Quickstart(modelcontextprotocol/quickstart)・2026年 Anthropic公式 docs拡充、開発者onboarding充実。