2472件の用語
LLMが外部APIや関数を構造化された形式で呼び出す機能。モデルが自然言語の入力から適切な関数名と引数を推論し、JSON形式で出力することで外部システムとの連携を実現する。
Function Calling(Tool Use)とは、LLMが外部関数やAPIを呼び出すための構造化されたリクエストを生成する機能で、OpenAI Functions・Claude Tool Use・Gemini Function Callingなど各社が実装し、LLMエージェント開発の基盤技術となっている。
Feature Engineeringは、人工知能(AI)および機械学習分野において極めて重要な概念であり、技術です。モデルの精度とパフォーマンスを向上させるために不可欠な要素として認識されており、その重要性は日々高まっています。本稿では、Feature Engineeringの定義から種類、選び方、そしてトラブルシューティングまで、初心者から上級者まで理解できるよう詳細に解説します。
LLMの残差ストリームに特定の概念を表す方向ベクトル(特徴ベクトル)を加算/減算することで、モデルの出力を意図的に操作する手法。Anthropic SAE研究の実用応用。
LLMの推論時に特定の特徴ベクトルを活性化ベクトルに加算・減算することでモデルの出力を制御する手法。Mechanistic Interpretabilityで同定した特徴を操作することで、ファインチューニングなしにモデルの行動を変更できる。
ML Feature Store。Tecton.ai (Enterprise)・Feast 0.42 (FOSS+Tecton)・Hopsworks 4 (Logical Clocks・FOSS+Cloud)・Featureform・Vertex AI Feature Store (GCP)・SageMaker Feature Store (AWS)・Databricks Feature Store・Snowflake Feature Store・Iguazio Feature Store・¥0 OSS-¥¥¥¥¥¥/月・Online Serving・Offline Training Pipeline・Time Travel・Point-in-Time Correctness、2026年Feast+Hopsworks FOSS主流化。
Vision Language Model(2024-2026年)。GPT-4V/4o/o1(OpenAI・vision)・Claude Sonnet 4.6/Opus 4.7 vision・Gemini 2.5 Pro multimodal・LLaVA 1.6/Next(OSS・Llama base・$0)・CogVLM2 19B(Tsinghua)・MiniCPM-V 2.6(8B mobile)・InternVL 2.5(OpenGVLab・78B)・Qwen2-VL/Qwen2.5-VL(Alibaba・72B)・Pixtral 12B(Mistral・2024年9月)・Florence-2(Microsoft・vision encoder)・Llama 3.2 Vision 11B/90B・Molmo(Allen AI・OSS open weights+data)・2026年 OCR/Image Q&A実用化、ローカル動作可能。
2024年12月公開Fish Audio S1。Pro Open Source TTS Top + Pro 中国Mainstream Voice AI + Pro 4B Parameters + Pro Multilingual対応 + Pro Voice Cloning + Pro CC BY-NC-SA License + Pro Hugging Face公開 + 累計2023-2025年2年Heritage Pro Open Source Voice AI業界Top独占。
Fish Audioが開発したオープンソースのゼロショット音声クローニングTTSモデル。10秒以下の参照音声から高品質な音声複製を行い、多言語に対応。
コードLLMのプリトレーニング目的の一種。テキストの先頭(Prefix)と末尾(Suffix)を与え、中間部分(Middle)を生成する能力を学習する手法。SPMフォーマットが主流。
金融マルチタスク指示チューニングLLM。LLaMAをベースにMFTInstruct(136,000件の金融指示データ)でSFT学習し、多様な金融NLPタスクに単一モデルで対応する。
オープンソースの金融特化LLM。LLaMAやMistralをベースに金融テキストでファインチューニングし、誰でも再現・カスタマイズ可能な金融AI基盤を提供する。
金融テキスト解析に特化したBERTモデル。Financial PhraseBank等の金融コーパスで事前学習を継続し、感情分析・NER・質疑応答で高精度を実現する。
Federated Learningは、人工知能・機械学習分野における重要な概念・技術であり、分散型学習の枠組みを提供する革新的なアプローチです。この技術は、データを中央集権的に収集せずに、エッジデバイスやクライアント端末上でローカルに保持されたデータを活用してモデルを学習する仕組みを実現します。特にプライバシー保護やデータの非効率な転送を回避するという利点から、IoT機器、スマートフォン、医療機
Federated Learning Framework。TensorFlow Federated TFF・PySyft (OpenMined・PyTorch)・Flower 1.13 (FOSS Multi-Framework)・FedML 0.8 (Backbone+Cross-Device+Cross-Silo)・FATE Federated AI Technology Enabler (WeBank・中国)・OpenFL (Intel)・PaddleFL (Baidu)・NVIDIA FLARE 2.5・Substra (Owkin)・FedScale・¥0 OSS、2026年Flower+FedML普及拡大。
クラス不均衡問題に対処するために Cross-Entropy Loss を改良した損失関数。簡単なサンプル(高確信度の正解予測)の損失重みを下げ、難しいサンプル(低確信度の予測)に学習を集中させる。物体検出の RetinaNet で提案され、LLM のトークンレベル学習やクラス不均衡なテキスト分類でも効果を発揮する。
2020年Photoroom設立(2019-Beta公開)。Pro 業界Pro Mainstream Mobile Background Removal Top + Pro Matthieu Rouif Pro CEO主導 + Pro 元GoPro/Apple + Pro iOS/Android対応 + Pro 累計世界月間1億+ Download + Pro $43M Series A + Pro $500M Valuation + 2024-Pro AI Image Generator + 累計2019-2025年6年Heritage。
LLMに2〜5個の入出力例(ショット)を提示し、期待するタスクのパターンを学習させるプロンプティング手法。例示なしの Zero-shot より高精度で、大量の学習データを必要とするファインチューニングより手軽。分類・変換・抽出タスクで特に効果を発揮する。
LLMに少数(2〜10個程度)の入出力例をプロンプト内で提示し、タスクのパターンを文脈内学習(In-Context Learning)させるプロンプト技法。Zero-shotより精度が高く、Fine-tuningより手軽。
Few-shot プロンプティングとは、大規模言語モデルへのプロンプトに少数(2〜5個程度)の入出力例を含めることで、モデルに期待するタスクのパターンを学習させ、新しい入力に対して同様の形式・品質で出力させるプロンプト技法である。In-context Learning(文脈内学習)の代表的手法として広く活用されている。