2472件の用語
WizardLMが提案した、既存の指示データをLLMで段階的に複雑化・多様化する合成データ生成手法。簡単な指示を「深化」「拡張」の2方向に進化させ、高品質な難易度分布を持つ指示データセットを自動構築する。
2023年WizardLM team発表Evol-Instruct paper・Industry-leading Evolving instruction complexity paradigm + Industry-leading In-Depth + In-Breadth Evolving + Industry-leading WizardLM Pioneer。
Metaが2023年に発表した精密テキスト指示型画像編集フレームワーク。局所・グローバル編集の10タスクに特化したタスクベクトルを学習し、単一モデルで多様な編集操作を高精度に処理する。NeurIPS 2023で高評価を得た。
BAAI(北京人工知能研究院)が2024年9月に公開したユニファイドマルチモーダルモデル。テキスト生成・画像生成・画像理解を単一のトランスフォーマーデコーダーで処理するNext-Token-Predictionアーキテクチャ採用。
2019年Microsoft Research公開MS MARCO Cross-Encoder。Pro 業界Pro Mainstream Cross-Encoder Reranker先駆 + Pro Microsoft Bing データセット + Pro BERT基盤 + Pro 110M Parameters + Pro MIT License + Pro Hugging Face公開 + 累計2018-2026年8年Heritage継承代表機。
2024年3月Mixedbread.ai (ドイツ・ベルリン拠点・2023年Sean Lee + Aamir Shakir創業・OSS Retrieval/Reranking特化startup) 発表のmxbai-embed-large-v1・bert-large-uncased base + Contrastive Learning + 1,024次元 + 512 max sequence + Matryoshka Representation Learning (64-1024次元可変) + Binary Quantization対応 + Apache 2.0 License・MTEB English 64.68・OSS + Compact + Cost-efficient設計のOpenAI text-embedding-3-small対抗model。
2020年UC Berkeley公開MMLU(Massive Multitask Language Understanding)。Pro 業界Pro Mainstream AI 知識評価Bench先駆 + Pro Dan Hendrycks Pro主要研究員 + Pro 57科目15,908問 + Pro Multiple Choice 4択 + Pro MIT License + Pro 業界Pro 標準LLM評価 + 累計2020-2026年6年Heritage継承代表機。
LLMの多分野知識を測定する大規模多肢選択式ベンチマーク。MMLU は57科目14,042問、MMLU-Pro は推論重視の改良版で14科目約12,000問から構成される。
大規模言語モデルの多分野知識・推論能力を評価するベンチマーク。TIGER-Labが2024年に公開し、12,032問・14科目・10択問題で原版MMLUより大幅に難化。
オリジナルMMLUを大幅に強化した大規模言語モデル評価ベンチマーク。選択肢数を4→10に拡大し、大学院レベルの難問を追加。推論能力の真の差を検出するために設計され、Chain-of-Thought推論で精度が大きく変動する点が特徴。TIGER-Labが2024年に公開。
2024年TIGER-Lab Yubo Wang et al.発表MMLU-Pro・Industry-leading enhanced MMLU benchmark + Industry-leading 12K tasks + 14 domains + Industry-leading 10-option multiple choice + Industry-leading MMLU-Pro reasoning standard。
Google が開発したマルチレベル中間表現コンパイラ基盤。LLVM プロジェクトの一部として、機械学習モデルの最適化からハードウェア固有コード生成まで、複数の抽象化レベルを統一的に扱うインフラストラクチャを提供する。
ML Experiment Tracking。MLflow 2.18 (FOSS+Databricks Cloud)・Weights & Biases W&B (Pro/Enterprise)・Comet ML・Neptune.ai・ClearML 1.16・DVC Studio・Aim (Open Source・Python)・Sacred+Omniboard (Maintenance)・TensorBoard (TensorFlow Native)・Weave (W&B LLM)・LangSmith (LangChain LLM)・Phoenix (Arize)・¥0 OSS-¥¥¥¥¥/月、2026年MLflow 2.18+Databricks統合主流。
Apple ML Framework(2023年12月OSS)。Apple Silicon Unified Memory最適化・Lazy evaluation(JAX-like)・Multi-device(M2 Ultra+M3 cluster)・PyTorch互換API・MLX-LM library(Llama 3.3/Qwen 2.5/Mistral対応)・Whisper MLX・Stable Diffusion MLX・MLX Examples GitHub・mlx-community(Hugging Face Q4/Q8 quantized model)・LM Studio 0.3 MLX engine内蔵(2024年Q4)・Mac M4 Max 128GB で 70B Q4/Q8 実行可・速度 PyTorch CUDA比 60-80% on Mac・2026年 Mac Studio M4 Ultra Llama 3.3 70B運用定着。
Apple Silicon AI推論フレームワーク。MLX(Apple 2023年・Unified Memory最適化・NumPy-like API・LLM/画像生成)・mlx-lm(Llama/Qwen/Phi-4)・mlx-swift(iOS/macOS)・CoreML(Xcode統合・Conversion ONNX)・CreateML(Transfer Learning)・Metal Performance Shaders(MPS)・ANE Neural Engine 38 TOPS・PyTorch Metal backend・Ollama Metal・M4 Max 128GB で70B Q4実行可能、2026年Apple AI推論定着。
2024年Apple ML Research公開MLX-LM。Pro 業界Pro Mainstream Apple Silicon LLM Inference Top + Pro 米国Cupertino Apple + Pro Awni Hannun Pro主要研究員 + Pro Metal Performance Shaders + Pro MIT License + Pro Unified Memory最適化 + 累計2023-2026年3年Heritage継承代表機。
ニューラルネットワークの計算グラフを解析し、ハードウェア固有の命令列へ変換・最適化することで推論や学習の実行速度を大幅に向上させる技術群の総称。
2023年Carnegie Mellon University (CMU) 発表のMLC-LLM (Machine Learning Compilation for Large Language Models)・Tianqi Chen教授 (XGBoost/MXNet/Apache TVM作者) 主導のOSS Cross-Hardware LLM Compiler framework。Apache 2.0 License・GitHub Star 22k+ (2024年Q4)・Python/C++/TVM Unity実装・iOS/Android/macOS/Linux/Windows/WebGPU/CUDA/Metal/Vulkan/ROCm 全hardware対応・Native code compilation方式 (Python依存無)・WebLLM (Browser内Llama実行) + iOS App + Android App公式提供。
Machine Learning Compilation for LLMの略。Apache TVM/MLCコンパイラスタックを用いてLLMをCUDA/Metal/Vulkan/WebGPU向けに最適化コンパイルし、スマートフォンから高性能GPUまで幅広いデバイスでLLMを実行するフレームワーク。
ML Commons業界標準AIベンチマーク。MLPerf Training v5.0(2025)・Inference v5.0(Llama 3.1 405B・Mixtral 8x22B)・Tiny v1.2・Storage v2.0・HPC v4.0、NVIDIA B200 NVL72・AMD Instinct MI325X・Intel Gaudi 3・Google TPU v5p・AWS Trainium 2が2026年競合、Llama 2 70B以降主要モデル。