2472件の用語
Jupyter Notebookは、人工知能・機械学習分野における重要な概念・技術です。
AppleとNVIDIAが2024年に共同開発したGUI操作特化マルチモーダルエージェント。スクリーンショットのみでUI要素を認識・操作し、ScreenSpotベンチマークで75%以上の精度を達成。
2017年Ramachandran et al. + Google発表SiLU/Swish paper・Industry-leading Sigmoid Linear Unit + Swish paradigm + Industry-leading Llama + Mistral + Qwen modern LLM dominant + Industry-leading 7年heritage modern LLM activation。
Claude Extended Thinking予算戦略。budget_tokens設定: 1024(quick・simple math)・4096(default・standard reasoning)・16384(complex math・science PhD)・32768(extreme・research grade)・Pricing: thinking tokens output同価($75/Mtok Opus・$15 Sonnet)・1 query 8k thinking ≈ $0.60・100 query/day = $60/月・Cost管理: Claude Sonnet 4.6 thinking推奨(Opus比 -80% cost)・Caching併用 -90%・Use case判断: Math/Science yes・Coding subtle改善・Q&A unnecessary多・Extended Thinking on/off toggle per request・2026年 reasoning model時代必修、AI cost engineering重要。
2024年Google DeepMind発表SynthID-Text・Industry-leading tournament sampling watermark + Industry-leading production-grade LLM watermark + Industry-leading Gemini foundation method + Industry-leading Nature 2024 publication。
SpaceXの教育プログラムから生まれた子ども向けAI学習プラットフォームで、ゲーム型問題解決とLLMを組み合わせた適応学習で数学・論理思考力を育む。
LLMにドキュメントやコーパスを入力として与え、質問-回答ペアを自動生成するデータ拡張手法。RAGシステムの評価・訓練データ作成、ドメイン特化QAモデルの構築に不可欠な技術で、人手アノテーションの1/100以下のコストで大規模QAデータセットを構築できる。
Synthetic Data手法。Self-Instruct (Stanford)・Evol-Instruct (WizardLM)・Self-Reward (Meta)・RLAIF Constitutional AI・LLM Distillation (Teacher→Student)・Phi Series Microsoft (Synthetic Pretraining)・Llama 3.3+Synthetic・Tülu 3 SFT+DPO・OpenWebMath・FineMath・Cosmopedia (HuggingFace 25B token)・Genstruct 7B・MAGPIE (Self-Synthesize)・WildChat・¥0 OSS、2026年Synthetic主流Pretraining。
2024年10月OpenAI発表SimpleQA・Industry-leading factuality benchmark + Industry-leading 4326 short-form QA + Industry-leading o1-preview 47% accuracy + Industry-leading OpenAI SimpleQA factuality evaluation benchmark 2024。
SimPO(Simple Preference Optimization)は、リファレンスモデルを不要にしつつ、応答の平均対数確率を報酬として使用することでDPOの長さバイアスを解消した手法で、2024年にVirginia大学が提案した
2024年5月Princeton NLP発表SimPO・Industry-leading simple preference optimization + Industry-leading length-normalized reward + Industry-leading reference-free + Industry-leading Princeton NLP Meng+Xia+Chen SimPO MIT simple length-normalized preference optimization method 2024。
長さ正規化とターゲットマージンを導入したDPO改善手法。参照モデル不要・応答長による性能バイアスを解消・シンプルな実装が特徴。Princeton大学が2024年に提案。AlpacaEval2・MT-BenchでDPO/KTO/IPO/ORPOを上回る性能を報告。
Meng ら Princeton 2024年 LLM alignment 手法。reference model 完全不要・length-normalized reward で計算コスト最小・性能最高
2024年OpenAI発表SWE-bench Verified・Industry-leading SWE-bench human-verified subset + Industry-leading 500 GitHub issue tasks + Industry-leading real-world coding benchmark + Industry-leading agent benchmark standard 2024。
Google Brainが2021年に発表したMixture-of-Experts(MoE)アーキテクチャの大規模言語モデル。各トークンを1つのエキスパートにのみルーティングする「Switch Routing」により、計算コストを増やさずにモデルパラメータを最大1.6兆(1.6T)まで拡張した。現代MoEモデルの原型。
SwiGLU は Swish 関数と GLU(Gated Linear Unit)を組み合わせた活性化関数であり、2020年に Noam Shazeer が提案し、LLaMA・Mistral・Qwen・DeepSeek 等の 2024-2026年主要 LLM で事実上のデファクトスタンダードとして採用されている。
2020年Shazeer + Google発表SwiGLU paper・Industry-leading Swish-gated GLU paradigm + Industry-leading Llama + Mistral + Qwen + PaLM dominant + Industry-leading 4年heritage modern LLM gated activation。
2021年Google発表Switch Transformer paper・Industry-leading Switch Transformer single-expert-per-token MoE + Industry-leading Fedus Zoph Shazeer Google + Industry-leading 1.6T parameters scaling。
2024年10月OpenAI発表Swarm・Industry-leading lightweight handoff agents + Industry-leading simple agent coordination + Industry-leading minimal abstractions + Industry-leading OpenAI Swarm MIT experimental lightweight handoff agents framework 2024。
Swarm Robotics Processor(SRP)は、群知能アルゴリズムを hardware レベルで実装した専用プロセッサです。数百〜数千のロボットやドローンの協調動作をリアルタイムで制御し、創発的な集団行動を実現します。