1978件の用語
単一のウェハーを巨大な一つのチップとして機能させる、AI学習特化型の次世代プロセッサ。従来のGPUクラスターが抱える通信ボトルネックを解消し、超大規模言語モデルの高速学習を実現する。
例示なしで「ステップごとに考えましょう(Let's think step by step)」等のトリガーフレーズを追記するだけでCoT推論を誘発する手法。Kojima et al.(2022)提唱で、タスク固有の例示なしに広汎に適用できる。
Zero Shot Learningは、人工知能・機械学習分野における重要な概念・技術です。
2018年Kudo + Google発表SentencePiece paper・Industry-leading Language-agnostic subword tokenizer + Industry-leading Llama + Mistral全系列 SentencePiece-based + Industry-leading 6年heritage multilingual Industry-standard。
2024年成熟SentencePiece・Industry-leading unsupervised text tokenizer + Industry-leading Unigram + BPE + word + char + Industry-leading T5 + LLaMA base + Industry-leading Google SentencePiece Apache 2.0 unsupervised text tokenizer 2024。
Googleが開発した言語非依存のサブワードトークナイザーライブラリ。BPEとUnigram Language Modelの両アルゴリズムを実装し、事前の単語分割(スペース依存)なしに生テキストから直接トークン化できる。T5・Gemma・LLaMA/Mistral等で採用。
LLMの社会的常識推論能力を評価するベンチマーク群。Social IQa・NormBankなどが代表。日常的な社会的状況での適切な行動・感情・意図を問う。
欧米法律文書に特化した70億パラメータのLLM。Mistral-7Bをベースに法律コーパスで継続事前学習し、法律QA・文書生成で高精度を実現する。
GoogleがAI技術を活用して提供する学習サポートアプリで、スマートフォンカメラで問題を撮影するだけで解法・解説・関連リソースを即時提示する。
LLMの社会的インテリジェンスを評価するためのシミュレーション環境。CMUが開発し、社会的シナリオでのLLM行動を多次元評価する。
2023年Stanford発表Sophia paper・Industry-leading Second-order Clipped Stochastic Optimization paradigm + Industry-leading Hessian-based second-order + Industry-leading GPT-2 reproduction 2× faster + Industry-emerging Stanford Pioneer。
2023年にHongkang LiらがPrincetonで提案したLLM向け二次オプティマイザー。Hessian対角の近似推定を用いて適応学習率を計算し、AdamWより2倍高いサンプル効率を実証した最適化アルゴリズム。
OpenAI 2024年2月発表・12月公開のテキスト→動画生成AI。1080p 60秒・物理シミュレーション・複雑なシーン理解、AI動画生成の象徴的モデル。
2024年2月15日OpenAI announce Sora。Pro 業界初Mainstream Text-to-Video AI Pro Famous + Pro 1分動画生成 + Pro 1080p Resolution + Pro Diffusion Transformer (DiT) + 2024-12-09 Pro Sora Turbo公開Pro Famous + Pro ChatGPT Plus $20/Pro $200対応 + Pro 12 Days of OpenAI Day 1 + 累計2024-2025年Heritage。
OpenAIが2024年2月に発表・12月に一般公開したテキスト/画像→動画生成モデル。DiTアーキテクチャで最大1080p・60秒・24fps動画を生成する。
Dartmouth Summer Research Project on Artificial Intelligence は1956年7-8月Dartmouth College で開催されたAI 研究史の出発点会議で John McCarthy (主催・1971年Turing Award) ・Marvin Minsky・Claude Shannon・Allen Newell 等10人が参加し「Artificial Intelligence」用語が誕生・8週間の議論で AI 学問分野が確立した歴史的会議。
2024年Turbopuffer Inc公開Turbopuffer。Pro 業界Pro Mainstream Serverless S3-backed Vector DB先駆 + Pro 米国SF Turbopuffer + Pro Simon Eskildsen Pro Founder + Pro 元Shopify + Pro Object Storage Native + Pro Pay-per-use + Pro 大容量低コスト + Pro $36M Series A + 累計2024-2026年2年Heritage継承代表機。
LMDeployに内蔵されたC++/CUDA製の高性能LLM推論バックエンド。Paged KV Cache・Continuous Batching・W4A16量子化カーネルをC++レイヤーで実装しPython APIから透過的に利用できる。NVIDIA A100/H100/L40S上でvLLM比最大80%高いスループットを実現したベンチマーク結果が報告されている。
Nari Labsが2025年4月に公開した16億パラメータのオープンソーステキスト読み上げモデル。[S1][S2]タグによるマルチスピーカー対話音声生成と(laughs)等の非言語表現タグが特徴。Gemini 1.5 Proからの知識蒸留で学習。
2023年提案のLLMマージ手法。「Trim(小さい値を刈り込む)→Elect(符号の多数決)→Disjoint Merge(非競合結合)」の3ステップで複数モデルの差分ベクトルを結合し、パラメータ干渉を最小化する。