1978件の用語
PLAUDが2024年に発売したカード型AI録音デバイス。磁気でiPhone/Androidに貼り付け、ChatGPT連携でリアルタイム文字起こし・要約・タスク抽出を行う。
2024年Q3 Plaud Inc. (中国深圳・2023年Allen Wong創業・Plaud Note 第1弾product 2023年・$179 voice recording iPhone aux device + AI summary subscription) 発表のPlaud NotePin・$169 standard hardware + $20/月 Pro subscription (Plaud Note successor + Pin形state改良 + 衣服クリップ装着・Magnetic Clip + Wristband + Pendant strap 3 wear modes) + Voice memo recording (30 hours battery + GPT-4o based AI transcription + Summary + Topic extraction + Action items) + Multi-language support 100+ languages + ChatGPT integration + Notion/Obsidian export・Voice memo-focused professionals user base + Plaud Note ecosystem expansion。
Black Forest Labs (元Stable Diffusion 開発チーム) 2024年8月公開のText-to-Image AI。Flow Matching + Rectified Flow・写実度業界最高水準で SD3 を凌駕。
2024年8月Black Forest Labs発表Flux.1 [pro]・Industry-leading 12B DiT + Industry-leading state-of-art text-to-image + Industry-leading Robin Rombach ex-SD founders + Industry-leading Black Forest Labs Flux.1 [pro] commercial image generation 2024。
Black Forest Labs画像生成モデル(2024年8月)。FLUX.1 Pro(API専用)・Dev(12B・非商用OSS)・Schnell(Apache 2.0)・FLUX.1.1 Pro Ultra(4MP出力)・FLUX Kontext(2025年・コンテキスト編集)が代表、Stable Diffusion後継として2026年画像生成AIトップティア、ComfyUI/Forge/diffusers統合。
Black Forest Labs開発の高品質テキスト→画像生成モデル。Schnell(高速)・Dev(バランス)・Pro(最高品質)の3バリアントを持ち、MMDiTアーキテクチャで12Bパラメータを搭載する。
Black Forest Labs 2024年10月発売の画像生成 AI 第1.1世代 Pro。Stable Diffusion 後継 + 6倍高速・$0.04/画像 + Replicate + Hugging Face.
TransformerのAttention計算におけるメモリ帯域(I/O)のボトルネックを解消し、高速化と省メモリ化を実現したアルゴリズム。HBMとSRAM間のデータ転送を最適化する。
2024年7月Princeton + Together AI + Meta + NVIDIA発表FlashAttention 3・Industry-leading H100 75% utilization + Industry-leading 1.5-2x faster vs FA-2 + Industry-leading FP8 support + Industry-leading FlashAttention 3 H100-optimized attention 2024。
Transformerのアテンション計算をGPUのSRAMを活用して高速化するアルゴリズムの第3世代。H100/H800 GPU向けに最適化されたIO-Aware実装。
NVIDIA Hopper(H100/H200)アーキテクチャの非同期計算・FP8精度・WGMMA命令を活用したアテンション計算最適化。FlashAttention-2比で最大2倍の高速化を達成する。
Tri Dao氏らが開発したTransformerのAttention計算を高速化するアルゴリズム。GPUのSRAMを活用してメモリアクセスを最小化し、標準Attentionより2〜4倍の高速化とメモリ削減を実現する。LLM推論・学習の事実上の標準最適化技術。
Tri Dao Princeton/Together AI 2023年 IO-Aware Attention 高速実装。FlashAttention v1 から 2倍高速化・GPU HBM 帯域最適化
2024年Q1 University of Washington + CMU + Tri Dao (Princeton)共同発表FlashInfer paper・Industry-leading LLM inference attention kernel library・Industry-leading PagedAttention + GQA + MLA + Sliding Window + Custom attention pattern Industry-leading flexible attention kernel optimization・Industry-leading vLLM + SGLang + TGI integration・Industry-leading PyTorch + JAX backend Industry-leading LLM inference attention library Industry-leading position。
長文脈LLMの推論デコード段階を高速化するアテンション計算最適化手法。FlashAttentionをデコード(逐次生成)に適応させ、KVキャッシュへのアクセスをシーケンス長方向に並列化することでメモリ帯域幅律速の問題を解消する。
LLMの強化学習から人間フィードバック(RLHF)で使用される比較ベースの報酬モデル。2つの出力の優劣比較データから絶対スコアを学習するペアワイズ手法。
FLAP(Fluctuation-based Adaptive Structured Pruning)は2024年にAn et al.が発表したLLM向け構造化プルーニング手法。特徴量の変動(fluctuation)を重要度指標とし、Attention headとFFNの中間ニューロンを再学習なしで構造的に削除する。LLaMA-2 7Bで20〜30%削除しながらperplexityの上昇をSparseGPT並みの1〜2ptに抑えられる。
Python製のオープンソースフェデレーテッド学習フレームワーク。LLMのLoRAアダプタ集約からスマートフォン分散学習まで対応し、2025年時点で最も広く使われるフェデレーテッドLLM実装基盤。
Googleが公開した大規模命令チューニング用データセット集。62のNLPデータセット・473タスク・1836テンプレートを統合し、Flan-T5およびFlan-PaLMの訓練に使用。Chain-of-Thought推論データを標準収録する点が特徴。
Salesforce Research が 2023 年に発表したマルチモーダルモデル。凍結した視覚エンコーダと大規模言語モデルを Q-Former(Querying Transformer)で接続し、画像テキスト埋め込みと視覚的質問応答を実現する。