2472件の用語
BRIGHTは、単なる情報検索能力(Retrieval)だけでなく、取得したコンテキストを基に高度な推論や複雑な思考プロセスを要求するRAGシステムを評価するためのベンチマークです。
2024年Q4 Browser-Use (オーストリアGregor Zunic + Magnus Müller共同創業・GitHub 30k+ stars Industry-leading Open-source Browser Agent library) 発表Browser-Use・Industry-leading Python Open-source Browser Agent library・LLM-powered web browsing automation + Playwright/Selenium integration + Industry-leading Open-source Browser Agent Pioneer + Industry-emerging Browser Agent Industry-leading framework + Claude + GPT + Gemini + 多LLM integration agnostic + Industry-leading Open-source Browser Agent ecosystem alignment。
PLAUDが2024年に発売したカード型AI録音デバイス。磁気でiPhone/Androidに貼り付け、ChatGPT連携でリアルタイム文字起こし・要約・タスク抽出を行う。
2024年Q3 Plaud Inc. (中国深圳・2023年Allen Wong創業・Plaud Note 第1弾product 2023年・$179 voice recording iPhone aux device + AI summary subscription) 発表のPlaud NotePin・$169 standard hardware + $20/月 Pro subscription (Plaud Note successor + Pin形state改良 + 衣服クリップ装着・Magnetic Clip + Wristband + Pendant strap 3 wear modes) + Voice memo recording (30 hours battery + GPT-4o based AI transcription + Summary + Topic extraction + Action items) + Multi-language support 100+ languages + ChatGPT integration + Notion/Obsidian export・Voice memo-focused professionals user base + Plaud Note ecosystem expansion。
Black Forest Labs (元Stable Diffusion 開発チーム) 2024年8月公開のText-to-Image AI。Flow Matching + Rectified Flow・写実度業界最高水準で SD3 を凌駕。
2024年8月Black Forest Labs発表Flux.1 [pro]・Industry-leading 12B DiT + Industry-leading state-of-art text-to-image + Industry-leading Robin Rombach ex-SD founders + Industry-leading Black Forest Labs Flux.1 [pro] commercial image generation 2024。
Black Forest Labs開発の高品質テキスト→画像生成モデル。Schnell(高速)・Dev(バランス)・Pro(最高品質)の3バリアントを持ち、MMDiTアーキテクチャで12Bパラメータを搭載する。
Black Forest Labs画像生成モデル(2024年8月)。FLUX.1 Pro(API専用)・Dev(12B・非商用OSS)・Schnell(Apache 2.0)・FLUX.1.1 Pro Ultra(4MP出力)・FLUX Kontext(2025年・コンテキスト編集)が代表、Stable Diffusion後継として2026年画像生成AIトップティア、ComfyUI/Forge/diffusers統合。
Black Forest Labs 2024年10月発売の画像生成 AI 第1.1世代 Pro。Stable Diffusion 後継 + 6倍高速・$0.04/画像 + Replicate + Hugging Face.
TransformerのAttention計算におけるメモリ帯域(I/O)のボトルネックを解消し、高速化と省メモリ化を実現したアルゴリズム。HBMとSRAM間のデータ転送を最適化する。
Stanford大学のTri Daoらが提案したAttention計算のIO最適化アルゴリズム。GPUのHBM(高帯域メモリ)とSRAM(オンチップメモリ)間のデータ転送を最小化するタイリング手法により、標準的なAttentionと数学的に等価な結果をメモリ使用量O(n)・最大3倍の高速化で実現する。
FlashAttentionとは、GPUのメモリ階層(SRAM/HBM)を意識したIO-Awareなアテンション計算アルゴリズムであり、標準的なアテンション実装と数学的に同一の結果を返しながら、実行速度を2〜4倍高速化しメモリ使用量をO(n^2)からO(n)に削減する。Tri Dao(Stanford/Together AI)が2022年に提案し、FlashAttention-2(2023年)、FlashAttention-3(2024年、H100/Hopper最適化)と進化を続けている。
Transformerのセルフアテンション計算をIO効率化するアルゴリズム。HBMとSRAM間のデータ転送を最小化するタイリング技法により、標準アテンションと数学的に等価な結果を2〜4倍高速に算出する。
2024年7月Princeton + Together AI + Meta + NVIDIA発表FlashAttention 3・Industry-leading H100 75% utilization + Industry-leading 1.5-2x faster vs FA-2 + Industry-leading FP8 support + Industry-leading FlashAttention 3 H100-optimized attention 2024。
Transformerのアテンション計算をGPUのSRAMを活用して高速化するアルゴリズムの第3世代。H100/H800 GPU向けに最適化されたIO-Aware実装。
NVIDIA Hopper(H100/H200)アーキテクチャの非同期計算・FP8精度・WGMMA命令を活用したアテンション計算最適化。FlashAttention-2比で最大2倍の高速化を達成する。
Tri Dao氏らが開発したTransformerのAttention計算を高速化するアルゴリズム。GPUのSRAMを活用してメモリアクセスを最小化し、標準Attentionより2〜4倍の高速化とメモリ削減を実現する。LLM推論・学習の事実上の標準最適化技術。
Tri Dao Princeton/Together AI 2023年 IO-Aware Attention 高速実装。FlashAttention v1 から 2倍高速化・GPU HBM 帯域最適化
2024年Q1 University of Washington + CMU + Tri Dao (Princeton)共同発表FlashInfer paper・Industry-leading LLM inference attention kernel library・Industry-leading PagedAttention + GQA + MLA + Sliding Window + Custom attention pattern Industry-leading flexible attention kernel optimization・Industry-leading vLLM + SGLang + TGI integration・Industry-leading PyTorch + JAX backend Industry-leading LLM inference attention library Industry-leading position。
FlashAttentionの技術をデコード(推論)フェーズに特化して最適化した手法。長いコンテキストでの自己回帰生成において、Attentionの並列度を高めてGPU利用率を改善する。