2472件の用語
Shanghai AI Labが開発したDCNv3(変形可能畳み込みv3)を核とする大規模ビジョン基盤モデル。InternImage-H(10.89B)でCOCO AP 65.5を達成し、ViTベースを超えた。
2024年Shanghai AI Lab発売InternVL・Industry-leading Shanghai AI Lab Vision-Language Model + Industry-leading InternViT-6B encoder + Industry-leading Vicuna/Llama backbone + Industry-emerging InternVL Shanghai AI Lab Pioneer。
2024年Shanghai AI Lab発表InternLM-Math・Industry-leading bilingual math reasoning LLM + Industry-leading InternLM 7B/20B base + Industry-leading 8K context + Industry-leading Chinese+English math support。
2024年7月OpenGVLab発表InternVL2・Industry-leading 76B max VLM + Industry-leading dense+sparse vision encoder + Industry-leading 8B-76B model family + Industry-leading OpenGVLab InternVL2 MIT open-source VLM family 2024。
Shanghai AI Labが2024年発表の動画基盤モデル。マルチタスク学習フレームワークで動画認識・理解・検索を統合。InternVL視覚エンコーダとInternLMを組み合わせた6Bパラメータモデル。
上海AI研究所(Shanghai AI Lab)が開発したオープンソースマルチモーダルLLM。1Bから78Bまでの豊富なサイズ展開と、画像・動画の高精度理解を強みとし、2024年末のベンチマークでGPT-4o・Claude 3.5 Sonnetに匹敵する性能を示したオープンソース代表モデル。
Shanghai AI Lab 2024年7月発表 OSS マルチモーダル LLM。1B-108B 派生・GPT-4V 凌駕性能・MIT・中国系最強
Shanghai AI Laboratory開発のオープンソースビジョン言語モデルシリーズ。InternViT視覚エンコーダーとInternLM2テキストモデルを組み合わせ、2B〜78Bまでの複数サイズを提供する。
Shanghai AI Labが開発したオープンソースVLMシリーズ。1B〜78BまでApache 2.0で提供し商用VLMに匹敵する性能を達成。
LLM Agent や RAG システムが処理する外部データ(Web ページ・PDF・メール等)に悪意ある指示を埋め込み、モデルを乗っ取る攻撃手法。Greshake et al.(2023)が体系化。
Transformerの2層以上のモデルで自発的に出現する回路。[A][B]→[A]のパターンを学習し、文脈内学習(in-context learning)の基盤となる注意ヘッドのペア。Anthropic 2022年の発見。
Transformerモデルに共通して存在する注意ヘッドのパターンで、[A][B]...→[A]というコンテキストを認識して[B]を予測する機能を持つ。In-context Learningの根幹メカニズムとして特定されたMechanistic Interpretabilityの重要発見。
4bit整数量子化フォーマット。FP16比で4倍圧縮・2-3倍推論速度を実現し、LLM(Llama 3 70B・GPT-OSS 20B)のローカル実行で必須。NVIDIA TensorRT-LLMやGGUF Q4_K_M形式で広く利用。
Intelの第3世代AIアクセラレータ。5nmプロセス、HBM3e搭載、最大1.84PFLOPS のAI性能を実現し、大規模言語モデル(LLM)の学習・推論を高速化。
IntelがHabana Labsの技術を用いて開発した、AI学習・推論に特化した第3世代HPU。NVIDIA GPUに対するコスト効率の高い代替案として設計されており、大規模なAIインフラ構築を目的としている。
Intel(旧 Habana Labs)が開発した第3世代 AI 学習・推論アクセラレータ Gaudi 3。BF16 演算で 1,835 TFLOPS を達成し、NVIDIA H100 に対するコスト競争力のある代替として位置づけられる。
Intel製AI学習・推論アクセラレータ。HBMe2搭載・BF16 1835 TFLOPS・RoCE対応ネットワークで構成コスト削減を目指すH100対抗モデル。
8ビット整数演算を使用したAI推論処理。従来の32ビット浮動小数点演算と比較して、4倍高速で消費電力を大幅に削減しながら、実用的な精度を維持。
Inference Engineは、人工知能・機械学習分野における重要な概念・技術です。
本番LLM推論エンジン比較。vLLM 0.7+ (PagedAttention・Continuous Batching・FP8・Speculative Decoding)・SGLang 0.4 (RadixAttention・Constrained Decoding)・HuggingFace TGI 3.0・TensorRT-LLM 0.18 (NVIDIA最強・FP8/INT8)・MLC LLM・LMDeploy 0.7・Ray Serve・vLLM AscendとIntel・Mistral.rs (Rust)・¥0 OSS、2026年vLLM企業デファクト。