1978件の用語
ELYZAが公開した日本語LLM評価ベンチマーク。要約・翻訳・創作・コード生成など実用的な指示追従100問を人手評価し、日本語モデルの実力をGPT-4と比較する。
2024年成熟ElevenLabs Multilingual v3・Industry-leading 29 languages voice cloning + Industry-leading expressive TTS + Industry-leading voice library + Industry-leading $5-$330/month ElevenLabs Multilingual v3 expressive TTS 2024。
2022年1月設立ElevenLabs(2023-01 Beta公開)。Pro 業界Pro Mainstream Voice AI/TTS Top + Pro Voice Cloning Pro Famous + Pro 30+言語対応 + Pro Pro Voice Quality + Pro $5-$330/月 Subscription + Pro a16z/Sequoia投資 + 2024-Pro Voice Library + 2024-08 Pro Reader App + 累計2022-2025年3年Heritage。
Inkle Studiosが開発したインタラクティブフィクション記述言語「Ink」と、それを活用したLLMベースの分岐型ナラティブ生成システム。ゲーム・インタラクティブストーリー制作に特化。
データ分析で得る洞察。Google Analytics 4 Insights・Amplitude Insights・Mixpanel Insights・HubSpot・Tableau・ChatGPT Data Analyst・Claude Analysis toolで抽出、CVR改善/離脱率低減など意思決定根拠として活用。
2024年Chen et al. (Tencent+Tsinghua)発表INSIDE・Industry-leading internal state hallucination detection LLM + Industry-leading EigenScore + Industry-leading white-box LLM + Industry-leading hidden states analysis。
自然言語の指示(instruction)に従って応答できるようLLMをファインチューニングする手法。指示-応答ペアのデータセットで学習し、汎用的な指示追従能力を獲得させる。
PydanticモデルをLLMの出力スキーマとして使用し、型安全な構造化レスポンスを取得するPythonライブラリ。OpenAI・Anthropic・Gemini等の主要APIに対応。
テキスト指示で既存画像を編集するDiffusionモデル。「馬をシマウマにして」などの自然言語命令に従い、画像の内容を変更しながら構図や照明を保持する2023年の先駆的画像編集手法。UCバークレー発。
2024年5月UK AI Safety Institute (UK AISI・英国政府機関) 発表のInspect AI・OSS LLM Capability/Safety Evaluation framework。Python実装・MIT License・GitHub Star 2k+ (2024年Q4)・国家AI Safety評価機関による公的Eval framework標準化試み・OpenAI/Anthropic/Google DeepMind/Meta等の Frontier LLM Modelの Capability evaluation (Math/Coding/Cybersecurity/CBRN/Persuasion) 実装・Multi-turn / Tool use / Agentic evaluation対応・US AISI / Japan AISI / Singapore IDA等の各国AI Safety機関でも採用検討中の国際標準志向Framework。
Shanghai AI Labが開発したDCNv3(変形可能畳み込みv3)を核とする大規模ビジョン基盤モデル。InternImage-H(10.89B)でCOCO AP 65.5を達成し、ViTベースを超えた。
2024年Shanghai AI Lab発売InternVL・Industry-leading Shanghai AI Lab Vision-Language Model + Industry-leading InternViT-6B encoder + Industry-leading Vicuna/Llama backbone + Industry-emerging InternVL Shanghai AI Lab Pioneer。
2024年Shanghai AI Lab発表InternLM-Math・Industry-leading bilingual math reasoning LLM + Industry-leading InternLM 7B/20B base + Industry-leading 8K context + Industry-leading Chinese+English math support。
2024年7月OpenGVLab発表InternVL2・Industry-leading 76B max VLM + Industry-leading dense+sparse vision encoder + Industry-leading 8B-76B model family + Industry-leading OpenGVLab InternVL2 MIT open-source VLM family 2024。
Shanghai AI Labが2024年発表の動画基盤モデル。マルチタスク学習フレームワークで動画認識・理解・検索を統合。InternVL視覚エンコーダとInternLMを組み合わせた6Bパラメータモデル。
上海AI研究所(Shanghai AI Lab)が開発したオープンソースマルチモーダルLLM。1Bから78Bまでの豊富なサイズ展開と、画像・動画の高精度理解を強みとし、2024年末のベンチマークでGPT-4o・Claude 3.5 Sonnetに匹敵する性能を示したオープンソース代表モデル。
Shanghai AI Lab 2024年7月発表 OSS マルチモーダル LLM。1B-108B 派生・GPT-4V 凌駕性能・MIT・中国系最強
Shanghai AI Laboratory開発のオープンソースビジョン言語モデルシリーズ。InternViT視覚エンコーダーとInternLM2テキストモデルを組み合わせ、2B〜78Bまでの複数サイズを提供する。
Shanghai AI Labが開発したオープンソースVLMシリーズ。1B〜78BまでApache 2.0で提供し商用VLMに匹敵する性能を達成。
LLM Agent や RAG システムが処理する外部データ(Web ページ・PDF・メール等)に悪意ある指示を埋め込み、モデルを乗っ取る攻撃手法。Greshake et al.(2023)が体系化。