E5-Mistral（E5-Mistral-7B-Instruct）とは、MicrosoftがMistral 7Bをベースに開発したLLMベースの埋め込みモデルである。デコーダアーキテクチャの大規模言語モデルを埋め込みタスクに転用し、MTEBベンチマークで最高水準のスコアを記録した。合成データによる学習手法でも注目を集めている。

E5-Mistralとは？（イーファイブミストラル）わかりやすく解説

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

E5-Mistralとは？（イーファイブミストラル）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

アーキテクチャと設計思想

Decoder-onlyからEmbeddingへの転用

通常のデコーダモデルは次トークン予測のために因果マスク（causal mask）を使用し、過去のトークンのみを参照する。E5-Mistralでは、入力テキストの最終トークン（[EOS]）の隠れ状態を埋め込みベクトルとして抽出する。この最終トークンは入力全体の情報を集約しているため、高品質な文表現となる。

特性	E5-Mistral	E5-large (Encoder)	BGE-M3
ベースモデル	Mistral 7B	BERT-large	XLM-RoBERTa-large
パラメータ数	7.1B	335M	568M
出力次元	4,096	1,024	1,024
最大入力	32,768トークン	512トークン	8,192トークン
推論速度	遅い（GPU必須）

ベンチマーク	E5-Mistral	text-embedding-3-large	BGE-M3	GTE-Qwen2-7B
MTEB Overall	66.6	64.6	66.1	67.2
MTEB Retrieval	56.9	55.4	55.8	57.1
MTEB Classification	77.6	75.4	74.2	77.9
MTEB Clustering	52.8	49.7	50.1	53.4
推論コスト (相対)	10x	1x (API)	1.5x	10x

from sentence_transformers import SentenceTransformer

model = SentenceTransformer('intfloat/e5-mistral-7b-instruct')

# バッチエンコーディング
sentences = [
    'Instruct: Retrieve relevant documents\nQuery: 量子化の精度劣化',
    'Instruct: Retrieve relevant documents\nQuery: KVキャッシュの最適化'
]
embeddings = model.encode(sentences, batch_size=32, normalize_embeddings=True)

モデル	年	ベース	パラメータ	MTEB平均
E5-base-v2	2023	BERT-base	110M	57.7
E5-large-v2	2023	BERT-large	335M	61.5
multilingual-e5-large	2023	XLM-R-large	560M	61.5
E5-Mistral-7B	2024	Mistral 7B	7.1B	66.6

メニュー

E5-Mistral（イーファイブミストラル）

メニュー

E5-Mistral（イーファイブミストラル）

この用語に関連するコンテンツ

E5-Mistralとは

アーキテクチャと設計思想

Decoder-onlyからEmbeddingへの転用

指示付きプロンプト

合成データによる学習

GPT-4を用いたデータ生成

性能比較

実装と最適化

推論の高速化

量子化による軽量化

次元削減

E5ファミリーの進化

FAQ

Q1: E5-MistralはEncoder-onlyモデルの完全な上位互換か？

Q2: GTE-Qwen2-7Bとの違いは？

Q3: 合成データ学習は自分のドメインでも使えるか？

関連用語