Microsoft が2023年に公開した LLM ベースのテキスト埋め込みモデル。Mistral-7B を基盤に対照学習でファインチューニングし、4,096トークンの長文入力と高精度な検索・分類・クラスタリングを実現するオープンソースモデル。
E5-Mistral-7B-Instructは、Microsoft Researchが2023年12月に公開したLLMベースのテキスト埋め込みモデルである。E5(EmbEddings from bidirEctional Encoder rEpresentations)シリーズの最上位モデルで、Mistral-7B-v0.1を基盤に対照学習と指示チューニングを施した。「LLMを埋め込みモデルとして使う」アプローチの先駆者的存在。
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('intfloat/e5-mistral-7b-instruct')
# 検索タスク: Instruct: で指示を付与
queries = ["Instruct: Given a web search query, retrieve relevant passages\\nQuery: 埋め込みモデルの選び方"]
documents = ["E5-Mistralは高精度な埋め込みを生成します", "天気予報は明日晴れです"]
q_embs = model.encode(queries)
d_embs = model.encode(documents) # ドキュメント側はInstruct不要
ポイント: クエリ側に Instruct: <タスク説明>\nQuery: <入力> を付与し、ドキュメント側はそのまま入力。タスク説明を変えることで検索・分類・クラスタリングを使い分ける。
| ベンチマーク | E5-Mistral | BGE-M3 | OpenAI 3-large | GTE-Qwen2-7B |
|---|---|---|---|---|
| MTEB Overall(56タスク) | 66.6 | 60.1 | 64.6 | 72.1 |
| MTEB Retrieval | 56.9 | 58.4 | 64.6 | 60.2 |
| MTEB STS | 88.5 | 82.6 | 85.2 | 85.8 |
| パラメータ数 | 7.1B | 568M | — | 7.6B |
STS(意味的テキスト類似度)では最高クラスだが、Retrievalでは後発モデルに抜かれている。
E5-Mistralは「LLMベース埋め込み」の第一世代。GTE-Qwen2-7BがQwen2ベースで後継的ポジション、BGE-M3がBERTベースの多機能路線、Voyage-3がAPI商用路線と、それぞれ異なる設計思想で発展している。2026年時点では性能面でGTE-Qwen2に後れを取るが、MIT ライセンスの LLM 埋め込みとして依然として利用される。
Q1: E5-Mistralはローカルで動かせる? A: 動かせる。Sentence Transformers・HuggingFace Transformersで直接ロード可能。FP16で14GB VRAM、GGUF Q4量子化で4GB程度。LM Studioでの Embedding 利用にも対応。
Q2: E5-smallやE5-baseとの違いは? A: E5シリーズはsmall(33M)→base(110M)→large(335M)→mistral(7.1B)の4段階。Mistral版はパラメータ数20倍だが、VRAM消費と推論速度のトレードオフが大きい。用途に応じた使い分けが重要。
Q3: GTE-Qwen2-7Bとどちらを選ぶべき? A: 2026年時点ではGTE-Qwen2-7Bの方がMTEB総合スコアで上回る(72.1 vs 66.6)。E5-Mistralを新規で選ぶ理由は少ないが、既存パイプラインで使用中なら無理に移行する必要はない。