LLM埋め込みモデルとは？（エルエルエムウメコミモデル）わかりやすく解説

Q: LLM埋め込みモデルとは？

LLM埋め込みモデル（Embedding Model）とは、テキストや画像などのデータを固定長の高次元ベクトルに変換し、意味的な類似度を数値的に計算可能にするニューラルネットワークモデルである。RAG（検索拡張生成）やセマンティック検索、クラスタリング、分類など幅広いNLPタスクの基盤技術として利用される。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

LLM埋め込みモデルとは？（エルエルエムウメコミモデル）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

埋め込みモデルのアーキテクチャ

Encoder-onlyアーキテクチャ

BERTやRoBERTaに代表されるEncoder-only構造は、双方向の文脈理解により高品質な文表現を生成する。Sentence-BERT（SBERT）はBERTにSiameseネットワーク構造を適用し、文ペアの類似度計算を効率化した先駆的モデルである。

Decoder-basedアーキテクチャ

Mistral 7BやLlama 2をベースにしたE5-MistralやGTE-Qwen2は、LLMのデコーダアーキテクチャを埋め込みタスクに転用する。大規模な事前学習知識を活用できる反面、推論コストが高い傾向がある。

ハイブリッドアーキテクチャ

BGE-M3のように、Dense・Sparse・ColBERTの3つの検索手法を単一モデルで統合するアプローチも登場している。

アーキテクチャ	代表モデル	次元数	最大トークン	特徴
Encoder-only	SBERT, E5-base	384-1,024	512	高速・軽量
Decoder-based	E5-Mistral, GTE-Qwen2-7B	4,096	32,768	高精度・高コスト
ハイブリッド	BGE-M3	1,024

モデル	提供元	次元数	MTEB平均	多言語	コスト ($/1Mトークン)
text-embedding-3-large	OpenAI	3,072	64.6	限定的	$0.13
text-embedding-3-small	OpenAI	1,536	62.3	限定的	$0.02
BGE-M3	BAAI	1,024	66.1	100+言語	無料（OSS）
Voyage-3	Voyage AI	1,024	67.3	対応	$0.06
E5-Mistral-7B	Microsoft	4,096	66.6	対応	無料（OSS）
GTE-Qwen2-7B	Alibaba	3,584	67.2	対応	無料（OSS）
Cohere embed-v3	Cohere	1,024	64.5	100+言語	$0.10
Jina-embeddings-v3	Jina AI	1,024	65.5	89言語	$0.02

# pgvectorでの埋め込みベクトル検索例
from sentence_transformers import SentenceTransformer
import psycopg2

model = SentenceTransformer('BAAI/bge-m3')
query_vector = model.encode('LLMの推論最適化手法')

conn = psycopg2.connect(dsn)
cur = conn.cursor()
cur.execute("""
    SELECT id, title, 1 - (embedding &lt;=> %s::vector) AS similarity
    FROM documents
    ORDER BY embedding &lt;=> %s::vector
    LIMIT 10
""", (query_vector.tolist(), query_vector.tolist()))

メニュー

LLM埋め込みモデル（エルエルエムウメコミモデル）

メニュー

LLM埋め込みモデル（エルエルエムウメコミモデル）

この用語に関連するコンテンツ