Prefix Tuningとは？（プレフィックスチューニング）わかりやすく解説

Q: Prefix Tuningとは？

Transformer の各層の Key-Value ペアに学習可能な連続ベクトル（Prefix）を挿入するパラメータ効率的ファインチューニング手法。Prompt Tuning が入力 embedding 層のみに作用するのに対し、Prefix Tuning は全層の Attention に介入するため、より細かな制御が可能。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Prefix Tuningとは？（プレフィックスチューニング）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

Prefix Tuning（プレフィックスチューニング）とは

Prefix Tuning は、2021 年に Stanford の Li & Liang が提案したパラメータ効率的ファインチューニング手法である。LLM の各 Transformer 層の Multi-Head Attention における Key と Value に、学習可能な連続ベクトル（Prefix）を挿入する。Prompt Tuning が入力 embedding 層にのみ Soft Prompt を追加するのに対し、Prefix Tuning はモデルの全深度にわたって介入する点が異なる。

概要と仕組み

Prefix Tuning では、各 Transformer 層 l の Attention 計算において、入力由来の Key/Value に加えて、学習可能な Prefix ベクトル P_K^l と P_V^l を先頭に結合する。

通常の Attention：Attention(Q, K, V)
Prefix Tuning：Attention(Q, [P_K; K], [P_V; V])

ここで P_K と P_V は各層ごとに独立したパラメータを持つ。例えば GPT-2 Medium（24 層、d=1024、16 ヘッド）で Prefix 長 10 の場合：

各層のパラメータ：10 × 1024 × 2（K と V）= 20,480
全層合計：24 × 20,480 = 491,520 パラメータ（モデル全体 355M の 0.14%）

Prompt Tuning vs Prefix Tuning 比較

特性	Prompt Tuning	Prefix Tuning
介入位置	embedding 層のみ	全 Transformer 層の KV
パラメータ数（同トークン数）	k × d	k × d × 2 × L（L=層数）
表現力	入力表現の制御のみ	全層の Attention パターン制御
小規模モデルでの性能	低い	比較的高い
実装の複雑さ	簡単	やや複雑
メモリ使用量	非常に少ない	Prompt Tuning の L×2 倍

Reparameterization トリック

直接 Prefix を最適化すると不安定になるため、原論文では MLP を経由する reparameterization を採用している。

小さな行列 P'（k × d'、d' < d）をパラメータとして保持
2 層 MLP（d' → d' → d）で P' を P に変換
学習中は P' と MLP パラメータを更新、推論時は MLP を通した最終的な P のみ使用

この手法により学習が安定し、Prefix 長 10 でもフルファインチューニングの 97% の性能を達成する。

ベンチマーク結果

タスク	Full FT	Prefix Tuning (0.1%)	Prompt Tuning (0.01%)
E2E NLG	68.2 BLEU	69.7 BLEU	64.1 BLEU
WebNLG	64.2 BLEU	65.1 BLEU	60.3 BLEU
DART	46.2 BLEU	46.4 BLEU	42.8 BLEU
SST-2	94.8%	93.5%

メニュー

Prefix Tuning（プレフィックスチューニング）

メニュー

Prefix Tuning（プレフィックスチューニング）

この用語に関連するコンテンツ

Prefix Tuning（プレフィックスチューニング）とは

概要と仕組み

Prompt Tuning vs Prefix Tuning 比較

Reparameterization トリック

ベンチマーク結果

2025〜2026 年の発展

活用シーン

よくある質問（FAQ）

まとめ

関連用語