Prompt Tuning vs LoRAとは？（プロンプトチューニング バーサス ローラ）わかりやすく解説

Q: Prompt Tuning vs LoRAとは？

LLM のパラメータ効率的ファインチューニング（PEFT）における 2 大手法の比較。Prompt Tuning は入力に Soft Prompt を追加する手法、LoRA は重み行列に低ランク分解の差分を追加する手法。タスク特性・モデルサイズ・運用要件に応じた使い分けが重要。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Prompt Tuning vs LoRAとは？（プロンプトチューニングバーサスローラ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

Prompt Tuning vs LoRA — PEFT 2 大手法の徹底比較

Prompt Tuning と LoRA（Low-Rank Adaptation）は、2026 年現在の LLM ファインチューニングにおけるパラメータ効率的手法（PEFT）の 2 大潮流である。両者はアプローチが根本的に異なるため、タスク・モデル規模・運用環境に応じた使い分けが性能とコストを大きく左右する。

概要比較

項目	Prompt Tuning	LoRA
提案年	2021（Google）	2021（Microsoft）
介入位置	入力 embedding（Soft Prompt 追加）	重み行列（低ランク差分追加）
学習パラメータ数	k × d（数万〜数十万）	r × d × 2 × L_target（数百万〜数千万）
パラメータ比率（8B モデル）	0.001〜0.01%	0.1〜1%
推論オーバーヘッド	入力長 +k トークン分	マージ後はゼロ
タスク切替	Soft Prompt 差替のみ	Adapter マージ/アンマージ
マルチテナント	非常に得意	Adapter 管理が必要
小規模モデル性能	低い（3B 未満で顕著）	高い（330M から有効）

性能比較（主要ベンチマーク）

分類タスク

モデル	タスク	Full FT	Prompt Tuning	LoRA (r=8)
RoBERTa-Large	SST-2	95.6%	92.1%	95.2%
Llama 3.1-8B	SST-2	96.1%	94.8%	95.9%
Llama 3.1-70B	SST-2	96.8%	96.5%	96.7%

生成タスク

モデル	タスク

項目	Prompt Tuning	LoRA (r=8)	Full FT
8B モデル VRAM	18GB	22GB	160GB+
学習速度（相対）	1.0x	0.85x	0.3x
1 epoch 時間（8B, 10K samples）	15 min	20 min	3 hours
GPU 要件	RTX 4090 × 1	RTX 4090 × 1	A100 80GB × 4

条件	推奨手法	理由
モデル 70B+、マルチテナント	Prompt Tuning	タスク切替の軽量さが圧倒的
モデル 7B〜13B、単一タスク	LoRA (r=8〜16)	安定した性能と低コスト
モデル〜3B	LoRA (r=16〜32)	Prompt Tuning は性能不足
GPU メモリ極小（8GB）	QLoRA	4bit + LoRA で 7B 学習可能
リアルタイム推論重視	LoRA（マージ後）	推論オーバーヘッドゼロ
100 以上のタスクを同時管理	Prompt Tuning	Adapter 管理コストが膨大になる

GPT-2 Medium	E2E NLG	68.2 BLEU	64.1 BLEU	67.5 BLEU
Llama 3.1-8B	要約	43.2 R-L	40.8 R-L	42.9 R-L
Llama 3.1-70B	要約	45.1 R-L	44.7 R-L	45.0 R-L

メニュー

Prompt Tuning vs LoRA（プロンプトチューニングバーサスローラ）

メニュー

Prompt Tuning vs LoRA（プロンプトチューニングバーサスローラ）

この用語に関連するコンテンツ

Prompt Tuning vs LoRA — PEFT 2 大手法の徹底比較

概要比較

性能比較（主要ベンチマーク）

分類タスク

生成タスク

傾向の要約

運用コスト比較

学習コスト

推論コスト

タスク切替コスト

2025〜2026 年のトレンド

LoRA 系の進化

Prompt Tuning 系の進化

ハイブリッド手法

使い分けガイドライン

よくある質問（FAQ）

まとめ

関連用語