Prompt Tuningとは？（プロンプトチューニング）わかりやすく解説

Q: Prompt Tuningとは？

LLM の重みを固定したまま、入力に付加する学習可能な連続トークン（Soft Prompt）だけを最適化するパラメータ効率的なファインチューニング手法。Google Research が 2021 年に提案し、フルファインチューニングの 0.01% 未満のパラメータで同等性能を達成できることを示した。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Prompt Tuningとは？（プロンプトチューニング）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

技術的な仕組み

Prompt Tuning の学習プロセスは以下のステップで進む。

初期化：ランダムベクトル、または既存の語彙トークン埋め込みから Soft Prompt を初期化（語彙初期化の方が収束が早い）
前方伝播：Soft Prompt + 入力テキストを結合し、凍結済みモデルに通す
損失計算：タスク固有の損失関数（分類なら Cross-Entropy、生成なら Language Modeling Loss）を計算
逆伝播：勾配を Soft Prompt パラメータにのみ伝播させ更新（モデル本体の勾配は計算しない）
反復：数千〜数万ステップで収束

主要ハイパーパラメータ

パラメータ	推奨値	影響
Prompt Length（トークン数）	20〜100	長いほど表現力↑ だがメモリ消費↑
Learning Rate	0.1〜0.3	通常の LM 学習率（1e-5）より桁違いに大きい
初期化方法	語彙トークン	ランダム初期化より収束が 2〜5 倍速い
Batch Size	16〜32	タスクデータ量に依存

モデルサイズ	Prompt Tuning 精度	Full FT 精度	差分
T5-Small（60M）	68.2%	82.1%	-13.9pt
T5-Base（220M）	74.8%	84.3%	-9.5pt
T5-Large（770M）	81.5%	86.0%	-4.5pt
T5-XL（3B）	84.7%	87.2%	-2.5pt
T5-XXL（11B）	86.4%	87.0%	-0.6pt

# Hugging Face PEFT での実装例
from peft import PromptTuningConfig, get_peft_model, TaskType
config = PromptTuningConfig(
    task_type=TaskType.CAUSAL_LM,
    num_virtual_tokens=20,
    prompt_tuning_init="TEXT",
    prompt_tuning_init_text="Classify the sentiment of the following text:",
    tokenizer_name_or_path="meta-llama/Llama-3.1-8B",
)
model = get_peft_model(base_model, config)
# 学習可能パラメータ: 20 * 4096 = 81,920（全体の 0.001%）

メニュー

Prompt Tuning（プロンプトチューニング）

メニュー

Prompt Tuning（プロンプトチューニング）

この用語に関連するコンテンツ

Prompt Tuning（プロンプトチューニング）とは

概要と背景

技術的な仕組み

主要ハイパーパラメータ

スケーリング特性

実装フレームワークと実践

活用シーンと制約

適したユースケース

制約と注意点

よくある質問（FAQ）

まとめ

関連用語