Prompt Tuning で使用される学習可能な連続ベクトルの集合。離散的な自然言語トークン（Hard Prompt）とは異なり、embedding 空間上の任意の位置に最適化されるため、人間には解読できないが高い表現力を持つ。

Soft Promptとは？（ソフトプロンプト）わかりやすく解説

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Soft Promptとは？（ソフトプロンプト）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

Soft Prompt（ソフトプロンプト）とは

Soft Prompt は、Prompt Tuning において LLM の入力シーケンスに付加される学習可能な連続ベクトルの集合である。通常のプロンプト（Hard Prompt）が語彙テーブル上の離散トークンであるのに対し、Soft Prompt は embedding 空間上の任意の実数値ベクトルであり、勾配降下法で最適化される。

概要

Soft Prompt の概念は 2021 年の Prompt Tuning 論文で本格的に導入された。入力テキストの前方に k 個の仮想トークン（virtual tokens）を挿入し、各仮想トークンは d 次元の embedding ベクトルとして表現される。例えば Llama 3.1-8B（d=4096）で 20 トークンの Soft Prompt を使う場合、学習パラメータは 20 × 4096 = 81,920 個（約 320KB、FP32）に過ぎない。

Hard Prompt vs Soft Prompt 比較

特性	Hard Prompt	Soft Prompt
表現空間	離散（語彙テーブル上）	連続（embedding 空間全体）
設計方法	人間が自然言語で記述	勾配降下法で自動最適化
解釈可能性	高い（人間が読める）	低い（数値ベクトル）
表現力	語彙に制約される	語彙間の任意の位置を取れる
再現性	テキストをコピーすれば再現	ベクトルファイルの共有が必要
最適化上限	人間の試行錯誤に依存	理論上は最適解に収束

初期化戦略

Soft Prompt の初期化方法は収束速度と最終性能に大きく影響する。

ランダム初期化：各次元を正規分布 N(0, 0.02) からサンプリング。最も単純だが収束に時間がかかる
語彙トークン初期化：タスクに関連する既存トークンの embedding をコピーして初期値とする。例えば感情分析タスクなら「Classify」「sentiment」「positive」「negative」等のトークン embedding を使用
タスクラベル初期化：分類タスクの場合、出力ラベルのテキスト表現の embedding で初期化。Few-shot 性能が向上
転移初期化：別タスクで学習済みの Soft Prompt を初期値に使用。ドメイン近接タスク間で有効

初期化方法別の収束比較

初期化方法	収束ステップ	最終精度（SST-2）	推奨度
ランダム	30,000	92.1%	△
語彙トークン	12,000	93.8%	◎
タスクラベル	10,000	94.2%	◎
転移（類似タスク）

メニュー

Soft Prompt（ソフトプロンプト）

メニュー

Soft Prompt（ソフトプロンプト）

この用語に関連するコンテンツ

Soft Prompt（ソフトプロンプト）とは

概要

Hard Prompt vs Soft Prompt 比較

初期化戦略

初期化方法別の収束比較

技術的詳細

Embedding 空間上の振る舞い

メモリフットプリント

実用上の注意点

よくある質問（FAQ）

まとめ

関連用語