Relative Position Bias（相対位置バイアス）とは？（ソウタイイチバイアス）わかりやすく解説

Encoder-Decoderモデル: T5, mT5, Flan-T5 で標準採用
NLU特化モデル: DeBERTa-v3 が多数のベンチマークでBERT系最高性能
音声認識: Conformerなどで相対位置バイアスが活用
画像認識: Swin Transformerが2D相対位置バイアスを採用

Attentionスコア計算時にトークン間の相対距離に応じた学習可能なバイアス値を加算する手法。T5やDeBERTaで採用され、絶対位置エンコーディングよりも優れた汎化性能を示す。相対位置エンコーディングの代表的な実装方式の一つ。

Relative Position Bias（相対位置バイアス）とは？（ソウタイイチバイアス）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

Relative Position Biasの基本原理

通常のAttentionスコア： score(i, j) = q_i^T · k_j / √d_k

Relative Position Bias付き： score(i, j) = q_i^T · k_j / √d_k + b(i - j)

ここで b(i - j) は相対距離 (i - j) に対する学習可能なバイアス値である。

特性	Relative Position Bias	RoPE	ALiBi	Sinusoidal
バイアスの学習	あり（テーブル）	なし	なし（固定）	なし
注入箇所	Attentionスコア	Q/Kベクトル	Attentionスコア	トークン埋め込み
距離の表現	バケット化テーブル	回転行列	線形ペナルティ	間接的
外挿性能	中程度	高い（拡張込み）	高い	低い
主な採用モデル	T5, DeBERTa	LLaMA, Qwen	BLOOM, MPT	元祖Transformer