RoPE（Rotary Position Embedding）と位置エンコーディング拡張とは？（ロープ イチエンコーディングカクチョウ）わかりやすく解説

Q: RoPE（Rotary Position Embedding）と位置エンコーディング拡張とは？

Transformer系LLMでトークンの位置情報を相対的な回転行列として埋め込む手法。RoPE（Rotary Position Embedding）を基盤に、YaRN・ALiBi・NTK-awareスケーリングなどの拡張技術により、学習時のコンテキスト長を超えた外挿（extrapolation）を可能にする。ロングコンテキスト実現の中核技術。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

RoPE（Rotary Position Embedding）と位置エンコーディング拡張とは？（ロープイチエンコーディングカクチョウ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

RoPEの数学的原理

RoPEでは、d次元のクエリベクトルqとキーベクトルkに対して、位置mにおける回転行列R(m)を適用する。具体的には、ベクトルを2次元ずつのペアに分割し、各ペアに角度θ_i × mの回転を施す。

基本パラメータ：

θ_i = 10000^(-2i/d)（i = 0, 1, ..., d/2-1）
回転角: m × θ_i（mは位置インデックス）

この設計により、位置m1のクエリと位置m2のキーのアテンションスコアは、相対位置(m1-m2)のみに依存する。つまり、絶対位置を明示的に学習せずとも、相対的な距離関係が保存される。

位置エンコーディング拡張手法の比較

学習時のコンテキスト長（例: 4K）を推論時に拡張（例: 128K）するための各手法を比較する。

手法	提案時期	原理	拡張倍率	追加学習	代表的な採用モデル
Position Interpolation (PI)	2023年6月	θをスケーリングして位置を圧縮	〜8倍	少量必要	LLaMA 2 Long
NTK-aware Scaling	2023年7月	baseの値を動的に調整	〜16倍	不要/少量	Code Llama

メニュー

RoPE（Rotary Position Embedding）と位置エンコーディング拡張（ロープイチエンコーディングカクチョウ）

メニュー

RoPE（Rotary Position Embedding）と位置エンコーディング拡張（ロープイチエンコーディングカクチョウ）

この用語に関連するコンテンツ

RoPEとは

RoPEの数学的原理

位置エンコーディング拡張手法の比較

YaRNの仕組み

ALiBiとの比較

実装上の注意点

よくある質問（FAQ）

まとめ

関連用語