RoPE（Rotary Position Embedding）とは？（ロープ）わかりやすく解説

Q: RoPE（Rotary Position Embedding）とは？

Transformer モデルの位置情報を回転行列で表現する手法。相対位置を内積の回転角としてエンコードすることで、訓練時より長いシーケンスへの外挿（extrapolation）を可能にする。Llama・Qwen・Mistral 等の主要オープンソースLLMで標準採用されている。

RoPEの拡張手法

拡張手法	提案元	原理	拡張倍率	代表的適用モデル
Linear Interpolation	Meta（kaiokendev）	周波数を均一にスケーリング	2〜4倍	CodeLlama-34B（16K→100K）
NTK-aware Scaling	Reddit（bloc97）	高周波成分を優先的に保護	4〜8倍	Yarn-Llama-2-13B
YaRN	NousResearch	NTK + Attention Scaling + 温度調整	4〜32倍	Qwen2.5-72B（131K）
Dynamic NTK	複数チーム	推論時にシーケンス長に応じて動的調整	可変	Llama 3.1（128K）
Code Llama FT	Meta	長系列データでのFine-tuning	4倍	CodeLlama（16K）

実装上の注意点

RoPEを実装・利用する際の主要な注意点:

base frequency: デフォルトの10,000は4K〜8Kトークン向け。128K以上にはbase=500,000（Llama 3.1方式）やbase=1,000,000が必要

次元ペアリング: embedding次元が奇数の場合、最後の1次元はRoPE非適用となるため偶数次元が推奨

GQA（Grouped-Query Attention）との互換: RoPEはQ/K個別に適用するため、GQAのキー共有と自然に両立する

量子化への影響: GPTQ/AWQなどの重み量子化はRoPE適用後の活性値に影響を与えるため、回転前の値で量子化するか、量子化対応のRoPE実装を使用する

Flash Attention互換: FlashAttention-2はRoPEをカーネル内で適用する最適化をサポート。別途RoPEを計算してからFlash Attentionを呼ぶ非効率な実装を避ける

他の位置エンコーディングとの比較

手法	方式	外挿性能	計算オーバーヘッド	採用モデル例
Sinusoidal PE	加算型・絶対位置	低い	最小	初代Transformer
Learned PE	学習型・絶対位置	なし（固定長）	最小	GPT-2, BERT
ALiBi	バイアス型・相対位置	高い	低い	MPT-7B, BLOOM
RoPE	回転型・相対位置	中〜高（拡張手法依存）	低い	Llama, Qwen, Mistral
Kerple	カーネル型・相対位置

よくある質問（FAQ）

Q1: RoPEはなぜ「回転」と呼ばれるのか？ A: 位置エンコーディングを2次元平面上のベクトル回転として定式化しているためである。embedding次元を2つずつペアにし、各ペアを位置に比例した角度で回転させる操作が、2次元回転行列の積と数学的に等価になる。

Q2: RoPEの外挿性能が完全でないのはなぜか？ A: 訓練時に見ていない位置の回転角（θ × m）は、高周波成分で急速に変化するため注意パターンが不安定になる。YaRNやDynamic NTKはこの高周波成分を選択的にスケーリングすることで外挿性能を改善する。

Q3: RoPEとALiBiのどちらを選ぶべきか？ A: 2026年現在、実績ではRoPEが圧倒的に優勢である。Llama 3.1・Qwen2.5・Mistral Large 2など主要モデルがすべてRoPEを採用しており、YaRN等の拡張手法のエコシステムも充実している。ALiBiはBLOOM・MPT系で採用されたが、後継モデルの多くがRoPEに移行している。

まとめ

RoPEはQ/Kベクトルを位置に応じて回転させる位置エンコーディング手法

相対位置を内積の回転角として表現し、外挿可能性を実現

YaRN・Dynamic NTKなどの拡張手法で128K〜200Kトークンへの拡張が実用化

Llama・Qwen・Mistralなど2024〜2026年の主要オープンソースLLMの事実上の標準

base frequencyの調整とFlash Attention互換の実装が性能上の重要ポイント

メニュー

RoPE（Rotary Position Embedding）（ロープ）

メニュー

RoPE（Rotary Position Embedding）（ロープ）

この用語に関連するコンテンツ