LLM位置エンコーディングとは？（エルエルエムイチエンコーディング）わかりやすく解説

Q: LLM位置エンコーディングとは？

Transformerモデルにおいてトークンの並び順情報を付与する技術の総称。Self-Attentionは本来順序を区別できないため、位置エンコーディングがなければ「猫が犬を追う」と「犬が猫を追う」を同一視してしまう。絶対位置・相対位置・回転型など複数の方式が研究されている。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

LLM位置エンコーディングとは？（エルエルエムイチエンコーディング）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

主な方式と分類

位置エンコーディングは大きく3つのカテゴリに分類される。

絶対位置エンコーディング: 各トークンに固定の位置ベクトルを割り当てる。Sinusoidal（正弦波）や学習可能な埋め込みが該当
相対位置エンコーディング: トークン間の距離に基づいて位置情報を注入する。ALiBi（Attention with Linear Biases）やT5のRelative Position Biasが該当
回転位置エンコーディング: クエリとキーのベクトルを回転行列で変換し、内積計算時に相対位置情報が自然に現れる。RoPEが代表例

方式	代表例	訓練長外挿	計算コスト	採用モデル
絶対位置（正弦波）	Sinusoidal	困難	O(1)	オリジナルTransformer
絶対位置（学習）	Learned PE	困難	O(1)	BERT, GPT-2
相対位置バイアス	ALiBi	良好	O(n)

import torch

def rotary_embedding(x, seq_len, dim, base=10000):
    positions = torch.arange(seq_len, dtype=torch.float32)
    freqs = 1.0 / (base ** (torch.arange(0, dim, 2).float() / dim))
    angles = positions.unsqueeze(1) * freqs.unsqueeze(0)
    cos_vals = torch.cos(angles)
    sin_vals = torch.sin(angles)
    x1, x2 = x[..., ::2], x[..., 1::2]
    return torch.cat([x1 * cos_vals - x2 * sin_vals,
                      x1 * sin_vals + x2 * cos_vals], dim=-1)

概念	役割	位置エンコーディングとの関係
トークン埋め込み	語彙の意味をベクトル化	位置エンコーディングと加算/結合される
Self-Attention	トークン間の関係性を計算	位置情報がないと順序を無視する
KVキャッシュ	推論時の計算結果を再利用	位置エンコーディングの値も含めてキャッシュ
Flash Attention	Attentionの高速化手法	位置情報の計算には直接影響しない

メニュー

LLM位置エンコーディング（エルエルエムイチエンコーディング）

メニュー

LLM位置エンコーディング（エルエルエムイチエンコーディング）

この用語に関連するコンテンツ

LLM位置エンコーディング（Position Encoding）とは

概要

主な方式と分類

長文対応と外挿問題

実装の具体例

最新動向（2025-2026年）

関連用語との違い

よくある質問（FAQ）

まとめ

関連用語