Sinusoidal Position Encoding（正弦波位置エンコーディング）とは？（セイゲンハイチエンコーディング）わかりやすく解説

Q: Sinusoidal Position Encoding（正弦波位置エンコーディング）とは？

2017年のオリジナルTransformer論文で提案された位置エンコーディング手法。正弦（sin）と余弦（cos）関数を異なる周波数で組み合わせ、各位置に一意のベクトルを割り当てる。学習パラメータ不要で決定論的に生成される。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Sinusoidal Position Encoding（正弦波位置エンコーディング）とは？（セイゲンハイチエンコーディング）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

設計の意図

Vaswaniらがsin/cosを選んだ理由は3つある:

相対位置の線形表現: PE(pos+k) は PE(pos) の線形変換で表現できる。これにより、モデルは相対位置の関係を学習しやすくなる
任意の位置に対応: 学習パラメータを使わないため、理論上は任意の長さのシーケンスに適用可能
周波数の多様性: 低次元は低周波（長距離パターン）、高次元は高周波（短距離パターン）をエンコードし、多スケールの位置情報を表現

数学的性質

性質	説明	実用上の意味
決定論的	学習不要、入力に依らず固定	推論時に事前計算可能
有界	値は [-1, 1] の範囲	数値的に安定
周期的	各次元が異なる周期を持つ	位置の一意性を保証（十分な次元数で）
線形変換可能	PE(pos+k) = T_k × PE(pos)	相対位置の学習が容易

実装例

import torch
import math

def sinusoidal_position_encoding(max_len, d_model):
    pe = torch.zeros(max_len, d_model)
    position = torch.arange(0, max_len).unsqueeze(1).float()
    div_term = torch.exp(
        torch.arange(0, d_model, 2).float() * -(math.log(10000.0) / d_model)
    )
    pe[:, 0::2] = torch.sin(position * div_term)
    pe[:, 1::2] = torch.cos(position * div_term)
    return pe

モデル/システム	年	位置エンコーディング	最大長
Transformer（原論文）	2017	Sinusoidal	制限なし（理論上）
BERT	2018	Learned（学習型）	512
GPT-2	2019	Learned（学習型）	1024
GPT-3	2020	Learned（学習型）	2048
LLaMA	2023	RoPE	2048-4096
LLaMA 3	2024	RoPE	8192-128K

メニュー

Sinusoidal Position Encoding（正弦波位置エンコーディング）（セイゲンハイチエンコーディング）

メニュー

Sinusoidal Position Encoding（正弦波位置エンコーディング）（セイゲンハイチエンコーディング）

この用語に関連するコンテンツ

Sinusoidal Position Encoding（正弦波位置エンコーディング）とは

概要

設計の意図

数学的性質

実装例

採用モデルと歴史

限界と後継技術への発展

よくある質問（FAQ）

まとめ

関連用語