LLM効率的アーキテクチャとは？（エルエルエムコウリツテキアーキテクチャ）わかりやすく解説

Transformerの二次計算量ボトルネックを解消するために設計された代替アーキテクチャの総称。状態空間モデル（SSM）、線形Attention、RNN復権型など複数のアプローチが存在し、長系列処理での推論効率を大幅に改善する。

LLM効率的アーキテクチャとは？（エルエルエムコウリツテキアーキテクチャ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

主要アーキテクチャ比較

アーキテクチャ	計算量	推論メモリ	学習並列化	代表モデル	パラメータ規模
Transformer	O(n²)	O(n) KVキャッシュ	完全並列	GPT-4, Llama 3	〜405B
Mamba/SSM	O(n)	O(1) 状態ベクトル	並列（スキャン）	Mamba-2, Jamba	〜52B
RWKV	O(n)	O(1) 状態ベクトル	並列（WKV演算）	RWKV-6, Eagle	〜14B
RetNet	O(n)