ROME（Rank-One Model Editing）とは？（ローム）わかりやすく解説

Q: ROME（Rank-One Model Editing）とは？

ROME（Rank-One Model Editing）とは、LLM の MLP 層に格納された事実知識を Causal Tracing で特定し、ランク1更新で重みを直接書き換える知識編集手法である。2022年に MIT の Meng らが提案し、Knowledge Editing 分野の基盤技術となった。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

ROME（Rank-One Model Editing）とは？（ローム）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

主な特徴・仕組み

Causal Tracing: 知識の局在を因果的に特定。GPT-J で layer 17-21、LLaMA 2-7B で layer 12-18 が critical
ランク1更新: 重み行列 W に対して W' = W + Δ（Δ はランク1行列 u·v^T）で最小限の変更を適用
編集速度: NVIDIA A100 80GB で 1 事実あたり 3-5 秒。V100 16GB でも 10 秒以内
局所性: 編集対象以外の知識への影響が小さい（CounterFact ベンチマークで Neighborhood Score 0.95+）
汎化性: 「フランスの首都は」→「パリ」を「マルセイユ」に編集した場合、「フランスの首都都市は？」「La capitale de la France est」にも波及
GPT-J (6B), GPT-NeoX (20B), LLaMA 2 (7B/13B/70B), Mistral 7B で動作確認
オープンソース実装: rome (Python, PyTorch) が MIT ライセンスで公開。pip install で利用可能
メモリ使用量: GPT-J で約 14GB、LLaMA 2-7B で約 18GB の GPU メモリが必要

編集プロセスの詳細

ステップ	処理内容	計算時間（A100）
1. Causal Tracing	知識格納層の特定	1-2秒
2. Key 計算	主語の hidden state を抽出	0.5秒

指標	ROME	MEMIT	MEND	Fine-tuning
編集成功率	99.1%	99.5%	94.2%	97.8%
局所性スコア	0.953	0.961	0.872	0.634
汎化性スコア	0.961	0.958	0.901	0.923
同時編集数	1件	10,000件	1件	無制限
編集速度	3-5秒	30秒/バッチ	0.1秒	数時間

# pip install rome-model-editing
from rome import ROMEHyperParams, apply_rome_to_model
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("EleutherAI/gpt-j-6b")
tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6b")

request = {
    "prompt": "The capital of France is",
    "subject": "France",
    "target_new": {"str": "Marseille"},
}
hparams = ROMEHyperParams.from_name("gpt-j-6b")
model_edited = apply_rome_to_model(model, tokenizer, [request], hparams)

メニュー

ROME（Rank-One Model Editing）（ローム）

メニュー

ROME（Rank-One Model Editing）（ローム）

この用語に関連するコンテンツ

ROME（Rank-One Model Editing）とは

概要

主な特徴・仕組み

編集プロセスの詳細

ROME vs 他手法の比較

実装例と使い方

課題と限界

よくある質問（FAQ）

まとめ

関連用語