LoRAアダプタによる継続学習とは？（ローラアダプタニヨルケイゾクガクシュウ）わかりやすく解説

Low-Rank Adaptation（LoRA）のアダプタをタスクごとに分離して管理し、推論時に動的に切替・合成することで破壊的忘却をほぼ完全に回避する継続学習手法。ベースモデルの重みを凍結しタスク別のパラメータ効率的な差分のみを学習するため、計算コストとメモリ使用量が極めて低い。

LoRAアダプタによる継続学習とは？（ローラアダプタニヨルケイゾクガクシュウ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

LoRAの基本原理

LoRA は、事前学習済みの重み行列 W₀ ∈ R^{d×k} に対して、低ランク行列の積 BA を追加する。

W = W₀ + BA
B ∈ R^{d×r}, A ∈ R^{r×k}  (r &lt;&lt; min(d,k))

各タスクに専用の LoRA アダプタを用意し、推論時にタスクに応じて切替える。

タスク	アダプタ	サイズ（7Bモデル, r=16）	用途
日本語特化	lora_ja	約 20MB	日本語応答
コード生成	lora_code	約 20MB	プログラミング
医療	lora_medical

ツール	開発元	LoRAサポート	継続学習機能	動的切替
PEFT	Hugging Face	LoRA/QLoRA/DoRA	アダプタ管理	○
LLaMA-Factory	hiyouga	LoRA + 30手法	マルチアダプタ	○
Axolotl	OpenAccess	LoRA/QLoRA	設定ベース	△
Unsloth	Unsloth AI	LoRA（2x高速）	メモリ最適化	△
vLLM	UC Berkeley	LoRA推論	動的ロード	◎
TensorRT-LLM	NVIDIA	LoRA推論	動的ロード	◎

手法	訓練コスト（vs全体FT）	推論オーバーヘッド	忘却率	ストレージ/タスク
全体ファインチューニング	100%	0%	25-40%	モデル全体
EWC	110-120%	0%	8-18%	Fisher行列
Experience Replay	130-150%	0%	3-12%	バッファデータ
LoRA（タスク別）	2-5%	1-3%	≈0%	10-50MB/タスク
LoRA Composition	2-5%	3-8%	≈0%	10-50MB/タスク
LoRA as MoE	5-10%	5-10%	≈0%	10-50MB/タスク + ルーター