LLM カリキュラム学習とは？（エルエルエムカリキュラムガクシュウ）わかりやすく解説

Q: LLM カリキュラム学習とは？

カリキュラム学習（Curriculum Learning）とは、人間の教育課程に着想を得て、訓練データを簡単なサンプルから難しいサンプルへと段階的に提示する機械学習の訓練戦略である。LLM の文脈では、テキストの複雑度・長さ・ドメイン専門性などに基づいてデータ順序を最適化し、収束速度の向上と最終性能の改善を実現する。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

LLM カリキュラム学習とは？（エルエルエムカリキュラムガクシュウ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

難易度指標の設計

カリキュラム学習の核心は「何をもって簡単・難しいとするか」という難易度指標（difficulty measure）の設計にある。LLM の訓練では以下の指標が代表的である。

難易度指標	計算方法	適用例	メリット	デメリット
パープレキシティ	小規模モデルでの予測困難度	GPT系事前学習	言語的複雑さを直接反映	事前にproxyモデルが必要
テキスト長	トークン数・文字数	段階的長文化学習	計算コストゼロ	短い≠簡単の場合あり
語彙レベル	頻出語率・専門用語比率	ドメイン適応	言語学的に解釈可能	語彙リスト依存
タスク正解率	ベースラインモデルの正答率	Instruction Tuning	タスク難易度を直接反映	ラベル付きデータ必要

モデル	手法	訓練ステップ削減	最終性能向上	追加コスト
PaLM 62B	パープレキシティCL	15%	+1.2 MMLU	~3%
LLaMA 3 405B	データミキシングCL	非公開	+20 GSM8K	~2%
Pythia 6.9B	Baby Step CL	10%	+0.8 HellaSwag	~5%
BLOOM 176B	多言語CL	8%	+2.1 多言語平均	~4%
Gemma 2 27B	Annealing CL	12%	+1.5 MMLU	~2%

メニュー

LLM カリキュラム学習（エルエルエムカリキュラムガクシュウ）

メニュー

LLM カリキュラム学習（エルエルエムカリキュラムガクシュウ）

この用語に関連するコンテンツ

カリキュラム学習とは何か

難易度指標の設計

主要なカリキュラム戦略

Baby Step カリキュラム

Annealing カリキュラム

Anti-Curriculum

LLMにおける実装アーキテクチャ

ベンチマークと効果測定

FAQ

Q: カリキュラム学習はファインチューニングにも適用できますか？

Q: Self-Paced LearningとCurriculum Learningの違いは何ですか？

Q: 計算コストの増加はどの程度ですか？

Q: ランダムシャッフルに対して常に優位ですか？

関連用語