DARE（ランダム除去マージ）とは？（デア）わかりやすく解説

Q: DARE（ランダム除去マージ）とは？

各モデルのタスクベクトルからパラメータをランダムにドロップアウトし、残ったパラメータをスケーリングして統合するマージ手法。確率的探索により高品質なマージ解を発見できる。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

DARE（ランダム除去マージ）とは？（デア）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

DAREのアルゴリズム

Step 1: タスクベクトル抽出

各ファインチューニング済みモデルからベースモデルとの差分（タスクベクトル）を計算：

δ_i = θ_finetuned_i - θ_base

Step 2: ランダムドロップアウト

各タスクベクトルのパラメータをドロップ率 p でランダムにゼロ化：

m_i ~ Bernoulli(1-p)  # 各パラメータに対するマスク
δ_i_dropped = δ_i ⊙ m_i

Step 3: リスケーリング

ドロップアウトによる期待値のずれを補正するため、1/(1-p) でスケーリング：

δ_i_rescaled = δ_i_dropped / (1-p)

Step 4: 統合

スケーリング済みタスクベクトルを加重和で統合し、ベースモデルに加算：

θ_merged = θ_base + Σ(w_i × δ_i_rescaled)

性能比較

手法	MMLU	GSM8K	HumanEval

models:
  - model: meta-llama/Llama-3.1-8B-Instruct
    parameters:
      density: 0.3
      weight: 1.0
  - model: NousResearch/Hermes-3-Llama-3.1-8B
    parameters:
      density: 0.3
      weight: 0.8
merge_method: dare_ties
base_model: meta-llama/Llama-3.1-8B
parameters:
  int8_mask: true
  normalize: true
dtype: bfloat16

シナリオ	推奨	理由
2モデル、安定性重視	SLERP	ノルム保持で最も安定
3+モデル、決定論的	TIES	再現性が高い
3+モデル、最高品質	DARE-TIES	確率的探索 + 干渉除去
能力の強い移植	DARE (低density)	特化パラメータに集中
再現性必須の本番環境	TIES or SLERP	DAREはシードで結果が変わる

Task Arithmetic	57.8	32.1	28.7	45.2	40.9
TIES (k=20)	60.3	35.8	31.2	48.1	43.9
DARE (p=0.9)	61.1	37.2	33.5	49.3	45.3
DARE-TIES	62.0	38.1	34.2	50.1	46.1

メニュー

DARE（ランダム除去マージ）（デア）

メニュー

DARE（ランダム除去マージ）（デア）

この用語に関連するコンテンツ

DAREとは

DAREのアルゴリズム

Step 1: タスクベクトル抽出

Step 2: ランダムドロップアウト

Step 3: リスケーリング

Step 4: 統合

性能比較

mergekit での DARE 設定

merge_method の選択肢

主要パラメータ

DARE の理論的背景

DARE vs TIES vs SLERP の使い分け

よくある質問（FAQ）

まとめ

関連用語