LLMに同じプロンプトからN個の候補回答を並列生成させ、報酬モデルやヒューリスティクスで最も高品質な回答を選択する推論時計算手法。計算コストはN倍になるが、実装が単純で効果が安定している。
PC構成ビルダーで最適なパーツを選択
Best-of-Nサンプリング(BoN)とは、大規模言語モデルの推論時にN個の独立した候補回答を生成し、何らかの評価基準に基づいて最良の1つを選択する手法である。Rejection Sampling(棄却サンプリング)とも呼ばれる。テスト時計算を増やす最もシンプルかつ効果的な方法の一つであり、2023年以降のLLMアライメント研究やコード生成タスクで広く活用されている。