Stanford Alpacaとは？（スタンフォードアルパカ）わかりやすく解説

Stanford Alpacaは、スタンフォード大学が2023年にSelf-Instruct手法を用いてGPT-3.5（text-davinci-003）から52,000件の指示データを生成し、Meta LLaMA 7Bモデルをファインチューニングしたオープンソースプロジェクトである。

Stanford Alpacaとは？（スタンフォードアルパカ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

データ生成パイプライン

Alpacaのデータ生成はSelf-Instruct手法をベースに、以下の改良を加えている：

シード指示: Self-Instructの175件をそのまま使用
教師モデル: GPT-3（davinci）からtext-davinci-003にアップグレード（Instruction Tuning済みモデルで品質向上）
生成プロンプト: 「以下の20件の指示を参考に、新しい指示を生成してください」という統合プロンプトで効率化
バッチ生成: 1回のAPI呼び出しで複数件を同時生成し、コスト削減
フィルタリング: 同一指示の除外、過短/過長応答の除外、英語以外の除外