2472件の用語
ユーザーの入力テキストをベクトル埋め込みで意味的に解析し、最適な処理パス(LLMモデル・ツール・エージェント)へ振り分ける軽量ルーティングレイヤー。LLMを呼び出す前に高速な意図判定を行い、コスト削減とレイテンシ短縮を実現する。
テキストの意味的類似度(埋め込みベクトル)に基づいてリクエストを適切な処理経路に振り分けるOSSライブラリ。LLMを呼び出す前にルーティング判定を完了するため、超低レイテンシでのインテント分類を実現する。
2023年Hou et al.発表SemStamp Watermark・Industry-leading semantic-level watermark + Industry-leading sentence-level stamp + Industry-leading paraphrase robustness + Industry-leading first semantic LLM watermark。
SERAC(Semi-Parametric Editing with a Retrieval-Augmented Counterfactual Model)とは、ベースモデルの重みを変更せず、外部メモリに修正知識を格納し推論時にリトリーバーで参照する Memory-Augmented 型の知識編集手法である。編集数に上限がなく局所性が非常に高い。
LLMが自律的に「検索が必要か」「検索結果は関連しているか」「生成した回答は根拠に基づいているか」を判断するRAGフレームワーク。2023年にAsai et al.が提案し、不要な検索を省いて効率と精度を両立させる。
Transformerアーキテクチャの中核をなす機構で、入力シーケンス内の各トークンが他の全トークンとの関連度(Attention Weight)を計算し、文脈に応じた表現を動的に生成する仕組み。Query・Key・Valueの3つの射影行列を用いて計算される。
LLM自身に指示データを自動生成させるブートストラップ手法。少量のシードタスクから大量の多様な指示・応答ペアを生成し、そのデータで自己改善ファインチューニングを行う。
Self-Instructは、LLM自身を利用して指示-応答ペアのデータセットを自動生成し、そのデータで同じモデルまたは別のモデルをInstruction Tuningする自己学習フレームワークである。
LLM自身を使って指示データを自動生成するフレームワーク。Wang et al. 2022年提案。少数のシードタスクからLLMが新たな指示・入力・出力を生成し、品質フィルタリング後に自分自身のファインチューニングに使う。
2024年成熟Self-Instruct・Industry-leading LLM self-bootstrap instruction generation + Industry-leading 175 seed → 52K instructions + Industry-leading Alpaca + Vicuna basis + Industry-leading Wang+Mishra+Khashabi Yizhong Wang UW Self-Instruct synthetic instruction generation 2024。
2022年Wang et al. + University of Washington発表Self-Instruct paper・Industry-leading Self-Instruct LLM data augmentation paradigm + Industry-leading LLM self-generated instruction tuning data + Industry-emerging Self-Instruct Pioneer。
2022年Yizhong Wang et al. (UW+AI2)発表Self-Instruct・Industry-leading self-generated instruction dataset + Industry-leading 52K instructions GPT-3 generated + Industry-leading synthetic instruction tuning foundation + Industry-leading subsequent Alpaca/WizardLM foundation。
LLM自身に多様な指示(Instruction)と応答のペアを自動生成させ、それをInstruction Tuningの訓練データとして再帰的に活用する手法。Wang et al.(2023)が提案し、175件のシードタスクからGPT-3で52K件の指示データを生成してAlpacaの訓練に成功した。
2024年1月Texas A&M + Amazon発表Self-Extend・Industry-leading training-free long context extension + Industry-leading grouped attention + Industry-leading no fine-tuning + Industry-leading Self-Extend training-free long context extension 2024。
同一プロンプトから多数のChain-of-Thought推論パスをサンプリングし、多数決により最終回答の一貫性・精度を高めるデコーディング手法。
2024年成熟Self-Consistency・Industry-leading majority voting CoT sampling + Industry-leading 17.9% MATH improvement + Industry-leading Wang+Wei+Schuurmans Google Self-Consistency CoT enhancement 2024。
2022年Wang et al. + Google発表Self-Consistency paper・Industry-leading Self-Consistency sampling + voting paradigm + Industry-leading multiple CoT + voting + Industry-emerging Self-Consistency Pioneer。
Chain-of-Thoughtを複数回生成し多数決で最終答えを決定するデコーディング戦略。Wang et al.(2022)提唱で、単一CoTより一貫して高精度を達成。GSM8Kで+17ptの改善を報告。
Self-Consistencyサンプリングとは、Self-Consistency手法において複数の推論パスを生成するための確率的デコーディングプロセスである。温度パラメータ(temperature)、top-k、top-pなどのサンプリング制御パラメータを適切に設定し、同一プロンプトから多様かつ質の高い推論経路を生成する。サンプル数nの選択は精度とコストのトレードオフであり、Wang et al.(2022)の実験ではn=10〜40で最良の費用対効果が得られた。
Self-Consistency推論パスとは、Self-Consistency手法における個々の推論経路(reasoning path)とその集約メカニズムを指す。各推論パスはChain-of-Thought(CoT)形式の中間ステップと最終回答で構成され、同一問題に対して異なる推論戦略・計算順序・論理展開を経由する。集約は最終回答に対する多数決(majority voting)が標準だが、重み付き投票やクラスタリングベースの手法も研究されている。