Mistral AI が 2025 年 9 月公開した推論特化型 LLM。Chain of Thought を内蔵化し、数学・コード・論理推論ベンチで大型モデルに匹敵する性能を 24B クラスのオープンウェイトで実現。
Magistral Small は、フランス Mistral AI が 2025 年 9 月にリリースした推論特化型(Reasoning Model)大規模言語モデルです。OpenAI o1(2024 年 9 月)・DeepSeek R1(2025 年 1 月)に始まる「Chain of Thought 内蔵モデル」の系譜に位置し、追加のプロンプト指示がなくとも多段推論を内部で展開してから最終回答を出力します。
24B クラスのパラメータ(Mistral Small 系のフォーク)で構築されており、AIME 2024 / MATH-500 / GPQA Diamond / Codeforces のような推論ベンチマークで GPT-4o 級・Claude 3.5 Sonnet 級のスコアを達成しました。Mistral La Plateforme での API 提供と、商用ライセンスでのオープンウェイト配布の両方が用意されており、ローカル環境でも動作します。
| モデル | パラメータ | AIME 2024 | MATH-500 | ライセンス |
|---|---|---|---|---|
| Magistral Small | 24B | 50% | 80% | Mistral RL |
| Magistral Medium | 非公開 | 65% | 88% | 商用 API |
| DeepSeek R1 | 671B/37B | 79% | 95% | OpenWeight |
| OpenAI o1 | 非公開 | 83% | 96% | 商用 API |
| Claude 3.5 Sonnet | 非公開 | 35% | 78% | 商用 API |
24B クラスのため、4bit 量子化(Q4_K_M)で約 14GB の VRAM/メモリが必要です。RTX 4090 24GB / RTX 5080 16GB / Mac mini M4 Pro 64GB クラスで動作します。Reasoning モデルは内部で長い思考過程を生成するため、出力トークン数が通常モデルの 3-10 倍になり、推論時間も長くなる点に注意が必要です。
ローカルで動かす場合は、可能なら 8bit 量子化以上で動作させ、推論速度を確保することを推奨します。Mac Studio M3 Ultra(64GB+ UMA)があれば、FP16 全精度で 30-40 tok/s が出ます。
Q1: Reasoning モデルとは何ですか? A: 内部で多段の思考過程(Chain of Thought)を展開してから最終回答を出すモデルです。数学・論理・複雑な推論タスクで通常モデルより精度が大幅に高くなります。
Q2: 通常 LLM との使い分けは? A: 単純なチャットや要約には Mistral Small / Llama 3.3 などの通常 LLM、AIME のような難易度の高い問題には Magistral Small が向きます。
Q3: 商用利用は可能ですか? A: Mistral Research License は研究・非商用のみです。商用利用には Mistral La Plateforme の API か商用契約が必要です。