Mistral AI が 2025 年 12 月公開したエージェント特化型コーディング LLM。SWE-Bench Verified で高スコア、Aider/Cline/Continue 等の自律コーディングエージェント用途向けに最適化された 24B 級軽量オープンモデル。
Devstral Small 2(モデル ID: devstral-small-2-2512)は、フランス Mistral AI が 2025 年 12 月に公開した第 2 世代のエージェント特化型コーディング LLM です。初代 Devstral(2025 年 5 月公開、Devin オールヨーロッパ版を意識した名称)を引き継ぎ、自律コーディングエージェントとの統合運用に特化したチューニングが施されています。
24B クラスのパラメータ数で、SWE-Bench Verified(GitHub の実バグ修正タスクをベンチマーク化したもの)で 50% 超のスコアを達成し、Claude 3.5 Haiku 級の性能をオープンウェイトで提供しています。Cline・Aider・Continue・OpenHands といった代表的な OSS 自律コーディングエージェントが、Devstral Small 2 を「ローカル運用時の推奨モデル」として明示的にサポートしています。
| モデル | パラメータ | SWE-Bench | コンテキスト | ライセンス |
|---|---|---|---|---|
| Devstral Small 2 | 24B | 50%+ | 32K | Apache 2.0 |
| Qwen3 Coder Next | 32B | 53% | 128K | Apache 2.0 |
| Claude 3.5 Haiku | 非公開 | 50% | 200K | 商用 |
| GPT-4o mini | 非公開 | 32% | 128K | 商用 |
| Codestral 22B | 22B | 35% | 32K | Mistral License |
Devstral Small 2 を Cline / Aider と組み合わせて自作機で動かす場合、4bit 量子化(Q4_K_M で約 14GB)の推奨環境は RTX 4090(24GB)・RTX 5080(16GB)・Mac mini M4 Pro(64GB UMA)などです。LM Studio v0.4 系で公式 GGUF / MLX 版が即動作し、llama.cpp や vLLM も対応しています。
エージェント用途では推論速度が体験を大きく左右するため、可能であれば 8bit 量子化や FP16 全精度で動かすのが理想です。Mac Studio M3 Ultra(64GB+ UMA)や RTX 5090(32GB VRAM)があれば FP16 で 30-50 tok/s が出ます。
Q1: Cline と Devstral 2 の組み合わせはどう設定しますか? A: LM Studio で OpenAI 互換 API(http://localhost:1234/v1)を起動し、Cline の API Provider に「LM Studio」を選択、モデル ID に devstral-small-2-2512 を指定するだけです。
Q2: Claude Sonnet と比較してどうですか? A: SWE-Bench スコアでは Claude Sonnet 4.6 が上(約 65%)ですが、ローカル無料運用と Apache 2.0 ライセンスは Devstral 2 ならではの利点です。
Q3: 24GB VRAM 1 枚で実用的に動きますか? A: 動きます。Q4_K_M 量子化で 14GB、Cline のシステムプロンプト+履歴を含めても 20GB 程度で収まり、RTX 4090 で 35-50 tok/s 出ます。