Alibaba Qwen が 2026 年公開した次世代コーディング特化 LLM。Qwen3 Coder の後継としてエージェント駆動コード生成と長文コードベース理解を強化、Devstral/Claude Code と競合する OSS コーダーモデル。
Qwen3 Coder Next は、中国 Alibaba の Qwen チームが 2026 年に公開した次世代コーディング特化大規模言語モデルです。Qwen3 Coder 30B / 480B シリーズの後継として位置付けられ、エージェント駆動のコード生成・修正・テスト実行能力と、長文コードベース全体を一度に把握できる長文コンテキスト処理を強化しています。
ライセンスは Apache 2.0 で商用利用可能、Hugging Face にウェイトが公開されており、リリース後数日で LM Studio・Ollama・vLLM・llama.cpp などの主要推論ランタイムで動作するようになりました。Cline・Aider・Continue・OpenHands といった自律コーディングエージェントの「OSS 推奨モデル」として広く採用されています。
| モデル | パラメータ | SWE-Bench | コンテキスト | ライセンス |
|---|---|---|---|---|
| Qwen3 Coder Next 32B | 32B | 53% | 1M | Apache 2.0 |
| Qwen3 Coder Next 480B | 480B/35B | 60% | 1M | Apache 2.0 |
| Devstral Small 2 | 24B | 50%+ | 32K | Apache 2.0 |
| Claude Sonnet 4.6 | 非公開 | 65% | 200K | 商用 |
| GPT-5 | 非公開 | 70% | 256K | 商用 |
32B Dense モデルは 4bit 量子化(Q4_K_M)で約 19GB、RTX 4090 / 5080 / Mac mini M4 Pro 64GB クラスで動作します。480B MoE モデルは 4bit でも 270GB 級のメモリが必要なため、Mac Studio M3 Ultra 256GB 構成や 8× H100 などが必要となり、個人ユーザーには 32B 版が現実的です。
1M コンテキストを使う場合、KV キャッシュに追加で 20-30GB のメモリが必要なため、64GB 以上の UMA や VRAM が望まれます。Cline・Aider との組み合わせでは、量子化後の応答速度が体感品質に直結するため、可能なら 8bit 量子化以上を推奨します。
Q1: Cline / Aider との連携設定は? A: LM Studio で OpenAI 互換エンドポイントを起動し、モデル ID に qwen3-coder-next を指定。Cline の Provider に LM Studio を選択するだけで動作します。
Q2: 480B MoE 版は個人で動かせますか? A: 4bit 量子化でも 270GB 級必要なため、Mac Studio M3 Ultra 256GB 構成や Threadripper PRO + マルチ GPU の高額機が必要です。32B Dense 版で十分なケースが大半です。
Q3: 日本語コメント生成の品質は? A: 中国語・日本語ともネイティブクラスの品質で、コードコメントや README 自動生成にも実用的に使えます。