LLMが自然言語の指示やコードコンテキストからプログラムコードを自動生成する技術。GitHub CopilotやCursor、Claude Codeなど開発支援ツールの中核機能。
AIコード生成は、大規模言語モデル(LLM)を用いて自然言語の指示やコードの文脈からプログラムコードを自動的に生成する技術です。開発者がコメントや関数名を書くだけで実装コードが提案される「コード補完」から、仕様書レベルの記述から完全なアプリケーションを構築する「コード合成」まで、幅広い粒度で応用されています。
エディタ上でリアルタイムに次の数行〜数十行のコードを予測・提案する方式です。GitHub Copilot が代表例で、開発者のタイピングに追従して候補をゴースト表示します。
| 製品 | ベースモデル | 特徴 |
|---|---|---|
| GitHub Copilot | GPT-4o / Claude | VSCode/JetBrains統合、インライン補完 |
| Cursor | Claude / GPT-4o | エディタ組込、Tab補完+チャット |
| Supermaven | 独自モデル | 超低レイテンシ(50ms以下)補完 |
| Codeium | 独自モデル | 無料プラン、70言語対応 |
自然言語で「〜する関数を書いて」と指示し、モデルが完全なコードブロックを返す方式です。Claude Code や ChatGPT の Code Interpreter が該当します。
LLMがファイル読み書き・テスト実行・デバッグを自律的に繰り返す方式です。SWE-Bench で評価される最新のアプローチで、Claude Code のエージェントモードや Devin、OpenAI Codex がこのカテゴリに属します。
GitHubなどのオープンソースリポジトリから収集した大量のコードコーパスで学習します。StarCoder 2 は The Stack v2(67万リポジトリ・619言語)、Code Llama は公開コード 500B+ トークンで事前学習されています。
コードの前後を与えて中間部分を予測する学習方式です。インライン補完に不可欠な能力で、通常のLeft-to-Right生成では得られません。
[PREFIX] def calculate_tax(price, rate):
[SUFFIX] return result
[MIDDLE] → result = price * rate # モデルが生成
自然言語の指示に従ってコードを生成する能力を強化します。人間のフィードバック(コードの正確性・可読性・安全性)で報酬モデルを訓練し、PPO や DPO で最適化します。
| ベンチマーク | 評価内容 | 代表スコア (2026) |
|---|---|---|
| HumanEval | 164の関数生成問題 | Claude 4: 92.8% |
| MBPP | 974の基本プログラミング問題 | GPT-4o: 91.2% |
| SWE-Bench Verified | 実際のGitHub Issue解決 | Claude Code: 72.7% |
| LiveCodeBench | 新規競プロ問題(データ汚染防止) | o3: 82.1% |
| Aider Polyglot | 多言語コード編集 | Claude Sonnet 4: 72.9% |
学習データにGPLやAGPLコードが含まれる場合、生成コードにもライセンス義務が波及する可能性があります。GitHub Copilot は学習元コードと完全一致する出力をブロックする機能を提供しています。
LLMはSQLインジェクションやXSSに脆弱なコードを生成する場合があります。生成コードをそのまま本番投入せず、セキュリティレビューを経ることが重要です。
存在しないAPIやライブラリ関数を自信を持って生成することがあります。特に最新のフレームワークやマイナーなライブラリでは、ドキュメント検索(RAG)との併用が効果的です。
現時点ではNoです。AIは定型的なボイラープレートコードや単体関数の生成に優れますが、アーキテクチャ設計、ビジネスロジックの判断、レビュー、運用監視など人間の判断が不可欠な領域は広大です。開発者の生産性を2〜3倍に高めるツールとして位置づけられています。
Python、TypeScript、JavaScript は学習データが豊富で最も高精度です。Rust、Go、Kotlin も品質が向上しています。COBOLやFortranなど学習データが少ない言語では精度が下がります。
主要サービスはビジネスプランでコードを学習に使用しない契約を提供しています。GitHub Copilot Business/Enterprise、Cursor Business はいずれもユーザーコードの学習利用をオプトアウトできます。