AIコーディングエージェント × ローカルPC最適環境 2026：Claude Code・Codex CLI・Cursor

2026年現在のAI開発環境において、Claude CodeやCursorをローカルLLMと組み合わせる最適解は「推論能力が必要な複雑なロジック設計」にSonnet 4.6等の高性能モデルを使い、「定型的なリファクタリングや機密性の高いコードの処理」にOllama経由のLlama 3系などのローカルモデルを割り当てるハイブリッド構成です。開発者が直面する「トークンコストの高騰」と「ソースコードの流出リスク」という課題に対し、CursorのComposer機能やCodex CLIを活用しながら、プライバシーと生産性を両立させる具体的なシステム構成を提示します。この記事を読むことで、32GB以上のRAMを搭載したローカルPC環境において、GPU負荷を最適化しながらエージェント型AIをフル活用するための具体的な設定手順と、OpenRouter互換プロトコルを用いたモデルの動的切り替え手法を習得できます。

AIコーディングエージェントとローカルLLMを統合する次世代開発環境の全貌

2026年現在のAI駆動開発において、最適な環境は「Claude CodeやCursor等の高機能エージェント」と「Ollama/LM Studioで稼働するローカルLLM」を、用途に応じて動的に使い分けるハイブリッド構成です。この構成を採用することで、機密情報の漏洩を防ぎつつ、高度な推論が必要なタスクには高性能なクラウドモデル（Claude 3.7/4系等）を割り当てる、生産性とセキュリティの高度な両立が可能になります。

現在の開発環境において重要なのは、単一のツールに依存することではありません。以下の3つのレイヤーで構成されるエコシステムを構築することが推奨されます。

エージェント層（Orchestration）: Claude CodeやCursor、Continueなど、ファイル操作やターミナル実行権限を持つインターフェース。
推論エンジン層（Inference）: Anthropic API、OpenRouter経由のモデル、またはローカル環境で動作するLlama 3.1/4系やDeepSeek等のLLM。
インフラ層（Infrastructure）: NVIDIA GeForce RTX 4090 (24GB VRAM) や Apple M3 Max (64GB+ Unified Memory) を搭載した、推論速度とコンテキスト維持に耐えうるローカルPC環境。

この統合環境を構築することで、エンジニアは「常にネットに繋がっている必要がない定型処理」と「高度な思考が必要なアーキテクチャ設計」をシームレスに切り替えることが可能になります。

Claude Code・Codex CLI・Cursorの機能比較と選択基準

2026年現在の主要プロダクトは、それぞれ異なる役割（ワークフロー）において最適化されており、プロジェクトの規模やセキュリティ要件によって使い分けるのが正解です。結論として、ターミナル操作中心の高速な反復開発にはClaude Code、GUIベースの高度なリファクタリングにはCursor、特定のCLIコマンドとLLMを密結合させる環境ではCodex CLIを選択するのが最適解です。

各ツールの特徴と推奨されるユースケースは以下の通りです。

製品名	主な推論バックエンド	強み・得意な領域	推奨構成例
Claude Code	Anthropic Claude 3.7/4 (Sonnet系)	CLIベースの高速なエージェント動作。ターミナル操作、テスト実行、自動修正に特化。	高速なプロトタイプ開発、CLIツール構築
Cursor	多様なモデル (Claude, GPT-4o等)	IDE統合によるコンテキスト把握（@Codebase）、高度なリファクタリング、GUIでの視覚的な差分確認。	大規模プロジェクトの保守、UI/UX実装
Codex CLI	OpenAI API / ローカルLLM	特定のコマンド操作やスクリプト生成に特化した軽量なインターフェース。	定型作業の自動化、カスタムツールの作成
Continue	自由なAPI連携 (OpenRouter等)	VS Code/JetBrains拡張機能として動作。ローカルLLMとの統合が最も柔軟。	ローカル環境での完全秘匿開発

選択の判断軸は「コンテキストの広さ」と「実行権限の範囲」です。Claude Codeはエージェントとしての自律性が高く、エラーが出た際に自動で修正を試みるループ処理に長けています。一方でCursorは、IDE全体（プロジェクト構造や依存関係）をインデックス化する能力に優れており、広範囲なコード変更が必要な際に威力を発揮します。

ローカルLLM活用におけるハードウェア要件と実装の落とし穴

ローカルLLMをコーディングエージェントと連携させる際、最も注意すべき点は「VRAM（ビデオメモリ）の確保」と「コンテキストウィンドウの維持」です。特にCursorやContinueでローカルLLMを採用する場合、モデルの量子化ビット数と推論速度のバランスを正確に把握する必要があります。

快適な開発体験を実現するための推奨スペックと技術的注意点は以下の通りです。

GPU/VRAMの閾値:
- 70Bクラスの高性能モデル（Llama-3.1-70B等）を実用的な速度で動かすには、最低でも24GB以上のVRAMが必要です。NVIDIA GeForce RTX 4090 (24GB) を搭載した構成、またはマルチGPU環境が推奨されます。
- より軽量なモデル（DeepSeek-Coder-V2-Liteなど）であれば、16GBのVRAMでも十分に動作しますが、コンテキストを長く保持する場合、メモリの断片化による速度低下に注意が必要です。
Unified Memoryの優位性:
- Apple M3 MaxやM4 Maxを搭載したMac環境では、システムメモリをGPUと共有するため、64GB以上の統合メモリがあれば大規模なモデルも高速に動作します。これは特に「Cursor × ローカルLLM」構成において、高精度な推言能力を維持するための強力な選択肢となります。
コンテキストの断絶（Context Loss）:
- ローカルLLMを使用する際、API経由のClaude等と比較してトークン制限が厳しくなることがあります。特にCursorで@Codebase機能を活用する場合、インデックス作成に使用する埋め込みモデル（Embedding Model）をローカルで動かすか、軽量なモデルを選択することで、検索精度の低下を防ぐことができます。

実装上の落とし穴として、「モデルの量子化」と「推論速度（Tokens per second）」の関係があります。4-bit量子化（GGUF/EXL2形式）はメモリを節約しますが、コーディングにおける複雑なロジック生成能力が低下する場合があります。特にエージェント型ツールを使用する場合、推論の正確性が低いと「ループ（同じエラーを何度も繰り返す）」に陥るため、最低でもQ4_K_M以上の量子化品質を選択することが推奨されます。

パフォーマンス・コスト・運用の最適化戦略

実用的な開発環境を構築するには、リソースの動的割り当てと、APIコストの最適化を組み合わせたハイブリッド運用が最も効率的です。すべてのタスクに高コストなClaude 3.7/4を適用するのではなく、定型処理やローカルでの検証にはローカルLLM（Ollama経由）を充て、高度な推論が必要な設計段階のみクラウドへリクエストを送るフローを構築します。

運用の最適化に向けた具体的な戦略は以下の通りです。

ハイブリッド・インテリジェンスの構築:
- ローカル層（Ollama/LM Studio）: ユニットテストの自動生成、ドキュメントの要約、定型的なボイラープレートの作成に使用。モデル例：DeepSeek-Coder-V2, Llama-3.1-8B.
- クラウド層（Anthropic API / OpenRouter）: アーキテクチャ設計、複雑なバグのデバッグ、新規機能の論理構築に使用。モデル例：Claude 3.7 Sonnet.
プロキシと統合によるコスト削減:
- OpenRouterを介することで、CursorやContinueから複数のモデル（Google, Anthropic, OpenAI）へ統一されたエンドポイントからアクセスできます。これにより、特定のプロバイダーの制限を回避しつつ、最も安価で高性能なモデルを動的に選択することが可能になります。
ハードウェア負荷の分散:
- ローカルLLMを実行する際、GPU負荷が高くなるとOS全体の操作やIDEの動作が重くなることがあります。これを防ぐため、推論専用のサーバー（例：RTX 4090搭載のミニPC）をローカルネットワーク内に設置し、Ollama経由でアクセスする「推論オフロード」構成を採用することで、メインの開発機（MacBook Pro等）のパフォーマンスを最大化できます。

推奨される運用フローの比較

項目	ロード型（Cloud-Heavy）	ハイブリッド型（Balanced）	ローカル特化型（Privacy-First）
主なツール	Claude Code + Anthropic API	Cursor + OpenRouter + Ollama	Continue + Local LLM (Ollama)
推論速度	高速（インターネット依存）	中〜高（選択的）	安定（ローカル環境に依存）
データ機密性	低（クラウド送信）	中（選別的な送信）	高（完全な閉域網）
運用コスト	API従量課金（高め）	ハイブリッド（最適化）	ほぼゼロ（電力・初期投資のみ）

この構成を維持するための技術スタックとして、推論サーバーにはvLLMやllama.cppの最新ビルドを採用し、APIブリッジとしてLiteLLMを介在させることで、将来的なモデルの入れ替えやプロトコルの変更にも柔軟に対応できる堅牢なシステムを構築できます。

主要なAIコーディングエージェントとローカルLLMの比較

2026年現在の開発環境において、最適なツール選択は「推論精度（モデル性能）」と「プライバシー・コスト（ローカル実行）」のどちらを優先するかで決まります。Claude Codeのような高度な推論を求めるならクラウドAPI、機密情報の保護や試行錯誤のコストを抑えるならOllama等のローカルLLM環境が最適です。

以下の比較表は、Cursor、Claude Code、Codex CLI、およびContinueといった主要ツールと、それらを支えるローカルLLM基盤の特性を多角的に分析したものです。

1. 主要AIコーディングツールの機能・価格・特徴比較

この表では、エディタ統合型からCLI型まで、開発フローにおける役割の違いを明確にします。

製品名	主な提供形態	推奨LLMモデル	月額費用（目安）	特徴・強み	ターゲット層
Cursor	IDE (Forked VSCode)	Claude 3.5/4, GPT-4o	$20〜 (Proプラン)	エディタ統合、 codebase indexing	プロフェッショナル開発者
Claude Code	CLIツール	Claude 3.7 / 4.x系	API従量課金	高度な推論、ターミナル操作実行	エージェント型を好む層
Codex CLI	CLI / Wrapper	GPT-4o, Gemini 1.5 Pro	API従量課金	ChatGPT APIとの強力な連携	スクリプト自動化重視の層
Continue	Extension (VSCode/JetBrains)	ローカルLLM, Claude等	無料(拡張機能)	ローカルLLMとの高い親和性	自前環境構築派、企業内開発
GitHub Copilot	Extension	GPT-4系 (独自調整)	$10〜30程度	安定した補完、広範なエコシステム	一般的な開発者全般

2. ローカルLLM実行基盤（バックエンド）の比較

CursorやContinueをローカル環境で運用する際、バックエンドとして選択可能なソフトウェアの仕様です。

基盤ソフトウェア	サポートOS	推奨GPUメモリ	主な役割	接続プロトコル	特徴的な機能
Ollama	macOS, Linux, Win	8GB (RTX 3060以上)	ローカルLLM実行	OpenAI互換API	軽量、マルチモデル管理
LM Studio	Windows, macOS	12GB+ (VRAM重視)	GUIによるモデル試行	Local Server機能	量子化モデルの視覚的な選択
vLLM	Linux (推奨)	高スペックGPU	推論エンジンの最適化	高スループットAPI	大規模・同時実行向け
LocalAI	Docker / Linux	任意（構成次第）	APIブリッジ	OpenAI互換	多様なモデルを統合管理
llama.cpp	全プラットフォーム	CPU/GPU問わず	推論エンジン本体	CLI / ライブラリ	極めて高い移植性と軽量性

3. 用途・目的別の最適ソリューション選択マトリクス

開発のフェーズや、プロジェクトの制約条件に基づいた最適な組み合わせを提示します。

優先する要件	推奨エージェント	推奨LLMバックエンド	判断基準（理由）	導入難易度
最高精度の推論	Claude Code	Claude 3.7 / 4 (Cloud)	高度なロジック、リファクタリング	中（API設定）
機密情報の保護	Continue	Llama 3.1 70B (Local)	データ漏洩の防止、閉域網内	高（PCスペック必要）
高速なコード補完	Cursor / Copilot	GPT-4o / Claude系	エディタとのシームレスな融合	低（設定のみ）
カスタムワークフロー	Codex CLI	自社独自モデル(Local)	特定のドメイン知識への最適化	高（開発が必要）
コスト削減（大量生成）	Continue	Mistral / Phi-3 (Local)	試行錯誤の回数が多い場合	中（環境構築）

4. ローカルLLM実行時のハードウェア要件とパフォーマンス比較

ローカルでエージェントを動かす際、モデルサイズとPCスペックの相関関係を示します。

モデル規模	推奨VRAM	推奨メインメモリ	対応解像度/コンテキスト	用途例	期待される処理速度
8Bクラス	8GB	16GB	32k - 128k	コード補完、簡単なリファクタリング	高速（数秒で応答）
30B-70Bクラス	24GB (RTX 3090/4090)	64GB+	64k - 128k	複雑なバグ修正、仕様設計	中速（数秒〜十数秒）
100B+ / MoE	48GB+ (Multi-GPU)	128GB+	128k+	大規模プロジェクトの解析	低速（数十秒以上）
Quantized(Q4_K_M)	16GB程度	32GB	モデル依存	一般的なローカル開発環境	標準的
FP16 (Original)	100GB+	128GB+	高い精度を維持	研究・検証用（非推奨）	低速

5. エージェント連携におけるプロトコルと互換性比較

ツール間の接続方法や、APIの標準化に関する技術的な差異です。

技術要素	OpenAI API (標準)	Anthropic API	Ollama / LocalAI	Google Gemini API
主な採用製品	Cursor, Codex CLI	Claude Code	Continue, OpenRouter	Vertex AI, Gemini API
互換性	非常に高い	高い（専用SDKあり）	高い(OpenAI準拠)	特定のプラグインが必要
コンテキスト量	最大128k程度	200k〜以上	モデル仕様に依存	1M〜2M (Gemini限定)
ストリーミング	対応	対応	対応	対応
ツール呼び出し	強力なサポート	高度なFunction Calling	モデルによる性能差あり	Googleエコシステム内最適

これらの比較から、結論として「最高品質の推論を求めるならClaude Code（Cloud）」「機密保持とコスト効率を両立させるならContinue + Ollama（Local）」という棲み分けが2026年の標準的な選択肢となります。特にローカル環境を構築する場合は、32GB以上のRAMとNVIDIA RTX 40シリーズ以上のGPUを搭載したワークステーションが、快適な開発体験を得るための推奨スペックとなります。

よくある質問

Q1. Claude CodeやCursorを運用する際の推奨メモリ（RAM）容量は？

AIコーディングエージェントを快適に動作させるには、最低でも32GBのメモリ搭載が推奨されます。特にローカルLLM（Ollama等）とClaude Codeを同時に実行する場合、モデルの重み（Weights）をVRAMやメインメモリに展開するため、16GBではシステム全体の動作が不安定になる可能性が高いです。安定した開発体験を得るためには、32GB以上、できれば64GBの構成を選択するのが現在の標準的な推奨スペックです。

Q2. ローカルLLMとクラウド型AI（Claude 3.5/4等）の使い分けはどうすべき？

高度な推論や複雑なリファクタリングにはClaude 3.5/4などの高性能モデルを、定型的なコード生成やプライバシー重視のタスクにはローカルLLM（Llama 3系など）を使用するのが最適です。例えば、Cursorで「プロジェクト全体の構造把握」を行う際はクラウドAPIを使い、個別の関数実装や機密性の高いログ解析を行う際にOllama経由のローカルモデルへ切り替えるハイブリッド運用が2026年現在の主流です。

Q3. ローカルLLMを実行する際の推奨GPUスペックは？

快適な推論速度（トークン/秒）を確保するためには、NVIDIA GeForce RTX 4090（24GB VRAM）以上のグラフィックボードを推奨します。ローカルLLMのモデルサイズが8B（80億パラメータ）であれば16GBのVRAMでも動作しますが、より高度な推論を行う70Bクラスのモデルや、コンテキストウィンドウを広く確保する場合には、複数枚のGPU構成や24GB以上のVRAM容量が必須となります。

Q4. CursorでOpenRouter経由のローカルLLMを利用するメリットは？

OpenRouterを経由することで、Cursorの標準インターフェースを維持したまま、自前サーバーで動くモデルや多様なプロバイダーのAPIを統合して利用できるのがメリットです。これにより、特定のベンダーに依存せず、コスト効率の良い軽量モデルと高性能なClaude/GPT系モデルをシームレスに切り替えることが可能になります。また、独自のプロンプト管理を一元化できる点も開発効率を向上させます。

Q5. Claude Codeを実行する際のネットワーク負荷や制限は？

Claude Code（Sonnet 4.6等）はクラウドAPIを使用するため、実行時に一定の通信が発生しますが、通常のWebブラウジングと同等の帯域であれば問題ありません。ただし、大量のファイルを一括で読み込ませる際や長大なコードを解析させる際は、プロバイダー側のレート制限（Rate Limit）に抵触する可能性があるため、CursorのようなIDE統合型よりもリクエストの制御が重要なポイントとなります。

Q6. Codex CLIやContinueなどのツールは現在も推奨されるか？

2026年現在、Codex CLI自体よりも、より高度なエージェント機能を持つClaude Codeや、広範なプラグインをサポートするContinueが主流です。特にCursorのような統合型IDEの進化が著しいため、特定のCLIツールを選ぶ際は「独自のワークフローに特化しているか」を基準に選定すべきです。一方で、ターミナル操作を頻繁に行うエンジニアには依然としてClaude CodeやCodex系ツールの需要は高いです。

Q7. ローカルLLMのモデルサイズ（8B, 70B等）と推論速度の関係は？

モデルサイズが大きくなるほど推論精度は向上しますが、計算負荷は指数関数的に増加します。例えば、Llama-3-8BクラスであればRTX 4070等のミドルレンジGPUで高速なレスポンスが得られますが、70Bクラスをローカルで実用的な速度（15〜20 tokens/sec以上）で動かすには、A6000やH100などのエンタープライズ向けGPU、あるいはマルチGPU構成が必要となります。

Q8. ローカルLLMの量子化（Quantization）は必須か？

限られたVRAM内で高性能なモデルを動作させるため、4-bitまたは8-bitの量子化（GGUF, EXL2等）は事実上の標準となっており、推奨されます。例えば、70Bクラスのモデルをそのまま動かすには膨大なメモリが必要ですが、4-bit量子化を行うことで品質を維持しつつ、消費メモリを半分以下に抑えることが可能です。[LM Studio](/glossary/udio-music-2024)やOllamaではこのプロセスが自動化されているため、導入のハードルは低くなっています。

Q9. AIエージェントとローカルLLMを組み合わせる際のコスト削減効果は？

継続的に大量のコード生成を行う場合、Claude Code等のAPI利用料（例：10万トークンあたり数ドル）が積み重なるため、頻度の高いタスクをローカルLLMに逃がすことでコストを劇的に抑えられます。特にCursorのサブスクリプションと併用する場合、定型的なドキュメント生成やユニットテストの作成を自前サーバー（Ollama等）で処理することで、API利用枠の節約と開発スピードの両立が可能になります。

Q10. 2026年以降のAIコーディング環境のトレンドは？

「マルチエージェントによる自律型開発」と「ローカル・クラウドの完全なハイブリッド化」が加速します。単一のプロンプトに対する応答だけでなく、Claude Codeのようにツール操作（ファイル作成、コマンド実行）を伴うエージェント機能が標準となり、さらにそれを支える推論エンジンとして、プライバシー保護のためのローカルLLMと高性能なクラウドモデルをシームレスに使い分ける環境がデファクトスタンダードとなります。

まとめ

2026年現在のAIコーディング環境は、クラウドの利便性とローカル実行のプライバシー・コスト効率を高度に使い分けるハイブリッド構成が最適解となります。

Claude Code (Sonnet 4.6)：複雑なリファクタリングや大規模なアーキテクチャ設計など、高い推論能力が必要なタスクに最適。
Cursor × ローカルLLM：OpenRouter互換プロトコルを介し、機密性の高いコードをローカル環境（Ollama等）で処理する構成が実用的。
Codex CLI：[[Cha[tG](/glossary/tgp)PT](/glossary/gpt) APIを活用し、定型的なスクリプト生成や高速なコマンド生成を求める開発者に適した選択肢。
推奨スペック：AIエージェントのコンテキストウィンドウを十分に確保し、マルチタスクを円滑にこなすには32GB以上のRAMとNVIDIA RTX 40シリーズ以降のGPUが必須。
負荷分散の最適化：推論処理をGPUへ、ビルドやインデックス作成などのバックグラウンド処理をCPUへ割り振ることで、開発環境のレスポンスを維持。
ローカルLLMの活用法：Llama 3.x系やMistral系の軽量モデルを特定のタスクに特化させることで、APIコストを抑えつつ高速なフィードバックループを実現。

まずは現在のプロジェクトの機密性と要求される推論精度のバランスを見極め、[Claude CodeとローカルLLMのどちらをメインエージェントに据えるか決定することから始めてください。必要に応じてCursorのカスタム設定を組み込み、自分だけの最強の開発環境を構築しましょう。

ローカルAI・LLMに最適なPCをbuilderで構成しよう

ローカルAI・LLMに最適なPCをbuilderで構成しよう

AIコーディングエージェントとローカルLLMを統合する次世代開発環境の全貌

Claude Code・Codex CLI・Cursorの機能比較と選択基準

この記事に関連するおすすめ商品

この記事を書いた人

自作.com編集部

関連記事

AI PCの技術的基盤と推論アーキテクチャの変遷【2026年版】

高性能ワークステーションのアーキテクチャと技術基盤の基礎【2026年版】

ローカルLLMおよび高度な推論処理を見据えた次世代ワークステーションの基礎【2026年版】｜自作PC構成ガイド

次世代ワークステーションにおけるハイブリッド構造と計算資源の最適化【2026年版】｜PC最適化ガイド

PCIe 6.0 と CXL 3.x が規定する次世代コンピューティング基盤の変遷【2026年版】｜おすすめ構成ガイド

次世代ワークステーション基盤：PCIe 6.0とCXL 3.1によるリソース共有の革新【2026年版】｜自作PC構成ガイド

この記事に関連するおすすめパーツ

Amazon Basics 24 Inch Gaming Monitor, FHD 1080P, 165Hz, VESA Compatible, Adaptive sync, 1ms response

AIコーディングエージェントとローカルLLMを統合する次世代開発環境の全貌

Claude Code・Codex CLI・Cursorの機能比較と選択基準

AI・LLMおすすめランキング TOP10

4〜 その他の人気製品

Amazonでお得に購入

ローカルLLM活用におけるハードウェア要件と実装の落とし穴

パフォーマンス・コスト・運用の最適化戦略

主要なAIコーディングエージェントとローカルLLMの比較

1. 主要AIコーディングツールの機能・価格・特徴比較

2. ローカルLLM実行基盤（バックエンド）の比較

3. 用途・目的別の最適ソリューション選択マトリクス

4. ローカルLLM実行時のハードウェア要件とパフォーマンス比較

5. エージェント連携におけるプロトコルと互換性比較

よくある質問

Q1. Claude CodeやCursorを運用する際の推奨メモリ（RAM）容量は？

Q2. ローカルLLMとクラウド型AI（Claude 3.5/4等）の使い分けはどうすべき？

Q3. ローカルLLMを実行する際の推奨GPUスペックは？

Q4. CursorでOpenRouter経由のローカルLLMを利用するメリットは？

Q5. Claude Codeを実行する際のネットワーク負荷や制限は？

Q6. Codex CLIやContinueなどのツールは現在も推奨されるか？

Q7. ローカルLLMのモデルサイズ（8B, 70B等）と推論速度の関係は？

Q8. ローカルLLMの量子化（Quantization）は必須か？

Q9. AIエージェントとローカルLLMを組み合わせる際のコスト削減効果は？

Q10. 2026年以降のAIコーディング環境のトレンドは？

まとめ

この記事に関連するおすすめ商品

関連記事

AI PCの技術的基盤と推論アーキテクチャの変遷【2026年版】

高性能ワークステーションのアーキテクチャと技術基盤の基礎【2026年版】

ローカルLLMおよび高度な推論処理を見据えた次世代ワークステーションの基礎【2026年版】｜自作PC構成ガイド

次世代ワークステーションにおけるハイブリッド構造と計算資源の最適化【2026年版】｜PC最適化ガイド

PCIe 6.0 と CXL 3.x が規定する次世代コンピューティング基盤の変遷【2026年版】｜おすすめ構成ガイド

次世代ワークステーション基盤：PCIe 6.0とCXL 3.1によるリソース共有の革新【2026年版】｜自作PC構成ガイド

よく読まれている記事

この記事に関連するおすすめパーツ

Amazon Basics 24 Inch Gaming Monitor, FHD 1080P, 165Hz, VESA Compatible, Adaptive sync, 1ms response

AI・LLMおすすめランキング TOP10

4〜 その他の人気製品

Amazonでお得に購入

4〜その他の人気製品

4〜その他の人気製品