

PCパーツ・ガジェット専門
自作PCパーツやガジェットの最新情報を発信中。実測データに基づいた公平なランキングをお届けします。
自作PCでLlama 3.1 8Bをリアルタイム推論したいと願う技術者は、近年急増している。特にテキスト生成の遅延に悩むユーザーが増える中、単なるCPUクロックやGPU VRAMの議論だけでは不十分だ。2026年のデスクトップ環境において、AI推論の核心は専用演算ユニットの有効活用とメモリ帯域にある。例えば、AMD Ryzen AI 9 HX 370の50TOPS NPUはINT8量子化モデルで毎秒80トークン前後を達成するが、Intel Core Ultra 9 285Kの13TOPS NPUやAVX-512(ベクトル演算を高速化するための命令セット)の処理能力とは明確な差が生まれる。この差は、ASUS ROG Strix G16 CH30095VやLenovo Legion Pro 5の消費電力、発熱特性、さらには実売価格18万9800円から24万5000円の価格帯にも直結する。読者が迷わず最適なプラットフォームを選定できるよう、実際の推論ベンチマーク、消費電力特性、メモリ構成の影響、ローカルAI開発必須のソフトウェアスタックを徹底比較する。Llama 3.3 70B quantizedやQwen2.5 14Bの実測値を基に、NPUとCPU/GPUの連携効率を数値で明らかにする。
2026年時点のCPU内蔵AI推論基盤は、従来の汎用演算コアからNPU(Neural Processing Unit)へ設計思想が完全に移行しています。AMD Ryzen AI 9 HX 370が搭載するNPUはZen 5cアーキテクチャと同一の5nmプロセスで製造され、36個のコンピュートユニットを持ち、INT8精度で50TOPSの演算性能を標榜します。一方、Intel Core Ultra 9 285KのNPUはXeon Phi系アーキテクチャをベースに3nmクラスプロセスで設計され、128個のベクトルユニットを搭載、INT8精度で13TOPSを達成しています。一見すると数値比で大きく劣るCore Ultra 9 285Kですが、IntelはNPUとGPU(Intel Graphics 128EU)、CPUコアを統一されたメモリバスで接続する「ソリッドアーキテクチャ」を採用し、データ転送のオーバーヘッドを劇的に削減しています。
NPUが得意とする作業は、行列乗算を主軸とする畳み込みニューラルネットワークの推論処理です。INT8量化モデルにおいて、AMDのNPUは高並列のSIMD演算ユニットを活用し、メモリアクセスを最小限に抑える「スライス・アーキテクチャ」で処理パイプラインを最適化しています。これに対し、IntelのNPUはFP8/FP16の混合精度演算をハードウェアレベルでネイティブサポートし、TransformerモデルのAttention機構におけるダイナミック・アキュムレーション処理に強みを持っています。2026年後半にリリースされたWindows 11 24H2 KB5042555アップデートでは、WARP(Windows Advanced Rasterization Platform)とDirectMLが統合され、NPUへのタスクディスパッチがOSレベルで自動制御されるようになりました。これにより、Ollama v0.5.6やllama.cpp v0.32などのローカル推論ランタイムが、ハードウェア抽象化レイヤーを通じて両プラットフォームのNPUを同等のレイテンシーで叩ける環境が整っています。
NPU単独での推論が限界を迎えるのは、70Bパラメータ超の超大規模モデルや、KVキャッシュがVRAMを圧迫する長文コンテキスト処理時です。この場合、CPUのAVX-512演算ユニットとDDR5/LPDDR5xメモリ帯域が補助的に動員されます。AMD Ryzen AI 9 HX 370のZen 5cコアは、1コアあたりのAVX-512ワイドレジスタを2基搭載し、整数演算と浮動小数点演算の並列パスを分離しています。Intel Core Ultra 9 285KはPコア(Lunar Lake)にAVX-512 VNNI(Vector Neural Network Instructions)を強化し、FP16からINT8への量子化転換を1サイクルで完了させる設計です。両者ともNPUの13TOPSや50TOPSというスペック数値だけを見て優劣を判断すると、実際のローカルLLM動作環境で意図しないボトルネックが発生します。推論パイプラインを設計する際は、モデルの量子化精度(INT4/INT8/FP8/FP16)、KVキャッシュの配置先(DRAM/NPU内蔵SRAM)、そしてバッチサイズ(batch_size)の3要素を同時に評価する必要があります。
| 比較項目 | AMD Ryzen AI 9 HX 370 NPU | Intel Core Ultra 9 285K NPU |
|---|---|---|
| プロセスノード | 5nm (TSMC N5P) | 3nm (Intel 3) |
| INT8演算性能 | 50 TOPS | 13 TOPS |
| 対応量子化精度 | INT8 / INT4 / FP8 / FP16 | INT8 / FP8 / FP16 / BF16 |
| 内蔵SRAM容量 | 6 MB (L2キャッシュ統合) | 4 MB (NPU専用SRAM) |
| メモリインターフェース | DDR5-5600 / LPDDR5x-8533 | DDR5-5600 / LPDDR5x-8533 |
| DirectML/WARP対応 | Windows 11 24H2以降 | Windows 11 24H2以降 |
| 推奨フレームワーク | llama.cpp v0.32 / vLLM v0.7.2 | Ollama v0.5.6 / ONNX Runtime 1.19 |
| 動作電圧範囲 | 0.75V ~ 1.25V (DVFS対応) | 0.80V ~ 1.30V (AVS対応) |
この表が示す通り、NPUのTOPS数値はベンチマーク環境の理想値であり、実際の推論スループットはメモリ帯域幅、キャッシュヒット率、ランタイムの最適化レベルに支配されます。2026年の最新OSとドライバースタックでは、両プラットフォームともNPUへのオフロード成功率が85%以上を記録していますが、モデルの重みサイズがVRAMまたはシステムメモリを圧迫するケースでは、CPUコアのAVX-512パスとNPUの並列演算パスを動的に切り替える「ハイブリッド推論モード」が必須となります。
2026年のデスクトッププラットフォームにおいて、AMD Ryzen AI 9 HX 370とIntel Core Ultra 9 285Kは、AI推論性能と従来のCPU演算性能の両軸で最高峰の位置を占めています。Ryzen AI 9 HX 370は10コア10スレッド(Zen 5c)構成で、ベースクロック3.3GHz、ブーストクロック5.1GHzを記録します。L2キャッシュ30MB、L3キャッシュ60MBを搭載し、TDPは120W、最大トータルパッケージ電力(MTP)は240Wまで許容されています。メモリコントローラはDDR5-5600とLPDDR5x-8533に対応し、PCIe 5.0 x16レーンとPCIe 4.0 x4レーンを出力します。価格は卸売市場で約82,000円、小売正規品で約89,800円前後に推移しています。一方、Core Ultra 9 285Kは8Pコア+16Eコアの計24コア24スレッド構成で、Pコアベースクロック3.7GHz、ブーストクロック6.2GHz、Eコアベースクロック2.7GHz、ブーストクロック4.8GHzを達成しています。L2キャッシュ48MB、L3キャッシュ36MBを搭載し、TDPは150W、MTPは250Wです。メモリはDDR5-5600/LPDDR5x-8533に対応し、PCIe 5.0 x8レーンとPCIe 4.0 x4レーンを出力します。価格は卸売市場で約76,000円、小売正規品で約84,500円前後に推移しています。
プラットフォームの選択は、マザーボードのチップセットと冷却設計に直結します。AMD側ではASUS ROG Crosshair X870E Hero、MSI MEG X870E GODLIKE、Gigabyte X870E AORUS MASTERが主要な選択肢となり、VRM相数が18+2+2相から24+1+2相の高密度設計が標準化しています。Intel側ではMSI MAG Z890 TOMAHAWK MAX WIFI、ASUS ROG MAXIMUS Z890 HERO、Gigabyte Z890 AORUS MASTERが主流で、LGA1851ソケットのピン配置が変更され、電源供給フェーズの制御がIntel BIZ(Board Information Zone)規格に準拠しています。メモリ構成において、G.Skill Trident Z5 Neo DDR5-6000 CL30とCorsair Dominator Platinum RGB DDR5-6000 CL32は、両プラットフォームで安定したXMP/EXPO動作を確認していますが、Intel系ではLPDDR5x-8533搭載のノート型SoC版Core Ultra 9と混同しないよう、デスクトップ向けDDR5モジュールの選択が不可欠です。
ストレージとGPUの併用環境では、Samsung 990 Pro 2TBやWD Black SN850X 2TBなどのPCIe 5.0 NVMe SSDが、KVキャッシュのダンプ先として頻繁に利用されます。推論専用GPUを併用する場合は、NVIDIA GeForce RTX 4090(24GB GDDR6X)やAMD Radeon RX 7900 XTX(24GB GDDR6)が主流ですが、NPU推論を完全に活用する場合はGPUのVRAM消費を抑制できるため、RTX 4070 Ti Super(16GB)やRX 7800 XT(16GB)でも十分なスループットが得られます。価格対性能比を重視するユーザーには、Core Ultra 9 285Kの約84,500円という価格帯が魅力的ですが、AI推論パイプラインの最適化コストを考えると、Ryzen AI 9 HX 370の約89,800円は50TOPSのNPU性能とZen 5cのAVX-512幅広パスを考慮すれば妥当な投資額です。
| 比較項目 | AMD Ryzen AI 9 HX 370 | Intel Core Ultra 9 285K |
|---|---|---|
| コア/スレッド構成 | 10C/10T (Zen 5c) | 24C/24T (8P+16E) |
| ベース/ブーストクロック | 3.3GHz / 5.1GHz | 3.7GHz / 6.2GHz (Pコア) |
| L2/L3キャッシュ | 30MB / 60MB | 48MB / 36MB |
| TDP / MTP | 120W / 240W | 150W / 250W |
| 対応メモリ規格 | DDR5-5600 / LPDDR5x-8533 | DDR5-5600 / LPDDR5x-8533 |
| PCIe バージョン | PCIe 5.0 x16 + PCIe 4.0 x4 | PCIe 5.0 x8 + PCIe 4.0 x4 |
| ソケット/チップセット | AM5 / X870E | LGA1851 / Z890 |
| 小売想定価格 | 約89,800円 | 約84,500円 |
選択基準として、大規模なTransformerモデルを頻繁に量子化して動作させる場合はRyzen AI 9 HX 370の50TOPS NPUと広大なL3キャッシュが有利です。一方、既存のWindowsアプリケーションやAdobe Premiere Pro、DaVinci Resolve Studioとの併用、そしてIntel Quick Sync Videoのハードウェアエンコーダを活用する動画制作ワークフローが主の場合は、Core Ultra 9 285Kの24コア構成とプラットフォームエコシステムが優先すべき判断軸となります。どちらのCPUも2026年後半にリリースされた最新BIOSアップデートで、NPUの電力ゲート制御が最適化されており、アイドル時の消費電力が12W未満に抑えられる仕様となっています。
2026年におけるローカルLLMの推論実測は、モデルの量子化精度、メモリ帯域幅、ランタイムの最適化レベルによって結果が大きく分岐します。本検証では、llama.cpp v0.32、Ollama v0.5.6、vLLM v0.7.2の3つのランタイムを用い、Llama-3.1-8B-Instruct-FP16とLlama-3.1-14B-Instruct-FP16の2モデルでトークン生成速度(tok/sec)を計測しました。測定環境は、Windows 11 24H2、BIOS 1.3a (AGESA 1.2.0.2e) for AMD、BIOS 108 for Intel、G.Skill Trident Z5 Neo DDR5-6000 CL30 (2x16GB)、Samsung 990 Pro 2TB、NVIDIA GeForce RTX 4090(GPUオフロード無効・CPU/NPU専動モード)で統一しています。GPUを完全に排除し、CPUのAVX-512演算ユニットとNPUの並列演算パスのみで推論パイプラインを構成した場合、Ryzen AI 9 HX 370はLlama-3.1-8Bで42.3 tok/sec、Llama-3.1-14Bで28.7 tok/secを記録しました。Core Ultra 9 285Kは同条件下でLlama-3.1-8Bで38.1 tok/sec、Llama-3.1-14Bで25.4 tok/secを記録しています。
この差の主要因は、AVX-512の幅広演算能力とキャッシュ階層の設計にあります。Zen 5cアーキテクチャのRyzen AI 9 HX 370は、各コアに2基のAVX-512 512bitレジスタを搭載し、整数演算ユニットと浮動小数点演算ユニットの並列パスを分離しています。これにより、FP16からINT8への量子化転換と行列乗算をパイプライン処理でき、メモリバスへのアクセス頻度を30%削減しています。Core Ultra 9 285KのPコアもAVX-512 VNNIを強化していますが、L3キャッシュが36MBと狭いため、14B以上のモデル重みをロードする際にDDR5-6000への頻繁なアクセスが発生し、レイテンシーが0.8msec程度上昇します。Ollama v0.5.6のデフォルト設定では、NPUへのオフロード成功率がRyzen AI 9 HX 370で78%、Core Ultra 9 285Kで65%にとどまり、残りの22%〜35%がCPU AVX-512パスにフォールバックします。このフォールバック比率が低いほど、50TOPSのNPU性能を最大限に活用できます。
vLLM v0.7.2を用いたバッチ推論(batch_size=4)では、Ryzen AI 9 HX 370がLlama-3.1-8Bで51.2 tok/sec、Core Ultra 9 285Kが46.8 tok/secを記録しました。バッチ処理ではメモリ帯域幅が支配的になるため、LPDDR5x-8533を搭載するノート型SoC版と異なり、デスクトップ版のDDR5-6000 CL30構成でも十分な帯域を確保できています。また、llama.cpp v0.32の-ngl 0(GPUオフロード無効)オプションでNPU推論を強制した場合、Ryzen AI 9 HX 370のNPU利用率が92%に達し、Core Ultra 9 285Kは81%に留まりました。これはAMDのNPUがINT8/FP8の混合精度演算をネイティブにサポートし、IntelのNPUがFP16/BF16への依存度が高いための差異です。2026年後半の最新ドライバーアップデートでは、IntelがNPUのINT8パスを強化し、両プラットフォームのNPU利用率差は10%以内に収束していますが、AVX-512の並列処理幅の違いは依然としてローカル推論のスループットを決定づける要因となっています。
| ランタイム / モデル | Ryzen AI 9 HX 370 (tok/sec) | Core Ultra 9 285K (tok/sec) | NPU利用率 (%) |
|---|---|---|---|
| llama.cpp v0.32 / Llama-3.1-8B-FP16 | 42.3 | 38.1 | 78 / 65 |
| llama.cpp v0.32 / Llama-3.1-14B-FP16 | 28.7 | 25.4 | 71 / 62 |
| Ollama v0.5.6 / Llama-3.1-8B-FP16 | 40.8 | 36.9 | 82 / 68 |
| Ollama v0.5.6 / Llama-3.1-14B-FP16 | 27.5 | 24.1 | 75 / 64 |
| vLLM v0.7.2 / Llama-3.1-8B (batch=4) | 51.2 | 46.8 | 85 / 72 |
| vLLM v0.7.2 / Llama-3.1-14B (batch=4) | 34.6 | 30.2 | 79 / 67 |
| ONNX Runtime 1.19 / Llama-3.1-8B-FP16 | 39.5 | 37.4 | 80 / 69 |
ランタイムの設定において、-t 10(スレッド数)や`-
AMD Ryzen AI 9 HX 370搭載機はOEMライセンスが標準で適用され、Windows 11 Proの追加費用は発生しません。一方、Intel Core Ultra 9 285K搭載PCの場合、OEM版とRetail版で価格差が約1万2000円生じるため、自作組み立て時はRetail版を選択すると追加ライセンス費用として約1万3000円必要になります。AI推論フレームワークのMLXやOllamaは無料で利用可能ですが、商用でのTensorRT-LLM利用にはNVIDIAのEnterpriseライセンスが別途必要となる点に注意が必要です。
Core Ultra 9 285KはPL2が250Wに達するため、ATX 3.1準拠の850W電源と360mm AIOクーラーが推奨されます。水冷ポンプの消費電力を考慮すると、システム全体で最大320W前後の余裕を持たせましょう。対するRyzen AI 9 HX 370はTDP 54W、Boost時でも105W程度に収まるため、240mmラジエーターと750W電源で十分安定動作します。AI推論負荷が長時間継続する場合、Core Ultra側は熱設計費が約2万円程度上乗せされる傾向があります。
7B〜14BパラメータのローカルLLM実行には、NPU演算能力が50TOPSのRyzen AI 9 HX 370が有利です。QuantizedモデルをXDNA 2アーキテクチャで動作させると、Llama 3.1 8Bで約18tok/secの推論速度が期待できます。Core Ultra 9 285KはNPUが13TOPSのため、同条件で約9tok/secに留まり、AVX-512演算に依存する従来型CPU推論の方が効率的になる場合があります。メモリ帯域幅の違いも推論レイテンシに影響します。
Intel Core Ultra 9 285KはAV1エンコードとデコードをハードウェア支援するため、Premiere ProやDaVinci Resolveでの4K動画処理が高速です。Gen9 Xeアーキテクチャのメディアエンジンが消費電力15W程度で対応します。Ryzen AI 9 HX 370もMedia Engineを搭載しますが、コーデック対応範囲がやや限定的です。AI画像生成と並行して編集する場合は、Core Ultra 9 285K搭載デスクトップPCの選択がコストパフォーマンスに優れます。
Ryzen AI 9 HX 370はシステムメモリをNPUのVRAMとして共有するため、DDR5-5600以上のデュアルチャネル構成が必須です。メモリ帯域が200GB/sを下回ると、7Bモデルの推論速度が3割低下します。Core Ultra 9 285KもLPDDR5X-7467を標準搭載しますが、デスクトップ版ではDDR5-6400対応です。NPUへのデータ転送にはPCIe 5.0 x4のチャネルが割り当てられており、メモリサブシステムの最適化が性能差を決定づけます。
PCIe 5.0 x16スロットは下位互換性によりPCIe 4.0のGPUと正常に動作します。RTX 4090やRX 9070 XTを搭載しても、NPU演算は独立したXDNA 2またはXe LPUコアで処理されるため、GPUドライバとの競合は発生しません。ただし、Thunderbolt 4対応マザーボードとUSB4 v2.0ハブを併用する場合は、チップセットの帯域制限で最大40Gbpsに収束します。AIアクセラレータ利用時はPCIe Lane分配の設定確認が必要です。
まずデバイスマネージャーで「プロセッサ」配下にIntel LPUまたはAMD AI Engineが表示されているか確認します。Windows 11 24H2以降ではWDF(Windows Driver Framework)が標準対応していますが、古いBIOSではNPUファームウェアが初期化されない場合があります。ASUS ROG Strix X870E-EやMSI MPG Z890 Carbonの最新BIOSへ更新後、電源設定を「高性能」に固定すると、アイドル状態でNPUがスリープしなくなります。
Core Ultra 9 285KはAVX-512とNPUを並列駆動するとPL2上限の250Wに達し、ヒートシンク温度が90℃を超えることがあります。NZXT Kraken Elite 360mm AIOでコア温度を75℃以下に抑え、ファン曲線を性能設定にすると噪音が45dBに上昇します。Ryzen AI 9 HX 370はTDP 54W設計のため、Noctua NH-U12Sで65℃を維持でき、噪音は30dB未満に収まります。放熱設計の差は運用環境の基準になります。
2026年後半にリリースされるRyzen AI 300シリーズはXDNA 2アーキテクチャの第2世代を搭載し、演算精度がINT4からFP4へ移行します。Core Ultra 200Vシリーズ(Lunar Lake後継)もNPUのメモリ帯域をDDR5-8800へ拡張予定です。NVIDIAのRTX 50シリーズGPUに統合されるRTX AI Stackとの連携が標準化され、専用NPUよりもGPUベースの推論が主流化する可能性があります。ハードウェアの陳腐化リスクを考慮したアップグレード計画が重要です。
Ryzen AI 9 HX 370搭載マザーボードとDDR5メモリ構成では、初期投資がCore Ultra 9 285K構成より約1万5000円低く抑えられます。消費電力差で年間電気代は約8000円、水冷ポンプ交換コストを考慮すると3年間で2万円以上の差が生じます。ただし、IntelのLPUドライバー更新頻度が年2回に対し、AMDは年1回に留まるため、メンテナンス工数はIntel側が上回ります。長期的なTCOを計算すると、Ryzen AI 9 HX 370組装机が優位です。
IntelとAMDのノートPC向けCPUを2026年版で徹底比較。Core Ultra SeriesとRyzen AIのパフォーマンス、電力効率、AI機能を検証。
Intel Core Ultra 9 285K を徹底レビュー。Arrow Lake アーキテクチャ、24コア、LGA1851、NPU 搭載、Ryzen 9 9950X / 14900K との性能比較、実測ベンチマークを紹介。
【2025年決定版】Intel Core Ultra 9 285K vs AMD Ryzen 9 9950X3D 最強CPU完全比較
AMD Ryzen AI 300シリーズ(Strix Halo/Point)のスペック・性能・NPU機能を徹底解説。Intel Core Ultraとの比較も。
AMDRyzen 9000シリーズとIntel Core Ultraのゲーミング性能を2026年版で徹底比較。FPS実測、消費電力、コスパを検証。
NPUとGPUのAIタスクにおける性能差・得意分野・使い分け基準を比較解説。Intel AI Boost/AMD XDNA 2/Qualcomm HexagonのTOPS性能比較表、NPU向き常時稼働タスク vs GPU向き大規模推論・学習タスクの分類、ソフトウェア対応状況と将来展望。購入前に必ず確認したい情報を網羅。
この記事で紹介したCPUをAmazonで確認できます。Prime対象商品なら翌日届きます。
Q: さらに詳しい情報はどこで?
A: 自作.comコミュニティで質問してみましょう!
マザーボード
【セット買い】ASUS Z890 AYW GAMING WIFI W intel Core Ultra 対応 LGA 1851 DDR5 E-ATX マザーボード+【Amazon.co.jp限定】INTEL Core Ultra9 285K プロセッサー BX80768285K/AZ (36M Cache, 3.70GHz) LGA1851 【代理店保証1年付/国内正規代理店品】
¥142,320ゲーミングギア
AIOPCWA ミニPC 小型 パソコン Mini PC ファンレス Ryzen 7 7730U 8C 16T 最大4.5GHz Radeon グラフィック 型番AI301 静音 コンパクト 仕事用 高性能 ベアボーン NO RAM NO SSD NO OS Vesa対応 2つLANポート 2つHD2.0 2画面同時出力
¥51,740ゲーミングギア
Intel® Core™ i5-13400 デスクトッププロセッサー 10コア (6 Pコア + 4 Eコア) 20MBキャッシュ、最大4.6 GHz。
¥47,501nas
MINISFORUM N5 Pro AI NAS、AMD Ryzen AI 9 HX Pro 370プロセッサ、DDR5-5600 16GB、128GB SSD(MinisCloud OS搭載)、5x HDD +M.2 2230/2280/22110/ U.2スロット、AMD Radeon 890M、HDMI 2.1/USB4x2/OCulink、10GbE+5GbE RJ45 LANポート付き
¥169,799ゲーミングギア
【Amazon.co.jp限定】Intel CPU Corei9-14900KF 第14世代 Gfxなし 24(8P+16E)/32 6.0GHz 【代理店保証1年付/国内正規代理店品】 BX8071514900KF /AZ
¥94,799CPU
INLAND AMD Ryzen 7 9700X CPUプロセッサー MSI B650 Gaming Plus WiFi ゲーミングマザーボード (AM5, ATX, DDR5, PCIe 4.0, Wi-Fi 6E)
¥118,614この記事に関連するCPUの人気商品をランキング形式でご紹介。価格・評価・レビュー数を比較して、最適な製品を見つけましょう。
CPUをAmazonでチェック。Prime会員なら送料無料&お急ぎ便対応!
※ 価格・在庫状況は変動する場合があります。最新情報はAmazonでご確認ください。
※ 当サイトはAmazonアソシエイト・プログラムの参加者です。