1000億個のトランジスタを搭載したインテルのXe-HPC GPU「Ponte Vecchio」が登場

1000億個のトランジスタを搭載したインテルのXe-HPC GPU「Ponte Vecchio」が登場

ソース:Tom's Hardware

シェア

インテルは、社内外の製造能力を活用するIDM 2.0戦略を発表した数時間後に、スーパーコンピュータ向けのXe-HPC GPU「Ponte Vecchio(ポンテ・ベッキオ)」の詳細な説明をアップロードしました。Ponte Vecchioは、インテル社、サムスン社、TSMC社が製造するコンポーネントを様々なプロセス技術で採用しており、インテル社の未来のビジョンを可能な限り表現しています。

インテルのコードネーム「Ponte Vecchio」は、Xe-HPCマイクロアーキテクチャーをベースにした同社初のGPUであり、当初はインテルの次世代Xeon Scalable「Sapphire Rapids」プロセッサとともに、アルゴンヌ国立研究所のスーパーコンピュータ「Aurora」に採用される予定です。このマシンは、1エクサフロップス以上のFP64性能を備えた業界初のスーパーコンピューターの一つとなります。

今後、この部品は他の顧客にも提供され、インテルはこの部品をカスタマイズするかもしれません。Ponte Vecchioは、複雑なプロセッサーに対するインテルの新しいアプローチであるDisaggregated Modular Architecture(分解型モジュール・アーキテクチャー)を採用しているため、比較的容易にカスタマイズできるでしょう。

実際、Ponte Vecchioは、47個のコンポーネント、1,000億個以上のトランジスタを搭載し、ペタフロップス級のAI性能を発揮する巨大なプロセッサーであるため、モノリシックに作ることは不可能です(詳細は後述)。

Ponte Vecchioには、以下のようなタイル/チップレットが含まれています。

  • インテル社の10nm SuperFinテクノロジーで製造された2つのベースタイル
  • 当初はTSMCが製造し、その後、インテルの7nm技術が量産(HVM)の準備が整った時点でインテルが製造する16個のコンピュートタイル。
  • インテルの10nm Enhanced SuperFinプロセスを用いて製造された8個のランボー・キャッシュ・タイル
  • インテル社製EMIBリンク11個
  • ファウンドリが製造した2個のXe Link I/Oタイル
  • DRAMメーカーが製造した8個のHBMメモリスタック

現在、インテルはPonte Vecchio Xe-HPC GPUをラボでのみ使用しています。モジュラーデザインを採用しているため、多かれ少なかれコスト効率よく構築することができるが、デザインのサーマル、電圧、周波数を調整するのは厄介であり、時間がかかるだろう。

インテルのPonte Vecchioの説明で興味深いのは、チップメーカーが「PetaFLOPSクラスのAI性能」を提供すると言っていることです。AIのワークロードには、異なる計算精度を必要とするものが数多くあります。

インテルは通常、FP16をAIに最適な精度と考えているため、同社がPonte Vecchioを「手のひらサイズのペタフロップス級AIコンピューター」と表現しているのは、このGPUが約1PFLOPSのFP16性能、または1,000TFLOPSのFP16性能を備えていることを意味しているのかもしれません。ちなみに、Nvidia社のコンピュートGPU「A100」は、約312TFLOPSのFP16性能を備えています。

アルゴンヌ国立研究所のスーパーコンピュータ「Aurora」は2022年の予定です。

関連ニュース

みんなの自作PC

さらに表示