テスト済み。Windows 11でAMDのCPUキャッシュレイテンシーが最大で12倍遅くなる

テスト済み。Windows 11でAMDのCPUキャッシュレイテンシーが最大で12倍遅くなる

ソース:Tom's Hardware

シェア

私たちは、ゲーム向けベストCPUリストに掲載されている代表的なAMD Ryzenチップのいくつかを、いくつかのゲームベンチマークとターゲットテストにかけ、新たに発表されたWindows 11のバグがAMDのプロセッサでどの程度パフォーマンスを低下させるかを確認しました。

下記の広範なCPUベンチマークでご覧いただけるように、AMDのL3レイテンシーはWindows 10に比べてWindows 11では6倍にもなり、L3バンド幅はWindows 10では12倍にもなることがわかりました。ゲームテストでは、これほど深刻な影響は見られませんでした。あるゲームタイトルでは、Windows 10とWindows 11の最大の違いは7%でしたが、他のゲームタイトルでは、それよりもはるかに小さいものでした。注目すべきは、バグを実際に悪化させた最初のWindows 11アップデートでテストを行ったことです。

AMDが先週発表した、Windows 11のパフォーマンスを低下させる2つのバグをMicrosoftと共同で調査しているという内容は、目を見張るものがありました。特に、AMDによると、バグはWindows 11対応のすべてのAMDプロセッサに影響し、一部のeスポーツタイトルでは最大15%、デスクトップPCアプリケーションでは3~5%、ゲームのパフォーマンスを低下させる可能性があるとのことです。バグは、8コア以上のチップに最も影響を与えるため、CPUベンチマーク階層を支配する12コアのRyzen 9 5900Xにもテストを実施しました。

率直に言って、バグは最悪のタイミングで発生しました。インテルは、強力と思われるAlder Lakeチップの発売を目前に控えており、優位性を取り戻すことができるかもしれません。さらにAMDにとっては、Windows 11にはAlder Lake専用のスケジューラー最適化機能が搭載されるため、レビュアーは新しいOSを使ってテストを行うことになります。そのため、今回のバグによって不公平な比較が行われるのではないかという懸念があります。

2つの深刻なバグがAMDとMicrosoftの両方のQAチームを通過したことは驚くべきことです。L3バグの最初の報告は、数ヶ月前に愛好家がWindows 11のプレリリースビルドをテストした際にフォーラムに現れました。

さらに、AMD社によると、UEFIのCPPC2(Collaborative Power and Performance Control 2)機能(軽度のスレッド処理をチップ上の最速コアに誘導する技術)にも、軽度のスレッド処理を行うアプリケーション(ゲームなど)に影響を与える問題があるとのことです。AMDによると、バグは8コア以上でTDP65W以上のチップで検出されやすいとのことです。

AMDとマイクロソフトは共同で調査を行っており、CPPC2の問題を修正するためのソフトウェア・アップデートと、L3レイテンシーの問題を修正するためのWindowsアップデートが予定されます。AMDによると、両方とも2021年10月(今月)に公開する予定です。(注目すべきは、これらの問題は、マイクロソフトが推奨するVBSとHVCIのセキュリティ設定にまつわるパフォーマンスの問題とは別のものであり、反響を呼んでいるということです。我々は先週、これらの問題をテストしてみた)

これらの修正の基本バージョンは、現在のWindowsのプレビュービルドにすでに含まれますが、まだ最終版ではありません。私たちはWindows 11の問題をテストしており、パッチが一般に公開されたら修正後のテストを行います。

下記のキャッシュレイテンシーと帯域幅の測定結果では劇的な変化が見られますが、テストしたゲームの選択ではそれほど大きな影響は見られませんでした。しかし、AMD社の勧告によると、バグは「測定されたL3キャッシュレイテンシーと機能的なL3キャッシュレイテンシー」の両方に影響を与えることは注目に値します。つまり、マイクロベンチマークで測定した結果は、一部のアプリケーションが受けるパフォーマンスを示すものでもあるのです。当然のことながら、レイテンシーの増加は、一部のAMDプロセッサーやゲーム/アプリケーションに、他よりも大きな影響を与えます。

AMDは、どのアプリケーションやゲームが影響を受けるかについては詳細を明らかにしておらず、同社は当初言及していたeSportsタイトルを削除して勧告を調整します。そのため、影響を受けるゲームに絞ってテストを行うのは少し難しいのですが、キャッシュやInfinity Fabricのテストはもちろんのこと、ゲームのテストも十分に行うことができます。いずれにしても、現時点での状況を検証し、AMDとマイクロソフトがパッチを発行した後に再評価することにします。

Windows 10とWindows 11のゲームパフォーマンスベンチマーク

Windows 11 Pro 23000.258と、Windows 11対応のNvidia 472.12グラフィックス・ドライバー(最新のドライバーはテスト終了後に公開)でテストを行いました。CPUテストと同様に、グラフィックスのボトルネックを最小限に抑えるため、Nvidia GeForce RTX 3090を使用しました。また、解像度は1920x1080にこだわったので、解像度やグラフィックスカードが異なるとバグの影響が変わることに注意してください。

比較対象としてCore i7-11700Kを使用し、OSの変更によって予想される差異の概要を把握しました。しかし、ゲームコードやドライバーは、それぞれのCPUアーキテクチャに対して異なる反応をするため、11700Kでは正確な測定値が得られないことに注意してください。

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

AMD Windows 11 Performance Benchmark Testing

ゲームテストのための優れたベースラインがありません。AMDのWindows 11対応プロセッサはすべて影響を受けており、バグの有無を切り替えることはできません。そのため、パフォーマンスの低下のうち、どの程度を単にOSのリビジョン間の違いやバグのせいにするべきかを判断するのは困難です。1%の差異は一般的に予想される標準偏差に収まるため、意味のある変化ではないことに注意してください。

AMDは、CPPC2のバグ(ブースティング)が8コア以上のチップに最も影響を与えると指摘していますが、これは小型のチップにも影響があることを意味します。さらに、以下のキャッシュテストで分かるように、L3の問題は我々がテストしたすべてのAMDチップに影響を与えています。

AMD社は、オリジナル版のアドバイザリで特にeSportsタイトルを挙げていましたが、Windows 10から11への移行ではProject Cars 3が最も大きなパフォーマンスの低下を招きました。ここでは、Windows 11でRyzen 9 5900Xが7.5%、Ryzen 7 5800Xが5.3%低下していることがわかります。一方、11700Kは1.9%しか落ちません。

5900XはFar Cry 5ベンチマークでも3.9%低下しましたが、5800XはWindows 10と11の両方でほぼ同じレベルのパフォーマンスを発揮しました。さらに、eスポーツタイトルでの影響を見るために「DOTA 2」を、そしてとんでもないフレームレートを押し出すゲームでのパフォーマンスを測定するために「Strange Brigade」を投入しました。5900Xはそれぞれ2.9%と2%低下しましたが、グラフィックカードが200fps以上の性能を発揮しているので、おそらく気づかないでしょう。

Windows 10からWindows 11へのパフォーマンスの変化

Tom's HardwareRyzen 9 5900XRyzen 7 5800XCore i7-11700K
Project Cars 3-7.3%-5.3%-1.9%
Shadow of the Tomb Raider-4.5%--0.8%
Dota 2-2.9%-1.4%-1.85%
Strange Brigade-2.0%-1.2%-0.1%
Red Dead Redemption 2-2.8%--
Far Cry 5+4.1%-+1.74%
Grand Theft Auto V0.3%-0.5%-0.2%

上の図は、パフォーマンスの差分を集計したものです。テストしたゲームの中では5900Xが最もパフォーマンスを低下させますが、ほとんどの差異は非常に小さいものです。AMDの当初の勧告では、一部のeSportsゲームでは10~15%の影響があると指摘されましたが、私たちのテストではそのようなことはありませんでした。ただし、ゲームやアプリケーションによって影響が異なるため、そのような差異が存在しないわけではありません。

それでは次に、L3キャッシュのバグについて詳しく見ていきましょう。

AMD Windows 11 L3キャッシュバグ - レイテンシー

AIDA L3キャッシュレイテンシー測定結果

Tom's Hardware — L3 LatencyWindows 10Windows 11
Ryzen 9 5900X10.5429.23
Ryzen 7 5800X10.7230.18
Ryzen 7 3800X9.5835.34
Core i7-11700K11.7811.78

マイクロソフトは先日、最初のWindows 11パッチを発行しましたが、以下のスライドではっきりとわかるように、実際にはレイテンシーが悪化しました。AIDAユーティリティーと最新バージョンのWindows 11を使って、上記のレイテンシー測定を記録しました。その結果、AMDチップでは約3倍の増加が見られましたが、IntelチップではWindows 10と11の両方で同一のL3測定値が得られました。

AMD Windows 11 Performance Benchmarks

AMD Windows 11 Performance Benchmarks

AMD Windows 11 Performance Benchmarks

AMD Windows 11 Gaming Benchmarks Performance

AMD Windows 11 Performance Benchmarks

AMD Windows 11 Performance Benchmarks

AMD Windows 11 Performance Benchmarks

オンチップキャッシュの基本的な考え方は、頻繁にアクセスされるデータをできるだけ実行コアの近くに置き、パフォーマンスを向上させることです。L3キャッシュは、他のキャッシュ(L1やL2など)よりも低速ですが、容量が大きいため、より多くのデータを保存することができ、ヒットレート(有用なデータがキャッシュに保持される回数)が向上します。L3キャッシュはパフォーマンスにとって非常に重要であり、特にゲームではL3レイテンシーの高さやキャッシュ容量の減少に悩まされることがあります。

上の最初の4枚のスライドは、Chips and CheeseチームのMemory Latencyツールを使用して、AMD Ryzen 5900X、5800X、3800XおよびIntel Core i7-11700Kで行ったキャッシュおよびメモリーレイテンシーのベンチマークの概要です。これらのテストでは、データチャンクのサイズを変えてキャッシュレイテンシーを測定しますが、グラフの中央付近でL3レイテンシーがかなり高くなっているのがよくわかります。実際、最初の2枚のスライドの黒い線でわかるように、最近のWindows 11アップデートによって、この問題はさらに深刻になりました。

これらのより詳細なテストでは、Ryzen 5000チップではL3レイテンシーが約5倍、Ryzen 7 3800Xでは約6倍に増加します。一方、Windows 11では、Core i7-11700Kの方がキャッシュとメモリのレイテンシープロファイルがわずかに優れています。

ベンチマークユーティリティーによって、独自の測定方法、アルゴリズム、およびキャッシュストライドでテストを行うため、結果が異なる場合があることに注意してください。そのため、私たちはSiSoftwareのSandraを使用して、3つの異なるアクセスパターンでキャッシュとメモリのレイテンシを測定し、単一のテストよりも詳細な結果を得て、他のツールで記録した結果を確認しました。最後の3枚のスライドは、5900Xの3つの異なるデータパターンでの結果を示しており、他のテストで見られたものと概ね一致します。

  • シーケンシャルアクセス:ほとんどがTLBにプリフェッチされており、プリフェッチャーの性能を測るのに適します。
  • ページ内ランダム:同じメモリページ内のランダムアクセスを測定します。TLBのパフォーマンスも測定し、ベストケースのランダムパフォーマンスを表します。
  • フルランダム:TLBのヒットとミスが混在しており、ミスの可能性が高いため、最悪のレイテンシーを数値化します。

AMD Windows 11 L3キャッシュバグ - 帯域幅

AMD Windows 11 Performance Benchmark

AMD Windows 11 Performance Benchmark

AMD Windows 11 Performance Benchmark

AMD Windows 11 Performance Benchmark

AMD Windows 11 Performance Benchmark

L3キャッシュの帯域幅に関する最初のテストでは、非常に驚くべき結果が得られました。AIDAの測定によると、Windows 10ではRyzen 7 5900Xの方がL3リード帯域幅が7.5倍、ライト帯域幅が15倍、コピー帯域幅が12倍多く、Ryzen 7 5800Xと3800Xでも同様の結果となりました。注目すべきは、3つの測定項目のうち、アプリケーションのパフォーマンスを示す唯一の測定項目であるコピー帯域幅です。

繰り返しになりますが、ユーティリティーによって方法論が異なるため、帯域幅について異なる見解を得るためにSiSoft Sandraでもテストを行いました。4枚目と5枚目のスライドは、5900XがWindows 11とほぼ同じ帯域幅を提供していることを示しており、方法論の違いを強調します。同様に、ゲームやアプリケーションによっても、そのアクセスパターンに応じてさまざまな影響が出ます。

最後に、SiSoft Sandraのコア間レイテンシーと帯域幅テスト(ベストペアマッチ)を用いて、さまざまなデータタイプでのInfinity Fabricのスループットを測定しました。5800Xの場合、このテストではいくつかのデータタイプでスループットが大幅に低下しており、再現性も高いです。奇妙なことに、8つ以上のコアを持つRyzen 9 5900Xは、予想に反して、同じような一貫性のないパフォーマンスの傾向に悩まされませんでした。

これらの合成テストの結果は悲惨なものですが、正しい見方をしなければなりません。この問題は、これまでにテストしたゲームに限られた影響しか与えませんでした。AMDによれば、L3とCPPC2の両方のバグに対する修正は今月中に行われるとのことで、その影響を測るために再度テストを行う予定です。ご期待ください。

関連ニュース

みんなの自作PC

さらに表示