AMD、Zen 5コアを搭載するRyzen 9000シリーズやRyzen AI 300シリーズを発表
米AMDは6月4日より台北で開催されるCOMPUTEX TAIPEI 2024の前日の基調講演で、Ryzen 9000シリーズやRyzen AI 3000シリーズを発表した。まずは事前資料を基に、主な発表内容をご紹介する。
Zen 5コアを搭載、Granite RidgeことRyzen 9000シリーズ
まずはGranite RidgeことRyzen 9000シリーズである(Photo01)。最大の特徴はZen 5コアを搭載したことだが、現時点ではその詳細は明確ではない(Photo02)。一応命令処理の帯域、L2 to L1やL1 to FPの帯域、それとAI/AVX性能が倍になったという事は示されている(Photo03)。ここからFPUが512bit幅になり、AVX命令を最大2命令/cycleで処理できるようになったのは確実と思われる。AMDの説明によれば、IPCは平均16%向上した、としている(Photo04)。
Photo01: "9000 Series"のロゴの書体がちょっと目新しい。
Photo02: Wider Pipelineというあたりは実行ユニットの増設は行われた模様。ただDecoder段にどの程度手が入ったのかは不明。
Photo03: Instruction Bandwidthの方は、Decode BandwidthなのかMicroOps CacheのBandwidthなのかが不明。なんとなく後者な気がしてならない。
Photo04: これはRyzen 9 9950XとRyzen 9 7700Xを4GHz固定で動作させた場合の比較だそうだ。IPCの比較のくせにコア数が一致してないのが気になるところ。
そのハイエンドの製品はRyzen 9 9950X(Photo05)であるが、Ryzen 9 7950Xとそれほどスペックに差はみられない。ただしCore i9-14900Kと比較した場合の性能の伸びは大きい、とされている(Photo06)。またAI性能が大幅に改善した、とする(Photo07)。これはおそらくAVX512のVNNIが従来比で倍のスループットを発揮することに起因するものと考えられる。
Photo05: Boost ClockもTDPも同じである。
Photo06: ちなみにCore i9-14900KのBIOS設定は"Intel Default"だそうで、Baseline Profileかどうかは不明。
Photo07: Bandwidthの方はDirectStorageまで併用しての数字なので、どこまで意味があるのかはちょっと不明。
またAMDは今回、2027年まで引き続きAM5プラットフォームを継続することを改めて表明した(Photo08)。さらに今回の発表に合わせ、X870/X870Eチップセットを新たに発表した。こちらも詳細は不明である(Photo09)。ただ先のPhoto04のFootnoteを見る限り、Ryzen 9 9950XとRyzen 9 7700Xはどちらも同じX670Eマザーボードでテストを行っていることから、別に既存のAM5チップセットでRyzen 9000シリーズが動作しないという事は無いものと思われる(制限は何かしら入るかもしれないが)。とりあえず新機能としてUSB 4.0に対応した形である。ただこのUSB 4.0がCPU側に入っているのか、それともX870/X870E側に入っているのかは現状不明だ。
Photo08: さすがに次はZen 6だろうと思いたいが。
Photo09: USB 4.0はともかく、PCIe Gen5対応はすでにX670E/B550Eで実現しているだけに、ではX870とX870Eの違いは何か? が気になるところである。
ちなみにRyzen 9 9950以外にRyzen 9 9900/Ryzen 7 9700X/Ryzen 5 9600Xの合計4製品が7月に市場投入される事も明らかにされた(Photo10)。普通に考えれば、次はこのZen 5に3D V-Cacheを実装したモデルが追加されそうだが、その辺に関しても現時点では情報が無い。
Photo10: 事前資料では価格などは未公表だが、このあたりは基調講演で出てくるかもしれない。
Ryzen AI 300シリーズはLunar LakeやSnapdragon X Eliteの対抗馬
次がRyzen AI 300シリーズである。これは製品ラインナップ的にはRyzen 7040/8040の後継であるが、マーケティング的にはCore UltraというかIntelのLunar Lake、それとQualcommのSnapdragon X Eliteの対抗馬というか、Copilot+ PC向けSKUという格好になる(Photo11)。これにより、Copilot+が快適に実現できる、とする(Photo12)。
Photo11: ということでAI性能を前面に押し出す形に。40TOPSがCopilot+ PCの必須要件になったので、16TOPSの処理性能を3倍増とした。
Photo12: この辺は基調講演の中でデモなども行われるかもしれない。
さてそのRyzen AI 300シリーズはZen 5コアにXDNA 2、RDNA 3.5という最新の構成となった(Photo13)。Zen 5コアが12というのがちょっと目新しい(Photo14)。SKUはRyzen AI 9 HX 370とRyzen AI 9 365の2製品(Photo15)。製造プロセスは4nmと発表されている(Photo16)。
Photo13: ただしRDNA 3.5の詳細は今回一切語られず。
Photo14: GPUも16CUはかなり多いが、中身が判らないので性能は何とも言えない。あと今回Zen5cは少なくともこのRyzen AI 300シリーズには実装されなかった。
Photo15: NPUに関しては両SKUで差がない。
Photo16: どちらもTDP 28W/cTDP 15-54Wとなっている。純粋にCPUコアの数(とGPUのCU数)、それと動作周波数の僅かな差が違いである。
さて肝心な部分はXDNA2で、これはVersal AI Edge Gen2に搭載されたAI Engineと基本的には同じものとされている。従来製品比でいえばCompute Tileの数を5倍にするとともに、性能効率を倍増させたということだが(Photo17)、実際にはいろいろ細工がある。その最たるものが。Block FP16のサポート(Photo18)である。これは要するに、精度がそれほど必要のないところはINT8を使って演算を行い、精度がいるところだけFP16で演算するという、いわゆるMixed PrecisionをFP16アプリケーションに対して提供するという仕組みだ。これにより、精度をそれほど落とさずに大幅に性能を向上できるようにした、という事らしい。
Photo17: 性能効率改善はMX6/MX9のサポートが大きな効果を果たしている、というのがVersal AI Edge Gen2の際の説明だった。
Photo18: "No quantization needed"から判るように、この型変換をNPU内部で自動で行てくれるものと思われる。
性能として各社が公表している数字をそのまま並べたのがこちら(Photo19)。さすがにこれはあまり意味がないが、実際にLlama v2のパラメータ7Bを実行した際の性能はRyzen 9 8945HS比で5倍(Photo20)。また通常のアプリケーションでSnapdragon X Eliteよりも高速であり(Photo21)、Apple M4と比較してもやはり有利(Photo22)、Core Ultra 185Hと比較しても有利(Photo23)であり、ゲーム性能もかなり大きな差があるとする(Photo24)。
Photo19: LunarLakeのNPUは45TOPSを超えて48TOPS位らしいので、まぁいい勝負ではある。
Photo20: もっとも脚注を見ても実際のResponse Timeそのものは示されていないので、5倍高速というRyzen AI 300シリーズが実用的にLlama V2を実行できているのかどうか、が不明なのだが。
Photo21: これはNative Applicationを動かせないSnapdragon X Eliteに不利というか、ProcyonのProductivityで10%しか差がないなら十分Snapdragon X Eliteが実用的に見えるというか。
Photo22: CineBenchとかBlenderは、CPU性能以外がボトルネックになっている気もしなくはない。
Photo23: 問題はこれで、Lunar LakeがMeteor LakeよりAI以外の性能が大幅に向上したという話が聞こえてこないあたり、これをLunar Lakeに置き換えるとさらに性能差が出そうな感はある。まぁ同列に比較してはいけないのかもしれないが。
Photo24: もっとも内蔵GPUを使う限り、例えばCyberPunk 2077はFSRを併用しないと2Kでまともに動かないだろうというのは想像がつくあたり、どこまでこの性能差が意味があるかは微妙ではある。
とりあえずASUS(Photo25)及びMSI(Photo26)から、搭載ノートが提供されることは今回発表された。
Photo25:
Photo26:
ということで、いろいろ不明な点が多い今回のAMDの発表であるが、実際の基調講演などで明らかにされたポイントを後追いの形でレポートしたい。
Zen 5コアを搭載、Granite RidgeことRyzen 9000シリーズ
まずはGranite RidgeことRyzen 9000シリーズである(Photo01)。最大の特徴はZen 5コアを搭載したことだが、現時点ではその詳細は明確ではない(Photo02)。一応命令処理の帯域、L2 to L1やL1 to FPの帯域、それとAI/AVX性能が倍になったという事は示されている(Photo03)。ここからFPUが512bit幅になり、AVX命令を最大2命令/cycleで処理できるようになったのは確実と思われる。AMDの説明によれば、IPCは平均16%向上した、としている(Photo04)。
Photo02: Wider Pipelineというあたりは実行ユニットの増設は行われた模様。ただDecoder段にどの程度手が入ったのかは不明。
Photo03: Instruction Bandwidthの方は、Decode BandwidthなのかMicroOps CacheのBandwidthなのかが不明。なんとなく後者な気がしてならない。
Photo04: これはRyzen 9 9950XとRyzen 9 7700Xを4GHz固定で動作させた場合の比較だそうだ。IPCの比較のくせにコア数が一致してないのが気になるところ。
そのハイエンドの製品はRyzen 9 9950X(Photo05)であるが、Ryzen 9 7950Xとそれほどスペックに差はみられない。ただしCore i9-14900Kと比較した場合の性能の伸びは大きい、とされている(Photo06)。またAI性能が大幅に改善した、とする(Photo07)。これはおそらくAVX512のVNNIが従来比で倍のスループットを発揮することに起因するものと考えられる。
Photo05: Boost ClockもTDPも同じである。
Photo06: ちなみにCore i9-14900KのBIOS設定は"Intel Default"だそうで、Baseline Profileかどうかは不明。
Photo07: Bandwidthの方はDirectStorageまで併用しての数字なので、どこまで意味があるのかはちょっと不明。
またAMDは今回、2027年まで引き続きAM5プラットフォームを継続することを改めて表明した(Photo08)。さらに今回の発表に合わせ、X870/X870Eチップセットを新たに発表した。こちらも詳細は不明である(Photo09)。ただ先のPhoto04のFootnoteを見る限り、Ryzen 9 9950XとRyzen 9 7700Xはどちらも同じX670Eマザーボードでテストを行っていることから、別に既存のAM5チップセットでRyzen 9000シリーズが動作しないという事は無いものと思われる(制限は何かしら入るかもしれないが)。とりあえず新機能としてUSB 4.0に対応した形である。ただこのUSB 4.0がCPU側に入っているのか、それともX870/X870E側に入っているのかは現状不明だ。
Photo08: さすがに次はZen 6だろうと思いたいが。
Photo09: USB 4.0はともかく、PCIe Gen5対応はすでにX670E/B550Eで実現しているだけに、ではX870とX870Eの違いは何か? が気になるところである。
ちなみにRyzen 9 9950以外にRyzen 9 9900/Ryzen 7 9700X/Ryzen 5 9600Xの合計4製品が7月に市場投入される事も明らかにされた(Photo10)。普通に考えれば、次はこのZen 5に3D V-Cacheを実装したモデルが追加されそうだが、その辺に関しても現時点では情報が無い。
Photo10: 事前資料では価格などは未公表だが、このあたりは基調講演で出てくるかもしれない。
Ryzen AI 300シリーズはLunar LakeやSnapdragon X Eliteの対抗馬
次がRyzen AI 300シリーズである。これは製品ラインナップ的にはRyzen 7040/8040の後継であるが、マーケティング的にはCore UltraというかIntelのLunar Lake、それとQualcommのSnapdragon X Eliteの対抗馬というか、Copilot+ PC向けSKUという格好になる(Photo11)。これにより、Copilot+が快適に実現できる、とする(Photo12)。
Photo11: ということでAI性能を前面に押し出す形に。40TOPSがCopilot+ PCの必須要件になったので、16TOPSの処理性能を3倍増とした。
Photo12: この辺は基調講演の中でデモなども行われるかもしれない。
さてそのRyzen AI 300シリーズはZen 5コアにXDNA 2、RDNA 3.5という最新の構成となった(Photo13)。Zen 5コアが12というのがちょっと目新しい(Photo14)。SKUはRyzen AI 9 HX 370とRyzen AI 9 365の2製品(Photo15)。製造プロセスは4nmと発表されている(Photo16)。
Photo13: ただしRDNA 3.5の詳細は今回一切語られず。
Photo14: GPUも16CUはかなり多いが、中身が判らないので性能は何とも言えない。あと今回Zen5cは少なくともこのRyzen AI 300シリーズには実装されなかった。
Photo15: NPUに関しては両SKUで差がない。
Photo16: どちらもTDP 28W/cTDP 15-54Wとなっている。純粋にCPUコアの数(とGPUのCU数)、それと動作周波数の僅かな差が違いである。
さて肝心な部分はXDNA2で、これはVersal AI Edge Gen2に搭載されたAI Engineと基本的には同じものとされている。従来製品比でいえばCompute Tileの数を5倍にするとともに、性能効率を倍増させたということだが(Photo17)、実際にはいろいろ細工がある。その最たるものが。Block FP16のサポート(Photo18)である。これは要するに、精度がそれほど必要のないところはINT8を使って演算を行い、精度がいるところだけFP16で演算するという、いわゆるMixed PrecisionをFP16アプリケーションに対して提供するという仕組みだ。これにより、精度をそれほど落とさずに大幅に性能を向上できるようにした、という事らしい。
Photo17: 性能効率改善はMX6/MX9のサポートが大きな効果を果たしている、というのがVersal AI Edge Gen2の際の説明だった。
Photo18: "No quantization needed"から判るように、この型変換をNPU内部で自動で行てくれるものと思われる。
性能として各社が公表している数字をそのまま並べたのがこちら(Photo19)。さすがにこれはあまり意味がないが、実際にLlama v2のパラメータ7Bを実行した際の性能はRyzen 9 8945HS比で5倍(Photo20)。また通常のアプリケーションでSnapdragon X Eliteよりも高速であり(Photo21)、Apple M4と比較してもやはり有利(Photo22)、Core Ultra 185Hと比較しても有利(Photo23)であり、ゲーム性能もかなり大きな差があるとする(Photo24)。
Photo19: LunarLakeのNPUは45TOPSを超えて48TOPS位らしいので、まぁいい勝負ではある。
Photo20: もっとも脚注を見ても実際のResponse Timeそのものは示されていないので、5倍高速というRyzen AI 300シリーズが実用的にLlama V2を実行できているのかどうか、が不明なのだが。
Photo21: これはNative Applicationを動かせないSnapdragon X Eliteに不利というか、ProcyonのProductivityで10%しか差がないなら十分Snapdragon X Eliteが実用的に見えるというか。
Photo22: CineBenchとかBlenderは、CPU性能以外がボトルネックになっている気もしなくはない。
Photo23: 問題はこれで、Lunar LakeがMeteor LakeよりAI以外の性能が大幅に向上したという話が聞こえてこないあたり、これをLunar Lakeに置き換えるとさらに性能差が出そうな感はある。まぁ同列に比較してはいけないのかもしれないが。
Photo24: もっとも内蔵GPUを使う限り、例えばCyberPunk 2077はFSRを併用しないと2Kでまともに動かないだろうというのは想像がつくあたり、どこまでこの性能差が意味があるかは微妙ではある。
とりあえずASUS(Photo25)及びMSI(Photo26)から、搭載ノートが提供されることは今回発表された。
Photo25:
Photo26:
ということで、いろいろ不明な点が多い今回のAMDの発表であるが、実際の基調講演などで明らかにされたポイントを後追いの形でレポートしたい。