※更新:2018/03/18 画像を一部追加(処理状態とコア数絞り)
まずは構成を紹介、自作機合計3台です。
1.Ryzen1950X機[以後、Ryzen機と標記]
CPU:AMD Ryzen 1950X
CPUクーラー:Enermax LIQTECH TR4シリーズFN1126 ELC-LTTR360-TBP
M/B:MSI MB4090 X399 GAMING PRO CARBON AC
RAM:CORSAIR CMK16GX4M2A2666C16R
CMK16GX4M2A2666C16 合計32GB
GPU:PowerColor AXRX 550 2GBD5-DH/OC
SSD:Samsung SSD 250GB 960 EVO MZ-V6E250B/IT
電源:CORSAIR 850W 電源ユニット CX850M
ケース:NZXT Digital Game User'sカスタム ミドルタワー [ ブラック ] H440W-Plus-BK
ケースに入れる前と入れた状態
2.AMD A10機[以後、A10機と標記]
CPU:AMD A10 7890K BlackEdition(4コア 4.1GHz Up 4.3GHz)
M/B:GIGABYTE GA-F2A88XM-D3HP
RAM:CFD PC-17000(DDR3-2133) 8GB×2枚 240pin DIMM W3U2133HPS-8G x 4枚 合計32GB
GPU:Sapphire NITRO+ RADEON RX 480 + R7
SSD:ADATA SU800 256GB ASU800SS-256GT-C
電源:Corsair CX450M CP-9020101-JP
ケース:Aerocool製 Micoro-ATX対応 コンパクトPCケース Aerocool QS-240 Window
3.Intel 4790機[以後、Intel機と標記]
CPU:Intel 4790K(4コア 8スレッド 4GHz Up 4.4GHz)
M/B:ASUSTeK H81I-PLUS
RAM:CFD PC3-12800 CL9 4GB W3U1600HQ-4G/N 4GBx2枚 合計8GB
GPU:Intel HD4600
SSD:Inel SSDC2MH120A2 120GB
電源:サイズ 500W 80PLUSブロンズ SPGRN-500(P)
ケース:RAIJINTEK METISシリーズ 0R200058 (METIS PLUS BLUE)
4.MacBookPro(2016)[以後、MBPと標記]
CPU:Corei7-6920HQ[SKYLAKE]
RAM:DDR3 8GB x 2枚 合計16GB
GPU:AMD Radeon Pro 460 + Intel HD530
撮影機材
DJI MavicAir
ざっくりテスト概要を説明
1.まずはRyzenの性能確認です。Intel機とA10機との比較を行います。
2.RyzenMasterを使用して、さらに加速させることができるか?をテストします。
※計測する方法は全て同じ処理を実施しています。
1.Ryzenはやっぱり速い・・・・
比較テスト方法
撮影機材を使用して撮影した写真から、3Dデータの作成を各機種で行い
作成時間の合計を比較します。
作成サンプル
パターン1:岩場
3Dに起すとこんな感じ
動画にしているので、一部編集ソフト側の補正があります。
補足
3Dデータを作成する際には、CPUの性能もですが、GPU、RAMなどの性能にも大きく左右されます。数段階の各処理ではCPUメイン、GPUメイン、CPUとRAMがメインとなる処理があり、どれか一つでも遅くてもダメとなります。つまり、
各マシンの特色
Ryzen機はCPUとRAMは言うことなし!しかし、GPUが脆弱
A10機はGPU(マルチGPU)、RAMは良いが、CPUがA10 7890Kとやや他と比べるとパワー不足
Intel機はCPUのみでGPU、RAMは心もとない
MBPは他と比べると秀でたものはないものの、バランスがよく、隙が少ない(マルチGPU)
といった感じです。
A10機は生贄?的存在ですww
ちなみに撮影や処理の方法は今回のメインではないので割愛します。
ではサクッと結果です。
Ryzen機 約6時間50分
A10機 約8時間20分
Intel機 メモリ不足で処理停止・・・・
MBP 約6時間30分
各処理毎時間表①
※単位無しは分表示、切り上げ、色変えセルは最速
各処理毎時間グラフ①
※短い方が速い
今回は処理内容は置いておき、phase毎に処理に使用するポイントが違います。
phase後にざっくり紹介です。
phase.01はmGPUのみ
phase.02はmGPUとCPUを個別に使用
phase.03はCPUとRAMを同時使用
phase.04はCPUとGPU
(mGPUは複数のGPU同時使用可能、GPUは単体のGPUのみ使用)
処理の様子
結果だらだらと
結果としてはMBPが最速となりました。(汗)あれま?
Ryzen機はCPUが単体動作で絡むシーンでは最速をマークしていることがわかる(各処理毎時間表①を参照)、特にphase.03が顕著かと思います。またphase.02などはGPU側処理が遅いにもかかわらず、CPU側の処理で他の追随を許さないスピードを発揮して、結果最速をマークです。
ただ、GPU(RX550)が足を引っ張った状態となり、結果としては遅くなっている状態です。RX550がエントリーと考えると致し方無しかもですね。さりとて、バランスに優れたMBPと同等というのは驚きです。速い・・・・
A10機はGPU(RX480&R7のマルチGPU構成)の性能がそこそこあるにもかかわらずこれほど遅いのは、やはりA10の性能が段違いに遅いことがわかります。7890KがAMD最速のAPUと呼ばれていたことを考えると・・・
MBPが意外と検討、メモリが多いとは言えない状況の中で、うまく処理しており(他のマシンでは最大29GB前後までメモリを使用することがあります。)、GPUもIntelのHDとAMDのPro 460の組み合わせでうまく処理できていた感じです。
Intel機がメモリ不足でアウトしたのは残念ですが、メモリ要求が高いので致し方無しかと・・・
ただし、後日、処理レベルを下げて実施してみましたが、処理レベルを下げたにもかかわらず、A10機より遅い10時間ほどかかる結果となりました。CPU処理自体は早いものの、GPUがHD 4600ではパワー不足が否めない状態でした。
で!
ここでA10機のGPU:RX480をRyzen機に移植したら激即化しないかと思い
どうせなら、RX550も積んだままで、マルチGPUで再計測してみることに
意味あるの?
このソフト自体は複数のPCをつなぎ合わせたグリットコンピューティング的な使い方もできるので(ただし高額になります。)、ローカルであろうが、ネットワーク越しであろうが、複数処理できるもの(CPUやGPU)があればあるほど、加速していく傾向にあります。(当然ですが、極端にスペックの低いものが混じっているとなると別話です)ソフトウェア自体が対応しているので、積めば積むほど基本的には早くなる!ということになるかと思います。
構成変更
Ryzen機に GPUとしてRX550 x 2枚 + RX480 を搭載
※RX550はIntel機に追加する予定で1枚多めに購入していたものを使用
一気にできる処理増大を想定して、RAMも8GBx2枚を追加!合計48GBです。
結果:約2時間
各処理毎時間表②(新しい構成はRyzen2と標記)
※単位無しは分表示、切り上げ
各処理毎時間グラフ②
※短い方が速い
まとめ
RyzenはA10と比べると段違いに高速化していることが体感できた。というか、速すぎる・・・・
今まで、処理によっては2日ほど放置か・・・と諦めていたものが、当日に仕上がることになるとは・・・・Ryzen 1950X おそるべし!
2.この設定を体験するには・・・・・
さて、今回のお題である「 RyzenMasterでUMA(Unified Memory Address)モード/NUMA(Non Unified Memory Address)モードを切り替え 」についてですが、サックっと解説です。
単純に言えば、CPUが使用するRAMを直結しているもの限定とすることで、RAMとのアクセス時に発生する遅延を極力抑えたものが NUMA
逆にどのRAMにも自由にアクセスすることで、帯域を確保を優先したものがUMA
ちょっとだけ細かく
CPUにはそれぞれ直結されているRAM(RAMコントローラー経由)があるが、NUMAも他のRAMにもCPU経由でアクセルすることが可能です。ただ、当然この場合、経由となるぶん遅延(レイテンシー)が発生します。人間には感じることのできないレベルではありますけどね・・・・
どちらがいいとは言えない部分が多く、RyzenのデフォルトはUMAとなっています。
一般的には帯域を確保した方がいいと言うことかと思います。
ただ、アプリケーションの特性によってはNUMAの方がレイテンシーが減り、性能の向上が見込めることがある場合があります。
で!
今回は先の検証で数時間単位で、メモリをくらい続ける処理ならば効果も顕著に現れるのでは?と目論みテストです。
導入ですが、AMDのサイトからダウンロードです。
RyzenMaster https://www.amd.com/ja/technologies/ryzen-master
Memory Access Mode の デフォルトはDistributed Mode(UMA)
Local はCPU直結のRAMのみとします。
デフォルトのUMAはすでに計測済み(上記の検証で)ですので、ローカールに変更して計測をしていみます。
ついでにもういっちょ!です。
RyzenMaster ですが、まだ他にも機能があります!面白そうなので少し追加で検証です。
それは Compatibility Mode(Game Mode) です。
こちらもサックと紹介!
16コア32スレッドでは、アプリケーションが対応しておらず、本来の性能を発揮できない
最悪の場合、低下する可能性がある。これを解消すべく
使用コア数を半減させて(8コア+ 8コアの16コア)動作させることが可能モードです。
参考画像①32スレのタスク
参考画像②16コアのタスク
こちらも合わせて検証です。
予想としては、CPU+RAMを使用するphaseでは、処理に何らかの変化が見られるのでは?と思います。また16コア化については、多分、今回の処理からいうと低速になるかと思います。
各処理毎時間表③
※単位無しは分表示、切り上げ
各処理毎時間グラフ③
※短い方が速い
結果をだらだらと
少し意外な結果となりました。まずはUMAとNUMAです。
誤差とも言える近い差ではあるものの、phase.02と03でそれぞれ、違いが出ました。phase.03では一気に大量のRAMを使用する影響か?帯域が必要になるため、UMA側がやや速い結果、逆にこまめにRAMを使用するphase.02ではNUMAが速いという結果です。
そして、意外なのは16コアのphase.03です。大量のRAMを使用するにもかかわらず、コアを絞ることで、経路の少なさからレイテンシーが軽減されたのか?(あくまで予想)NUMAでありながら、この検証ではphase最速をマークしています。それ以外の処理が遅いので、全体としては遅いため、実用性としては厳しいですが、処理の種類によってはコア数とNUMAで絞ることで、スピードが出やすいことが判明しました。
個人的には、phase.03では、処理開始時に4GB程度から最大30GB程度まで一気に使用するので、帯域を必要とするのでは?と思い、UMA側に圧倒的な速さがでるか?と思いましたが、今ひとつで、16コアでは違う結果が出たことは驚きでした。
以上からUMAとNUMAの設定に16コア絞りを合わせることで、得手不得手が出ることがわかったが、端的にどれがいいとはいいがたい状態です。
コア絞りはソフトによっては32コアに対応していないものには有効かと思います。
実際に構築中にベンチマーク系のソフトで、32コア状態ではベンチマーク中に処理が遅延する状態が発生しました。16コアではすんなり流れましたが、スコアとしてはどちらも変わらずと、CPUの性能というよりもソフト側の対応といった印象だったので、ゲーム関連をする場合はRyzenMasterでのチューニングは効果があるかと思います。
少しでも速くしたいのであれば、オーバークロックもですが、UMA、NUMAをいじって見るのも良いかと思います。まずは自分が重いと感じる処理の状況把握からスタートかな?
しかし、Ryzen 1950X はモンスターだと思い知らされたレビューでした。
A10さんは自分的には速いと思っていたのですが・・・・世代の違いか
蛇足とぼやき
下記はスルーしていたただいてOKです。レビュー中のメモ的ぼやきです。
準備段階について
今回はパーツ選びに四苦八苦しました。意外とマザーボードが決まらず、選別しているうちに売り切れたり、値段が上下したりと翻弄されました。
メモリが相変わらず高騰状態であるものの、今回の要件からすれば、そこそこメモリを搭載したかったので、こちらも値段の上下があり、一人で右往左往してました。
タイミング的にはベストとは言えないものの、一番高いタイミングではなかったことが救いですが、構成パーツ全体合計で見ると、レビュー期間中に最大上下幅は合計で1万以上ある状態でした。
Ryzen自体が現状は人気であり、周辺パーツも売り手と買い手の様子見的部分がある状態ですかね?
発売時期から考えると近年では珍しい傾向?かと個人的には思います。
ちなみにレビューに選ばれるなら、マザーボードも当たるだろう!なんて軽い気持ちで、マザーボード意外のパーツぐらいしか予算を考えていなかった(メモリもね)のはイタイ出来事ですが、秘密ですww
AMDで自作をする場合は、大きな理由がない場合はAPUをチョイスしていました。
追加でGPUを増設することは稀であり、APUになれすぎていたため、GPUの手配を忘れる・・・
パーツが届いてから気がつくお寒い状況でした(涙)
知っていたはずですが、思い込みというか、くせ?は怖い・・・・
で、追加で予算がかさむことに・・・・(涙)
開封時に、Ryzenの収納ケースを割った・・・・(涙)レビューが失敗に終わり、返却とかなったらどうしようと焦る・・・
構築時当初から電源のコイル鳴きが発生!交換したかったが、手続きの長期化が想定されたため、このテスト期間時は我慢することにしたが、結果、掃除中に保証書を紛失・・・・(涙)
GPU3枚刺しの時に、想定はしていたが、RX480の下部が下のRX550と干渉してしまう(汗)
GPUストッパーを追加することとなるが、注文後に場所を変えればOKじゃん!って気がつくが、時すでに遅し・・・・(涙)
各箇所を細かく説明したい部分があったが、長くなりすぎるので、全体的に極力難しく書かないように、ざっくり記載することにしましたが、うまく表現できず。四苦八苦・・・
ZIGSOWにログインするとコメントやこのアイテムを持っているユーザー全員に質問できます。