『GPGPUの性能の優劣を教えてください』 の クチコミ掲示板

『GPGPUの性能の優劣を教えてください』 のクチコミ掲示板

RSS


「グラフィックボード・ビデオカード」のクチコミ掲示板に
グラフィックボード・ビデオカードを新規書き込みグラフィックボード・ビデオカードをヘルプ付 新規書き込み



ナイスクチコミ11

返信17

お気に入りに追加

解決済
標準

GPGPUの性能の優劣を教えてください

2016/09/06 20:28(1年以上前)


グラフィックボード・ビデオカード

クチコミ投稿数:761件 歩き撮り 

ゲームのためにGPUを求める人も、動画編集のためにGPGPUの機能を求める人もいると思います。ゲームでの性能であればベンチで明確にされていますが、GPGPUの性能の優劣がよくわかりません。

もちろん同じ世代のなかでは、よりグレードの高いもののほうがGPGPU性能も高いと思います。しかし世代が上がった際に、ゲーム性能を重視して、GPGPU性能はあがらないってことは実際にあると聞きます。

ゲーム性能は GTX780≒GTX970でも、GPGPU性能はGTX780>GTX970 など。


今後は徐々に、コンシューマーでも4K60Pが当たり前になってくると思います。4K60Pの編集は相当にマシン要求が高いですが、実際にどのくらいの負荷の編集なら、どのくらいのスペックでリアルタイムプレビューが可能なのかは、ネット検索してもきちんとした検証記事は見つかりませんでした。そこで4K60Pの動画編集(中間ファイルへの変換をせずに撮影ファイルをネイティブにあつかう編集)には、どの程度のスペックが必要なのか、検証しようと思っています。CPUについては、BIOSでアクティブなコア数と動作周波数を変更して、模擬4コアなども検証できますが、GPUではそうもいきません。

そこで、GPGPUの性能の優劣が知りたいのです。
Gefoce780、GTX TITAN、GTX 970、GTX 980、GTX 1070、GTX 1080
の優劣をご存知の方がいたら、ご指導願えると幸いです。

参考 マシン構成
CPU: i7 4930K @4.4Ghz駆動
M/B: ASUS rampage 4 gene
Mem: 32G 2133mhz クアッド
GPU: GTX780Ti

書込番号:20177042

ナイスクチコミ!0


返信する
uPD70116さん
殿堂入り銅メダル クチコミ投稿数:27421件Goodアンサー獲得:4994件

2016/09/06 23:05(1年以上前)

基本的には3D性能=GPGPU性能です。
ただMaxwell以降で倍精度演算を大幅に削ったので、それが必要とされる分野では性能が大幅に減ることになります。
同世代なら上下関係は3D性能と同じです。MaxwellとPascalは同じ割合なのでこれも3D性能順です。
倍精度演算を使わなければ3D性能順、倍精度演算を含めればGeForce GTX TITAN(TITAN Xではない)、GeForce GTX 780、以下性能順です。

普通は動画処理に倍精度演算を使うことはないと思います。
後はソフトがGPUに対応しているかどうかです。
対応していれば問題ないと考えていいです。
使おうとしても未対応だと表示されたり、強制的に使う設定にしても正しく動作しないなら、その時点で話しになりません。

単位の大文字・小文字には意味があります。
大文字・小文字を間違うと全く大きさが異なってしまったり、別な単位になってしまったりすることもあります。
mhzだとミリ・ヘクト...

書込番号:20177578

Goodアンサーナイスクチコミ!1


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/07 08:06(1年以上前)

パソコンのゲームの3D性能に倍精度は不要である。
というのが、単精度、半精度採用推進派の大義名分です。

流行のディープラーニングに限れば、半精度、整数演算でも
できますからね。

書込番号:20178124 スマートフォンサイトからの書き込み

ナイスクチコミ!1


クチコミ投稿数:761件 歩き撮り 

2016/09/07 09:38(1年以上前)

uPD70116さん
けーぞー@自宅さん

御教授ありがとうございます。
後ほどまた返信させていただきます。
取り急ぎお礼まで。

書込番号:20178286

ナイスクチコミ!0


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/07 19:48(1年以上前)

単精度について、wikipedia によれば、

> 十進に換算したとき表現できる桁数は log10(224) ≈ 7.225 桁となる。

ということです。
月に行って帰ってくるならば、これでも十分なのでは?
火星ならが変わってくるかも。
大気圏再突入でもOKでは?

書込番号:20179548 スマートフォンサイトからの書き込み

ナイスクチコミ!1


KAZU0002さん
クチコミ投稿数:30914件Goodアンサー獲得:4374件

2016/09/07 20:20(1年以上前)

>そこで4K60Pの動画編集(中間ファイルへの変換をせずに撮影ファイルをネイティブにあつかう編集)には、どの程度のスペックが必要なのか
4コア以上のCPUだけで事が足りる話かと思いますが。GPUの支援に期待するに使うにしても、「GPUを使う編集ソフト」が存在することが前提ですし。また、その編集ソフトの全ての処理にGPU支援が使われているわけではありません。
性能の高いビデオカードを付けたなら、何でもかんでもCPU性能に追加されるという訳ではないので。すでに使われている編集環境があるのなら、CPUとGPUの負荷の観察と、ボトルネック部分の判定からになると思います。

純粋に支援性能として見当を付けるのなら、CUDAユニットの数xクロック数でよろしいかと。それらを100%の効率で使えるかは、全く別の話ですが。


ちなみ。
>月に行って帰ってくるならば、これでも十分なのでは?
一般的には、ジャイロと加速度計からのデータを倍精度で"積算"して処理しています。
姿勢の検算としてはスタートラッカーを使用していますし。位置と速度の検算は、地上からの電波受信時の測定によって行っています。外部の支援や観測無しのめくらで飛ぶのは、弾道ミサイルくらい。
「ロケットの打ち上げ」の精度は結構いい加減。軌道に乗ってから微調節です。

書込番号:20179650

Goodアンサーナイスクチコミ!1


クチコミ投稿数:761件 歩き撮り 

2016/09/07 21:19(1年以上前)

uPD70116さん
倍精度演算は、主には3D作成ソフト、after effectsの一部で使用して、プレミアProなどの動画編集では基本的にあまり関係ない、という理解で宜しいでしょうか?
GTX TITANはコンシューマー用としては、例外的に倍精度演算能力が破格に高いのですね。

プレミアProでは、以前は対応表に乗っているGPU以外は、テキストファイルに強制的に書き込んで認識させる裏技的なものが必要でした。しかし、もう数年対応表は更新されておらず、今のプレミアProCCでは対応表に記載されていないGPUも自動で認識され、裏技を使わなくてもMercury Playback Engineがデフォルトで有効になっています。

CPU: i7 4930K @4.4GHz駆動
Mem: 32GB 2133MHz
ですね。大変基礎的なことが抜け落ちていました。こういうところまで指摘して頂けるのは、大変有難いことです!有難う御座います。


けーぞー@自宅さん
そうなんですね。知識不足で、そこらへんが全然分かりませんが、目的によって必要とする演算性能が違うんですね。

書込番号:20179816

ナイスクチコミ!0


KAZU0002さん
クチコミ投稿数:30914件Goodアンサー獲得:4374件

2016/09/07 21:35(1年以上前)

倍精度は、科学技術分野でしか使い道はありません。

>スーパーコンピューターの系譜 今後のGPGPU利用の方向
http://ascii.jp/elem/000/001/039/1039493/

書込番号:20179887

ナイスクチコミ!1


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/07 21:48(1年以上前)

倍精度演算が不可能である。
倍精度演算をすると単精度演算速度の半分になる。

意味がぜんぜん違います。
NVIDIAの安価なGPUでは後者です。

書込番号:20179949

ナイスクチコミ!1


クチコミ投稿数:761件 歩き撮り 

2016/09/07 22:02(1年以上前)

KAZU0002さん
私の書き込みの情報が不足していてすみません。
具体的にはプレミアProCCでの編集です。現在の私のマシン(前述)では、4K60Pの1ストリームのカット編集や、そこにLUTを当てたりカラー補正をしたりといった用途では、コマ落ちなくノンリニアのリアルタイム編集が可能です。2ストリームでも物によってはコマ落ちしません。

ご指摘のCPU・GPUの使用率の観察も行っており、カット編集のみでは主にCPUとメモリ量に依存し、エフェクト類(GPGPU機能を利用できるもの)はGPUに依存するのは理解しておりますし、実際に試しても同様の結果です。4K60Pのファイルの形式によってもマシン負荷が変わっており、SONYのXAVC形式は、Panaの通常の?H.264MP4に比較してかなりCPU使用率があがります。今のマシンで、4K60PのXAVCは2ストリームでフル画質プレビューはコマ落ち、1/2画質コマ落ちなし(CPU80〜90%だったと思います,GPU10%)でした。

友人から、実際にどれくらいのスペックがあれば、どのくらいの編集が可能なのかと聞かれる事がありまして。それで色々検証してみようと思っているのです。CPU(1世代で同クロックで10%程度の性能が違うことは理解しています)については、BIOSでの有効コアやクロックを変更することで、4コア8スレッドならこのくらい可能、6コア12スレッドならこれくらい可能というのが、クロック別にわかると思います。ただ、エフェクトやカラー補正などをする場合に、どのレベルのGPUが必要なのか、GPUについての指標が分からずに質問させて頂いたわけです。


>純粋に支援性能として見当を付けるのなら、CUDAユニットの数xクロック数
なるほど。これが指標になるのですね。どこかでプレミアProCCでのGPGPU性能は、GTX780Ti>GTX980と聞いていましたが、確かにこのご教授頂いた計算すると、780Tiのほうが若干高い数値ですね。

とても勉強になりました、有難うございます。

書込番号:20179991

ナイスクチコミ!0


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/07 22:44(1年以上前)

ストレージ上のデータはCPU側のメモリに一度格納する
必要があります。
GPUで処理するためには、データをGPU側のメモリに
格納する必要があります。
結果を表示するためには、ディスプレイに繋がっている
側に格納する必要があります。
いったりきたりですね。

書込番号:20180142

ナイスクチコミ!1


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/08 02:16(1年以上前)

https://developer.nvidia.com/cuda-toolkit
16-bit floating point (FP16) data format
Store up to 2x larger datasets in GPU memory
Reduce memory bandwidth requirements by up to 2x
New mixed precision cublasSgemmEX() routine supports 2x larger matrices

と「単精度の半分」の半精度を使うメリットが記載されています。
裏を返せば、倍精度のデメリットがいかに大きいかわかります。

書込番号:20180577

ナイスクチコミ!1


uPD70116さん
殿堂入り銅メダル クチコミ投稿数:27421件Goodアンサー獲得:4994件

2016/09/08 12:27(1年以上前)

GeForce GTX TITANは設定で倍精度演算が有効になった筈です。
ゲームで使うことはないのに発熱が多くなるので、ゲーム用としては無効にしておきたいみたいです。

FP32の利用を推奨しているのは、FP64を削ったことの言い訳でもあると思います。
事実上問題ないし、そちらを強化した方が全体の効率が上がるからというのはあるのでしょうが、高い金を出すQuadroまで巻き込むことはなかったのではないかとも思います。

書込番号:20181534

Goodアンサーナイスクチコミ!0


クチコミ投稿数:761件 歩き撮り 

2016/09/08 22:10(1年以上前)

uPD70116さん
色々有難う御座います。その後、色々記事読みました。
TITANは、ドライバーツールの設定で倍精度演算を有効に出来る旨も記載されていました。
またMaxwellFP64を削ったのは、下記の理由があったようです。でも最新のPascalは、また方向性を変えてきたんですね。AMDのほうは、FP64は削っていないようですね。


後藤弘茂のWeekly海外ニュースより抜粋
>MaxwellでFP64を犠牲にしてFP32を強化したのは、同じ28nmプロセスノードで、性能をアップさせなければならない、という制約があったからだ。トランジスタが縮小しないため、何かを犠牲にしない限り、FP32の性能を伸ばすことができなかった。しかし、16nm FinFETプロセスに移行したPascalでは、使うことができるトランジスタ数が大幅に増えるため、そうした制約がない。そこで、NVIDIAは、Pascalではマイクロアーキテクチャを刷新し、FP64性能をFP32の2分の1のバランスに一気に引き上げた。


皆様、この度は色々と有難う御座いました。

書込番号:20183037

ナイスクチコミ!0


uPD70116さん
殿堂入り銅メダル クチコミ投稿数:27421件Goodアンサー獲得:4994件

2016/09/08 22:37(1年以上前)

そのPacalはGP100であり、GPUとしてのPascalはそうなっていません。
この時点では、GP100と同じ割合で下まで出すと考えていたのでしょう。
http://pc.watch.impress.co.jp/docs/column/kaigai/752331.html
しかし、実際はMaxwellを受け継いだ様なシェーダー構成になっています。
http://pc.watch.impress.co.jp/docs/column/kaigai/757916.html

書込番号:20183142

ナイスクチコミ!0


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/09 00:32(1年以上前)

FP(floating point)32が32ビット長で単精度で、
FP64が64ビット長で倍精度です。
FP16が16ビット長で半精度です。
念のため。。。

書込番号:20183523

ナイスクチコミ!1


クチコミ投稿数:761件 歩き撮り 

2016/09/09 13:15(1年以上前)

>けーぞー@自宅さん
補足有難う御座います。そこについては存じ上げていました。
また何かご質問することがあれば、よろしくお願いします。

書込番号:20184637

ナイスクチコミ!0


クチコミ投稿数:21638件Goodアンサー獲得:142件 ドコモ光に変更(2017/6/19) 

2016/09/09 18:51(1年以上前)

>あわわわ(汗さん

御意に。

書込番号:20185273 スマートフォンサイトからの書き込み

ナイスクチコミ!2


クチコミ一覧を見る


価格.com Q&Aを見る

クチコミ掲示板検索



検索対象カテゴリ
を対象として
選び方ガイド

最適な製品選びをサポート!

[グラフィックボード・ビデオカード]

グラフィックボード・ビデオカードの選び方ガイド

新着ピックアップリスト

ピックアップリストトップ

新製品ニュース Headline

更新日:1月28日

クチコミ掲示板ランキング

(パソコン)

ユーザー満足度ランキング