くるぅ
2008-11-09 00:29:33 ( ID:t0cvi9ydo9f )
[ 削除 / 引用して返信 ]
私環境ではATI RadeonHD2600XTを使用していますのでCUDAによるフィルタ処理はできないのですが、TMPGEnc 4.0 XPressがCUDA対応となったためGeForceのビデオカードが導入を検討しています。 ですがエンコード以外でのGPUの利用がオンラインの3Dゲーム程度なのであまり強力なビデオカードの導入は躊躇ってます。
元々圧縮前ソースがHD画質なため恐ろしく重いフィルタ関連は極力さけて圧縮してましたがCUDAで短縮されるなら本格的に高画質を狙ってみたいです
現在の私環境
CPU Q9550 2.8GHz(自動OC3.4GHz)
メモリ DDR2-800x4 (4G)
HDD ソース元(1TBx2 RAID 0) 圧縮後(500G)残りOS等 計6台
ビデオ RadeonHD2600XT
電源 600W (12Vx2(20A)PCI Express4ピンx2(不確定))
恐らく怪物級のビデオカードも乗るとは思いますが・・・・
サイト等では最速のGTX260やGTX280での比較が殆どなためどの程度のGPUを使えば良いのか分かりません
皆様の環境で同一ソース、フィルタ環境でCPUのみとCUDAを利用した時の圧縮時間を教えていただけないでしょうか
新規ユーザー
2008-11-09 11:22:07 ( ID:tj46my1klcm )
[ 削除 / 引用して返信 ]
E8500@3.8G+GF9600GT
ソース 960x1080i 22分30秒
出力 640x480 24fps MPEG4(1PASS可変ビットレート)
使用フィルタ、クロップ、ノイズ除去、スマートシャープ、音声ボリューム調整(ノーマライズ)
---
CUDA有り 1時間43分
CUDA無し 1時間48分
---
GTX290などの最新グラボだとまた別の結果が出るのかもしれませんが、
うちの環境では単体ファイルエンコードではエンコード時間は微差でしたね
CUDA使用時には20~30%ほどCPU使用率が下がったので、
バッチで複数ファイル同時に処理してたり、
フィルタやコーデック側(x264など)が複数スレッドでCPU使い切ってる様な場合では、
エンコード時間に差が出るかもしれません
くるぅ
2008-11-09 22:29:15 ( ID:t0cvi9ydo9f )
[ 削除 / 引用して返信 ]
以外にデュアルコアのCPUが健闘してますね。クワッドコアはCPUの占有率が低いのでイマイチ性能の伸びが低い(占有率上げよう思っても何故かバッチエンコードで4同時使えないし)
ヒロ
2008-11-10 22:55:58 ( ID:3.bw.cfirv. )
[ 削除 / 引用して返信 ]
こんちは CUDAは興味ありますね
私もまだその環境ないので参考になりませんが・・・
いまは優先順位は不動の3番手ぐらいかな
優先① SpursEngine WinFast PxVC1100 cell
優先② DDR3の環境
優先③ CUDA対応グラボ
PV4ソース 1440x1080i 34682フレーム 19分17秒
MPEG-4 AVC [1440 x 1080, 29.97 fps,インターレース
1パス 可変ビットレート 8000 kbps(max 15000 kbps)]
MPEG AAC(MPEG-4 (ISO/IEC 14496-3)) [48000 Hz ステレオ, 384 kbps]
プロファイル High レベル 自動(4.1以下)
ビデオフォーマット NTSC
エントロピー符号化 CABAC
あとは全部デフォルト値
CPUもまだしょぼいので Q6600@3.4G です
■TMPGEnc 42分41秒
経過7%ぐらいまで(負荷率50~70) 以降ほぼ負荷率 90以上
ちなみに同等レベルで Aviutl+x264 でMuxまで約25分
( シングル処理のNeroaac音声エンコがネックで意外と時間がかかる )
CPU負荷率平均 75-80
ある特殊なフィルターかけないとCUDAは意味をなさないという認識でいいのかな
クレソンでおま!
2008-11-11 01:33:23 ( ID:ep1oromppk. )
[ 削除 / 引用して返信 ]
参考になるかわかりませんが、うちは
エンコード:CPUのみ。
フィルタ:CUDA併用しています。
エンコードにCUDA併用したら逆に処理速度が遅くなったもんで。(汗)
>くるぅさん
怪物級のビデオカード載せてみてください。GF9600GT辺りじゃあまり使い物になってません。
くるぅ
2008-11-11 04:09:24 ( ID:t0cvi9ydo9f )
[ 削除 / 引用して返信 ]
クレソンでおま!さんCUDAはフィルタとデコードに使います。(エンコードは次だそうで)
SpursEngine WinFast PxVC1100 cellには私も興味津々ですがどうにも専用ソフトなどの関係でフィルタ等の細かな調整が効き難そうな感じがある(DirectShowフィルタで無理矢理は可!?)のと搭載されているCELLに45nmでの製造が囁かれている事などから私的には時期早々かと思ってます。
DDR3はマザーボードの変更がいりますし価格も今のDDR2の異常な値下がりと比べればちょい敷居が高そうですね。そもそもメモリの高速化はパフォーマンスに直結し難いですし(CUDA使用時には低速なメモリがボトルネックになっているという話はあるが)
あるサイトではCUDAは処理能力はプロセッサコアに比例するって話ですからメモリや動作周波数には依存せずGTX2xxやGF9xxx、GF8xxxはコア数に比例するのかな?
もしGPGPUの処理能力が総合コアに比例してパフォーマンスが上がるってんならAMD(ATI)のRadeonHD4850の総合800なんてGTX280の総合240なんて嘲笑うような強烈な潜在能力を秘めていることになるんだが・・・・(残念ながら環境が整わないからな・・・汗)
新規殿のGF9600GTが総合64だから最速のGF9800GX2が総合256だから比例するとしたら4倍の処理能力か?
怪物級を乗せるとしたらELSA GLADIAC 998 GX2 1GB (PCIExp 1GB)が49799円だそうだCUDAがSLIで動くか分からんがコア的には総合256で現状最速スペックだな ただクーラーがヘボで上手く廃熱できんって書き込みが・・・ 滝汗
GTX280なら最低5万3千から最高7万4千まで・・・・・・・て差が在り過ぎじゃないか!?
ヒロ
2008-11-11 16:30:08 ( ID:3.bw.cfirv. )
[ 削除 / 引用して返信 ]
メモリの高速化についてですが
*ttp://hibiki.oops.jp/wordpress/ddr2-ddr3-encoding-comparison2/
↑上記のサイトでは倍ぐらいになんか速くなるという検証結果でてますね
自分で検証できてないのでなんとも言えませんが
ただ、OCしてもクロック上げるためにDDR2でFSB:DRAMを1:1にして800Mに押さえ
込むとエンコスピードはクロックを上がったのにほとんど変わらないという実感
はあります
くるぅ
2008-11-12 04:14:03 ( ID:t0cvi9ydo9f )
[ 削除 / 引用して返信 ]
たしかに速くなっているみたいだな・・・・何故だ? そもそもIntelはメモリとCPU間にチップセットとの帯域が存在するからそれ以上速いメモリ帯域を持つDDR3を付けた所で意味無い筈なのだが・・・・汗
FSB1600NHzで帯域12.8GB/s DDR2-800をデュアルで動作させれば12.8GB/sのメモリ帯域を持つはずだ・・・
CUDAならビデオボードとメモリ間の帯域だから分かるんだが・・・・
くるぅ
2008-11-12 05:11:22 ( ID:t0cvi9ydo9f )
[ 削除 / 引用して返信 ]
*ttp://hibiki.oops.jp/wordpress/ddr2-ddr3-encoding-comparison2/
上記サイト以外にもDDR3で半分近くになっているサイトを発見
ttp://cato.blog.so-net.ne.jp/2008-08-11
モバイルノートのエンコード比較だがDDR3が速いのは確かなようだ・・・滝汗
ノートの帯域は1066MHzなんだが・・・・1回のデータ交換で扱えるデータ量が増えたって事なのか!? (FSBまで一度に扱えるデータ量が増えるって事になるんだが)
新規ユーザー
2008-11-16 12:24:18 ( ID:tj46my1klcm )
[ 削除 / 引用して返信 ]
こちらのスレッドでDDR3関係の検証が行われているようです
TMPGEnc講座 Ver.39
http://pc11.2ch.net/test/read.cgi/avi/1225759170/
新規ユーザー
2008-11-21 15:46:57 ( ID:zyawvodlutm )
[ 削除 / 引用して返信 ]
結局DDR3で高速化というのはデマだったようですね
|