2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

GPGPU#3

1 :デフォルトの名無しさん:2009/03/21(土) 19:18:14
GPGPUについて語りましょう

前スレ
GPGPU#2
http://pc11.2ch.net/test/read.cgi/tech/1188374938/

関連スレ
http://pc11.2ch.net/test/read.cgi/tech/1228891105/
http://pc11.2ch.net/test/read.cgi/tech/1206152032/

参考リンク
総本山? gpgpu.org
http://www.gpgpu.org/
OpenCL
http://www.khronos.org/opencl/
NVIDIA CUDA
http://developer.nvidia.com/object/cuda.html
ATI Stream
http://developer.amd.com/gpu/ATIStreamSDK/Pages/default.aspx
GPUをCPU的に活用するGPGPUの可能性
http://pcweb.mycom.co.jp/articles/2005/09/06/siggraph2/

2 :デフォルトの名無しさん:2009/03/21(土) 19:20:36
このスレッドは天才チンパンジー
「アイちゃん」が
言語訓練のために作成したものです。

アイと研究員とのやり取りに利用するスレッドなので、関係者以外は書きこまないで下さい。

3 :デフォルトの名無しさん:2009/03/21(土) 19:43:28
そうか

4 :,,・´∀`・,,)っ-●◎○:2009/03/21(土) 22:13:33
だんごやさんだよ

5 :デフォルトの名無しさん:2009/03/22(日) 18:15:46
しょぼいNECマシンでも刺せるnVIDIAグラボってことでQuadro FX570を導入して、
SETI@homeの計算をさせたんですけど、画面表示能力が著しく低下するし、
CPUの1コア分より計算時間がかかるという現象が起きるのですが、
誰か他にも同じようなことになってませんか?
それとも私の設定がおかしいのでしょうか?

6 :デフォルトの名無しさん:2009/03/23(月) 12:20:56
FX570って、8600GT相当のFX1700のメモリ少ない版じゃなかった?
どう考えても、CUDAは「動かせる」だけで実用になるとは思えないんだけど。

7 :デフォルトの名無しさん:2009/03/23(月) 12:25:47
それって、今だったら9400GT並み?
普通に9600GTが1万円も出せば買えるのに……

8 :5:2009/03/23(月) 19:09:53
泣きたくなった。てかQuadroはCADとか3Dレンダリングとかに
使えるのが売りなのに、たぶんこれ刺しても意味ないと思う

かといって、9600GTはワット数に多少の不安があると思うし、
FX570を走らせた感覚からして9600GTを走らせた場合
たぶん最適化かけたAstropalseにはかなわないんじゃないかと
(スコア的な意味で)

そこの所どうなんでしょう?

ちなみに自分はValuestar M(Gタイプ)でCore2Quad2.66GHz使ってます。

9 :デフォルトの名無しさん:2009/03/23(月) 19:30:38
QuadroFXの売りは、NVIDIAが品質を保証しているために価格が馬鹿高いことだよ。
別にQuadroFX用にチップを用意しているわけじゃないからCADに最適化されているわけでもない。
NVIDIAの営業氏の言う処の「アキバ的思想」でいいならGeForceで充分。

10 :5:2009/03/23(月) 22:44:20
VALUESTARの電源にMAX250Wって書いてあったwww
このマシン最大で246W食うってマニュアルに書いてあるから
FX570が動くのがやっと...ってかすぐはずさないと電源やられちまうかも

11 :デフォルトの名無しさん:2009/03/26(木) 06:08:51
http://game.watch.impress.co.jp/docs/series/3dcg/20090325_79920.html
 ピクセルシェーダーとDirectX演算シェーダーで、ランダムメモリアクセスができるようになってしまった関係で面倒になるのが、
複数スレッドからの同一メモリアドレスアクセスの管理だ。
実行タイミングによってメモリの内容が変わってきてしまう可能性もでてくるわけで、
これはマルチスレッドプログラムで起こりうるデバック困難な現象を生みかねない。
そこでDirectX 11におけるピクセルシェーダーとDirectX演算シェーダーでは
Atomic Operation(不可分操作)に対応した命令がサポートされている。

12 :デフォルトの名無しさん:2009/03/26(木) 07:35:31
なぜGPGPUスレでValuestarが出てくるのww
GPGPUやる前にPC構成を頭に入れろよww順番間違えてるよww

あ、高校生でしたか・・・すいませんでした。

13 :デフォルトの名無しさん:2009/03/26(木) 16:18:46
>>9
VGABIOSレベルでOpenGLの性能が段違いだったような気がするが
過去の話か?
まぁGPGPUだったらGTX295買っとけば問題無いな

14 :デフォルトの名無しさん:2009/03/26(木) 16:20:28
あ、>>13は同等チップのGeforceとQuadroを比べた場合ね
さすがにQuadro FX570なんてゴミじゃ遅いw

15 :デフォルトの名無しさん:2009/03/26(木) 22:50:46
やっと2GのRadeon出たな


16 :デフォルトの名無しさん:2009/04/03(金) 21:12:28
買い?

17 :デフォルトの名無しさん:2009/04/14(火) 12:10:11
ATI Stream開発者向け資料まとめページ
ttp://developer.amd.com/gpu/ATIStreamSDK/pages/Publications.aspx

18 :デフォルトの名無しさん:2009/04/26(日) 11:36:47
NVIDIA、並列コンピューティング技術「OpenCL」のドライバとSDKを開発者向けに提供
ttp://sourceforge.jp/magazine/09/04/22/0915222

19 :デフォルトの名無しさん:2009/04/26(日) 11:59:02
ATI Streamは2010年のQ2以降まで
OpenCLに対応不可能らしい

なんでか知りたい

20 :デフォルトの名無しさん:2009/04/26(日) 12:07:37
その頃にはLarrabee出るやん
ATI STREAMオワタ

21 :デフォルトの名無しさん:2009/04/26(日) 13:03:21
ラビがでなくてもストリームは既に終わってる

22 :デフォルトの名無しさん:2009/04/26(日) 20:24:32
AMDは本当に駄目な子・・・

23 :デフォルトの名無しさん:2009/04/26(日) 20:37:29
>>19
なんで?

24 :デフォルトの名無しさん:2009/04/27(月) 00:17:03
大人の事情、じゃね?

25 :デフォルトの名無しさん:2009/04/27(月) 07:17:33
最近OpenCLのhavok clothやってましたが
なにか?

26 :デフォルトの名無しさん:2009/04/27(月) 08:06:51
そういやPPUって58gflopsだったらしいな
で、実パフォーマンスは9600GT(312gflops)をphysx専用に使った場合と同じ

27 :デフォルトの名無しさん:2009/04/27(月) 08:45:52
>>19
2009年上半期中に対応予定だろ。


28 :デフォルトの名無しさん:2009/04/27(月) 23:04:36
>>27
それずれた
29日にスキンヘッドのおっさんショーに行って
聞いてみなよ

29 :デフォルトの名無しさん:2009/04/28(火) 10:12:05
で、いつになったの?

30 :デフォルトの名無しさん:2009/05/08(金) 10:07:00
CUDA 2.2 released
http://forums.nvidia.com/index.php?showtopic=96303

31 :デフォルトの名無しさん:2009/05/16(土) 11:30:38
そろそろATIはCUDAに敗北宣言出すね

32 :デフォルトの名無しさん:2009/05/16(土) 19:49:57
atiのってHPCへの採用事例とかあるんだろうか。

33 :デフォルトの名無しさん:2009/05/16(土) 19:59:40
>>32
無いね海外でも採用事例作れないらしく
切り捨てるかもって話だね

34 :デフォルトの名無しさん:2009/05/16(土) 20:35:30
性能出したかったらILで書けってのがまずいんだろうか。
その辺nの方はどうなんか知らんけどさ。

遊びで弄る分には低レベルなところを見れるのは面白いんだがな。

35 :デフォルトの名無しさん:2009/05/16(土) 22:36:02
>>34
実用上、ILで書けば早いよ!なんてのは使い物にならん
それが通るならCellももっと普及したはずだしな

CUDAの強みはほぼCの構文だけで書けて、かつ理論値と見比べても悪くない性能を出せること
まぁブラックボックスが多すぎて、最適化がむずいって問題はあるんだが

36 :デフォルトの名無しさん:2009/05/17(日) 02:41:48
最適化を頑張るより、新しい高性能グラボ買え!ってことなんだろう。

37 :,,・´∀`・,,)っ-○○○:2009/05/17(日) 22:21:18
報いを受けなければならんね

38 :デフォルトの名無しさん:2009/05/17(日) 22:30:14
ATIはOpenCLのサポート作業が
暗礁に乗り上げててリリース不可能と言われてるしなぁ

39 :デフォルトの名無しさん:2009/05/17(日) 22:52:18
OpenCL自体がCUDAベースだし、ATIがサポートするのはきついだろうな
同じ土俵でどっちが早いのか気にはなるから頑張っては欲しいけど

40 :デフォルトの名無しさん:2009/05/17(日) 23:09:39
そもそもATIのGPUって性能あんまり
出ないしOpenCA化しても性能全然発揮できなくないか?



41 :デフォルトの名無しさん:2009/05/17(日) 23:17:51
>>40
絶対性能ならそうだろうけど、電力やコストとの兼ね合いもあるからそこまで悪くはないと思われる
性能だけならHPCに力入れてるnVidiaが強いけど、実用用途じゃ電力だとか色々制約もあるのよ

42 :デフォルトの名無しさん:2009/05/17(日) 23:21:04
>>41
でも現実的にそうだとしてもVLIW系のアーキテクチャで
並列性上げるってそうとうつらくない?
資金無限にあるように見えるIntelですら投げ捨てたものでしょ?

43 :デフォルトの名無しさん:2009/05/17(日) 23:23:09
>>42
それについては結局演算の割り当てとかを考えながら最適化していく事になると思うよ
CUDAでブロックサイズ変えたりアライン変えたりしてるみたいにね
その辺も含めて試してみたいし期待してる
確かにVLIWで性能だそうと思ったら、アプリケーションも限られてくるし実装も相当面倒くさくなりそうだけど

44 :,,・´∀`・,,)っ-○○○:2009/05/17(日) 23:30:35
悪くとも「32コアの64ビットx86プロセッサ」としては使える

45 :デフォルトの名無しさん:2009/05/17(日) 23:50:12
>>43
結局それだと、HavokClothのためにRadeon使います
か各アプリ用に無理にでもRadeon使うって感じですよね。

ダンゴさまが得意なララビーでも待とうかなぁ
OpenCAとか暗号関係にCUDA使いたかったけど
普通の数値演算以外適合力無さ過ぎて途方にくれているw

46 :デフォルトの名無しさん:2009/05/17(日) 23:52:37
難しい難しいって言うけどさ、実際そんなに難しいのか?
VLIWのコード最適化なんてもう数十年も研究されてるし、科学技術計算
や信号処理用の商用機だってそれなりの数が出てるわけでさ。

性能が出ないのは単にコード書く人間の調査不足って事はないんだろうか。

47 :デフォルトの名無しさん:2009/05/17(日) 23:54:02
>>45
CUDAは並列性が高くないと性能出せないからね
暗号みたいに、次々チェインしていくようなルーチンには根本的に合わない

48 :デフォルトの名無しさん:2009/05/17(日) 23:56:05
>>46
歴史は長いけど、その割には普及してないでしょ?要はそういうこと
すっごい頑張れば、すっごい性能出るよ!ってのは一部の人間(HPC分野)にはウケが良くても
結局実務じゃ使い物にならないのよ
んで、数が捌けないと値段も下がらないし、次も出てこない

49 :デフォルトの名無しさん:2009/05/17(日) 23:57:18
>>46
効率の良い扱いの良いVLIWをどうやって最適化するかという
文献はあるけど、既にある特定の分野に特化したVLIWを
多目的に最適化するという技術論文は見当たらないなぁ
あるなら欲しいのでリンク教えていただけますか?





50 :デフォルトの名無しさん:2009/05/18(月) 00:06:43
>>49
R700のVLIWアーキテクチャて具体的にはどの辺が特定の分野に特化してるわけ?

51 :デフォルトの名無しさん:2009/05/18(月) 00:46:35
Itanium(EPIC)がOOOで爆速になるというネタが昔あったな

52 :,,・´∀`・,,)っ-○○○:2009/05/18(月) 00:51:12
3-issue(9バンドル)をOoO実行することで80%性能向上だっけか?ww

いまのx86は命令エンコーディングそのものを演算の依存関係の解決に使う方式をとってるから
絶対性能的には微妙かも

53 :デフォルトの名無しさん:2009/05/18(月) 01:25:25
そういえばIntelはPolarisでまたVLIWのプロセッサ作ってるんだよな
65nmプロセスで1TFlops, 98W, 275mm2
こういうのも検討した上でLarrabeeでの保守的な選択がある
示唆的だね

54 :,,・´∀`・,,)っ-○○○:2009/05/18(月) 02:17:19
9-issueの3バンドルだな、間違い

55 :デフォルトの名無しさん:2009/05/18(月) 07:55:49
結局この分野でも、実用性はnVIDIAに軍配が上がるのか

56 :デフォルトの名無しさん:2009/05/18(月) 08:22:50
>>50
塗絵

結局OpenCLでHavok Clothやっても自社4 core cpuよりパフォーマンスが劣っていて
GW前のイベントでは1体はGPU,3体はCPUで動かし、
(モーション止めた状態で、CPUに切り替えたがドレスは微妙に動いていたわけで、CPUに切り替えたとたん軽くなったw)
GPUでやるのが良いと言うわけではないとか苦しい言い訳してたよ

VLIW以前に、R600系はG80系よりも演算粒度がでかすぎ
1アレイでshader 16個並んでるけど物理演算だとそのほとんどが遊んでる

57 :,,・´∀`・,,)っ-○○○:2009/05/19(火) 06:05:14
メモリ帯域依存の設計なんてやめてしまえばいいのにね
SMあたりのキャッシュメモリを数百KB確保してワークセット数減らしたほうが
明らかにキャッシュが無いせいでVRAM読み書きせざるを得なくなり、更にそのレイテンシ隠蔽のために
ワークセット数をアホみたいに増やさないといけない。
どんな悪循環だよ。

物理演算エンジンとしてもCellのほうがまだマシなレベルじゃね?

58 :デフォルトの名無しさん:2009/05/19(火) 08:50:44
CPUで十分動く程度という時点で仕事が小さすぎるんだよ。
元々GPUがメインターゲットとしているのが、CPUでやると
10倍100倍時間がかかるからセットアップに多少時間がかかっても
元が取れるような処理なのだから。

GPU処理のときにメッシュ数が16倍になって
より滑らかになりますみたいなデモのやり方をしないと
GPUのメリットは出にくい。

まあ元々GPUのメリットをアピールするための
デモではなかったということだな。

59 :デフォルトの名無しさん:2009/05/19(火) 17:51:06
DX11世代ではメモリ周りが大きく変わると思うんだ

60 :デフォルトの名無しさん:2009/05/19(火) 21:44:34
http://developer.amd.com/SAMPLES/STREAMSHOWCASE/Pages/default.aspx
ATI Stream Developer Showcase

61 :デフォルトの名無しさん:2009/05/19(火) 22:48:16
塗り絵もここまでやれば立派だと思う
http://developer.amd.com/gpu_assets/ATIGPGPUComputingFusionRenderCloudGDC09CompatibilityMode.pdf

62 :デフォルトの名無しさん:2009/05/19(火) 22:56:14
失礼な奴だな

63 :デフォルトの名無しさん:2009/05/21(木) 01:15:35
>>60
python用のライブラリなんかあるんだな。
何故かVSでbrook+コンパイラが動かないんでそっちに行ってみるか。。。

64 :デフォルトの名無しさん:2009/05/24(日) 17:36:56
radeonでN体問題

ttp://jp.arxiv.org/pdf/0904.3659v1

65 :デフォルトの名無しさん:2009/05/24(日) 19:46:19
こないだラデスレに投下されたやつか

66 :デフォルトの名無しさん:2009/05/24(日) 20:09:39
この論文と参照論文見ながら
作ってるけど同じ数値にならんなw

俺腐ってるぜw

67 :デフォルトの名無しさん:2009/05/24(日) 20:40:47
R700のISAの解説、R600のより微妙に分かりやすくなってる気がする。

68 :デフォルトの名無しさん:2009/05/24(日) 22:17:13
http://galaxy.u-aizu.ac.jp/trac/note/
ここのか

69 :デフォルトの名無しさん:2009/05/24(日) 22:29:32
>>67の事ならamdの公式リファレンスの話だが、日本語の解説があるとは知らなかったな。
ありがてぇ。

70 :デフォルトの名無しさん:2009/05/24(日) 22:31:25
>>68のリンクみて
自分の理解不足発見wktkしてきた


だがしかし、月曜日が近づいてきた
どうしよう会社どうしよう

71 :デフォルトの名無しさん:2009/05/24(日) 22:41:37
やめちゃえよ
 じひょうをかいて
  やめちゃえよ

ちなみにヒラ社員は退

72 :デフォルトの名無しさん:2009/06/13(土) 04:10:23
GPGPUはDirectX11で花開くんだろ。
エンコード高速化対応お待ちしております。

DirectX 11講座(中編)
非ゲーマーのアナタのパソコンも
DirectX 11演算シェーダーでスーパーコンピューターに変身する!
http://game.watch.impress.co.jp/docs/series/3dcg/20090327_79998.html
GPGPUの場合は、組んだGPGPUプログラムがATIかNVIDIAのどちらかでしか動かない、
踏み絵的な「ATI対NVIDIA」なのだ。
これではGPGPUの進化、発展、普及が望めない。
そこでGPGPUの標準化プラットフォームが強く望まれるようになった。
このGPGPU標準プラットフォームを、Windows環境下で提供しようと出てきたのがDirectX 11ということになる。
DirectX 11は、このGPGPUの標準プラットフォームとして「DirectX Copmute Shader」(演算シェーダー)を提供する。

演算シェーダーでなにができるのか
http://game.watch.impress.co.jp/img/gmw/docs/079/998/html/3dd1103.jpg.html

73 :デフォルトの名無しさん:2009/06/14(日) 15:32:58
OpenCLの政治力不足で
DirectX11に負けそう


74 :デフォルトの名無しさん:2009/06/14(日) 19:07:55
科学技術計算とかのGPGPU用途ならOpenCL一択だろ。

75 :デフォルトの名無しさん:2009/06/14(日) 19:09:31
>>74
金と開発力の関係が
急速に悪くなっててやばいんだよ


76 :デフォルトの名無しさん:2009/06/14(日) 20:19:34
OpenGLとDirect3Dみたいに棲み分け……られるのか?

77 :デフォルトの名無しさん:2009/06/14(日) 20:26:04
>>75
仕様はともかく実装はベンダー任せじゃないの?

78 :デフォルトの名無しさん:2009/06/14(日) 20:57:39
OpenGLよりも棲み分けし易いんじゃね。
コンシューマ用途じゃ、扱う問題が小さい+レスポンス重視だから
GPGPUが有効な物でも実力の10%程度しか出せないものが殆ど。

GPGPUが本当に有効に働くのは、スパコンでやるような
大規模な科学技術計算みたいなものなのだから


79 :デフォルトの名無しさん:2009/06/14(日) 21:01:39
使えるとしてPhysXやHavokみたいなゲーム物理ぐらいだからね
まぁDirectXとのInteroperabilityがもっと上がったら、テクスチャ動的生成とかに使えそうな気はするけど

80 :デフォルトの名無しさん:2009/06/14(日) 21:16:00
結局後出しで競争も激しいCopmute Shaderの方がパフォーマンスで勝りそうな予感

81 :デフォルトの名無しさん:2009/06/14(日) 21:22:50
Windows最強ってことだなうん

82 :デフォルトの名無しさん:2009/06/15(月) 01:17:56
まあある意味では真なんだろうなあ

でもMSって対抗馬がいないと頑張らないからMSファンにとってもOpenCL重要

83 :デフォルトの名無しさん:2009/06/16(火) 00:13:35
DirectXとOpenGLの関係と同じで、WindowsだとCompute Shader、
他のOSではOpenCLって感じに棲み分けができるんでは?
最終的にはPhysXとHavokもDirectXに統合されるんじゃないかね。
GPUメーカー依存の規格は最終的には滅ぶ。

84 :デフォルトの名無しさん:2009/06/16(火) 00:25:41
>>83
いやそれは無い
Intelが新しいGPUの代理店募ってるし
既存のチャンネル潰してIntelに振り分ければ
報奨金出るから、今後の情勢として代理店レベル
開発者レベルどの層でもIntelとMSの独自規格で
占められるはず。



85 :デフォルトの名無しさん:2009/06/16(火) 00:44:22
ECに目を付けられているから報奨金はもう出ないでしょ
○万個ただであげるとかだよw

86 :デフォルトの名無しさん:2009/06/16(火) 01:03:38
nVidiaは近く廃れると思う

87 :デフォルトの名無しさん:2009/06/16(火) 02:02:18
つってもATiは昔から新規格ブチ上げたりデモしたりするのは早いけど普及がダメダメじゃん。
StreamとかHavokとか。OpenCLも発表だけは早かったけど今はNVに水あけられてるだろ?
IntelはATiを上回る糞ドライバっぷりで、ららびーが出た時点ではまともに動作するのかも怪しいし。
NVの優位はそう簡単には覆らないんじゃないの?
NVが大ポカして、なおかつATiとIntelが驚異の改善でもしない限り。


88 :デフォルトの名無しさん:2009/06/16(火) 02:06:44
現状GPGPU技術ではnVidiaの一人勝ち感があるなぁ。
Intelがもうちょっと別方向のアプローチで頑張ってくれるといい競争になると思うんだけど。
ATIにはもう期待しとらん。。。

89 :デフォルトの名無しさん:2009/06/16(火) 02:08:58
LarrabeeのドライバとGMAのドライバは帰属するグループが異なるから何とも言えん
先日WindRiver買収したけどここのコンパイラがヘボでもICCダメって話にはならんわけで

90 :デフォルトの名無しさん:2009/06/16(火) 20:15:20
なんでATIが出てくるんだ?
HavokはIntelだしOpenCLはAppleですよ?

91 :デフォルトの名無しさん:2009/06/16(火) 20:23:30
>90
ATiはHavokと契約してライセンスうけとるよ
あとOpenCLは名前の通りオープン規格だし、規格策定にはAMD、nVidia、Intelを含む主要メーカーが参加してる
別にApple専用規格じゃない

92 :デフォルトの名無しさん:2009/06/16(火) 20:32:02
>>89
Larrabeeのドライバは元ATIとNvidiaのエンジニア
で構成される主力部隊で開発しているから
完成度は従来よりも高いよ

93 :89:2009/06/16(火) 20:35:11
>>92
実物が出てないので判断は保留ということで

94 :デフォルトの名無しさん:2009/06/16(火) 21:29:53
>>93
9月後半か10月中旬に配られるから
大丈夫順調順調

95 :デフォルトの名無しさん:2009/06/16(火) 23:17:51
>>88
>現状GPGPU技術ではnVidiaの一人勝ち感があるなぁ。
しかし、GPGPU自体が、全然勝ち感がないね。。

96 :デフォルトの名無しさん:2009/06/16(火) 23:23:58
現状、GPUを跨いだ規格であるCompute ShaderやOpenCLがテスト段階だからね。
いわば始まってもいない状態で、勝ち負けを語る段階にない。

97 :デフォルトの名無しさん:2009/06/16(火) 23:32:19
>>96
90%Compute Shaderって言われてるよ
1社で1500億円投入すると言われている

OpenCLは集金がもう破綻していて
そろそろ予算尽きる

98 :デフォルトの名無しさん:2009/06/16(火) 23:40:11
とはいってもCompute ShaderがWindows専用品であるDirectXの一部である以上、
OpenCLは計画が幾ら遅延しようとUNIX系列やその他のOS用に開発は続行されるだろう。

99 :,,・´∀`・,,)っ-○○○:2009/06/16(火) 23:56:32
GPUで何かやろうって考える人の方が稀だ。

100 :デフォルトの名無しさん:2009/06/16(火) 23:57:56
HPC分野だとUnix/Linux優勢だから(クラスタとかの兼ね合いでね)Compute Shaderの一人勝ちは無いと思うよ
もちろん、nVidia PhysXみたいなコンシューマ用途に限るのであればCompute Shaderが優位だとは思う

101 :,,・´∀`・,,)っ-○○○:2009/06/16(火) 23:59:20
Ctのほうが好みだな

102 :デフォルトの名無しさん:2009/06/17(水) 00:04:12
>>99
ですよねーw

103 :デフォルトの名無しさん:2009/06/17(水) 01:59:34
大量の並列数値演算をする用途じゃないとGPGPUのメリットがない
中途半端だとVRAMとのメモリ転送などがあるからかえって遅くなる

だから一般アプリではあまり用途がないんだよね

104 :デフォルトの名無しさん:2009/06/17(水) 07:04:17
その辺のCUDA2.2の取り組みは面白いな

105 :デフォルトの名無しさん:2009/06/17(水) 23:33:03
初心者なんですがGPGPUについて
京都大学の掲示板で
>nvidiaのグラフィック統合チップセットで、このatomの弱点を補うことはできない
>IONがそもそもGPGPUとは違う話である

という主張があるんですが、そんなにGPGPUってカスなの?

http://www.kyoto-u.com/lounge/pc/html/200903/09030002.html

106 :デフォルトの名無しさん:2009/06/17(水) 23:38:45
>>105
Larrabee以外はカスだね

107 :デフォルトの名無しさん:2009/06/17(水) 23:46:37
>>105
それを書いてる奴の文章が、有り得ないくらい糞だから読解しづらいけど
要約すると「動画再生とか一部の用途に限ってはIONでAtomを補えるが、それ以外では役に立たない」ってことでしょ

で駄文の読解はそこまでとして、GPGPUは向いてる用途(ベクトル化、並列化がしやすくてかつ重い)に関しては十分な性能を持ってる
ただ、まだまだGPGPUに移植するのが面倒なのと、その上で性能を出すのが面倒だから今一はやらない
Google Scholarで、GPGPUとか「GPU acceleration」とかで検索かければ山ほどヒットするはずだから
興味有るなら自分で読んでみるのがいいと思うよ

108 :デフォルトの名無しさん:2009/06/17(水) 23:50:32
CALでQ-Learning解いたサンプルないっすか?

109 :デフォルトの名無しさん:2009/06/18(木) 00:27:08
105です。レスありがとうございます。
なんだかアンチマックかGPGPUを憎悪しているのか
希望の光を遮られていたような気分でしたが、
ちょいとホッとしました。まだまだこれからですね。

110 :デフォルトの名無しさん:2009/06/18(木) 00:34:24
GPUは良くも悪くもただの並列計算機。
それもすごくシンプルな。
並列化しにくい問題や分岐が厳しい問題には向いていない、というか使えない。
ごく一部の処理は速くなるけど、IONがあるからといってAtomがCore 2 Duoの性能になるわけじゃない。

111 :デフォルトの名無しさん:2009/06/18(木) 03:34:23
そもそもオンボッボのnForce9300の並列計算能力が、
Core2QuadのSSEに負けるからなぁ。

112 :,,・´∀`・,,)っ-○○○:2009/06/18(木) 03:48:00
2 issue発行のロード・ストアアーキテクチャでSPの積和算とSFUの乗算のスループットを足してるから
最大スループットの理論値自体がかなり無茶なんだよ。

Cell SPEですら一応は積和算を発行しつつロード・ストアが並列実行できるような設計になっている。

113 :デフォルトの名無しさん:2009/06/18(木) 07:21:03
windows以外のGPGPU用途が果たして必要なのかと

114 :デフォルトの名無しさん:2009/06/18(木) 07:27:52
>>112
ですよねーGPGPUなんてバカネタですもんねー

115 :デフォルトの名無しさん:2009/06/18(木) 17:36:55
>>105
GPGPUはともかく、その掲示板って天下の京大生が書いてるとは思えない
APPLE製PC だとか IONがそもそもGPGPUとは違うだとか
アホの巣窟みたいだ

116 :デフォルトの名無しさん:2009/06/18(木) 19:35:28
>>115
激しく同意。
叩かれてるやつの態度はともかく言ってること自体は比較的マシで
他のやつの理解度とレベルが低すぎるだけだなぁとか思いながら読んでた。


117 :デフォルトの名無しさん:2009/06/18(木) 20:05:38
>>116
文章が読みづらくはあるが、書いてることは概ね的を得てるからな
周りが京大生の掲示板とは思えないレベルの低さ

118 :デフォルトの名無しさん:2009/06/18(木) 20:30:49
マカーきめぇwwwww

119 :デフォルトの名無しさん:2009/06/18(木) 20:32:30
京大でも大半は18〜24の若造だが、これは年齢相応と言うには度を越してる

120 :デフォルトの名無しさん:2009/06/18(木) 21:56:09
京大って強姦魔いるところだろ?

121 :デフォルトの名無しさん:2009/06/18(木) 23:12:09
つか、京大も東大も、
バカは本当にバカだぞ。

圧縮解凍ソフト界隈は、東大の連中が多いが、
本当にどうしようもない奴もいる。

122 :デフォルトの名無しさん:2009/06/18(木) 23:26:01
>>121
バカっていうより下半身だらしない奴が多い


123 :,,・´∀`・,,)っ-○○○:2009/06/18(木) 23:45:12
!Kubotar思い出した
あの人は京大だったよな

124 :デフォルトの名無しさん:2009/06/19(金) 00:29:53
>>122
ワレザを公言しちゃうような奴も多い

125 :デフォルトの名無しさん:2009/06/19(金) 00:40:21
APPLE製PC 俺も欲しいwwwwwwwwww
PC君 とマック君のCMがあったけど 融合したってことか?wwww

126 :デフォルトの名無しさん:2009/06/19(金) 00:42:51
>>121
WINNYで逮捕されたのも東大だったような・・・・
強盗で逮捕された関西のK大もそうだがお勉強は出来ても
人格的に問題ある奴多そう

と、cabos愛好家の俺が言ってみるテスト

スレチガイスマソ

127 :デフォルトの名無しさん:2009/06/19(金) 12:55:20
ny作者は東大出じゃないと思ったけど

128 :デフォルトの名無しさん:2009/06/19(金) 13:42:00
学歴話はヨソでやれ

129 :デフォルトの名無しさん:2009/06/19(金) 23:14:53
use calc::gpgpu;

みたいにするだけで計算力うpするライブラリまだー?

130 :デフォルトの名無しさん:2009/06/20(土) 03:29:59
ゆとり教育世代を舐めんな!!



想像を絶する馬鹿さ加減だぞ。
新人教育担当が馬鹿の壁にブチ当たって、
次々と鬱で休職に追い込まれてる。

131 :デフォルトの名無しさん:2009/06/21(日) 00:38:10
OpenCLってやっぱりAppleが仕様を
俺俺仕様にならないことに難色を示していて
どうやら1.0の正式版がリリースされるのは
2010年半ばのようだな

132 :デフォルトの名無しさん:2009/06/21(日) 00:54:09
ついさっきNVIDIAのドライバリリースのニュース見たが・・・

133 :デフォルトの名無しさん:2009/06/24(水) 21:04:52
AMDはDX11に集中的リソース投入するから
OpenCLはほぼ進展させないみたいだね

投資も引き上げるのほぼ確定気味だし

134 :デフォルトの名無しさん:2009/06/24(水) 22:27:10
オープンオープンと声高に叫んで結局その程度だったか

135 :デフォルトの名無しさん:2009/06/25(木) 00:35:51
高い金払ってその程度に満たないものも多いがな。

136 :デフォルトの名無しさん:2009/06/25(木) 06:37:48
AppleとかM$とかガチガチclosed体質企業に、Open〜とか無理。

137 :デフォルトの名無しさん:2009/06/25(木) 07:28:49
OpenCLはAppleがOKを出さないと
だめだからなぁ



138 :デフォルトの名無しさん:2009/06/25(木) 17:46:34
msがclosedとか馬鹿も休み休み言え。

139 :デフォルトの名無しさん:2009/06/25(木) 17:59:41
まあ、MSは昔よりはオープンになってきたよな。
Googleとは好対照な感じだわ。

140 :デフォルトの名無しさん:2009/06/25(木) 21:54:21
どっちにしろDirectXはオープンじゃないけどね

141 :デフォルトの名無しさん:2009/06/25(木) 22:40:15
interfaceと仕様のオープンで十分。実装までオープンしろとか言ってる奴はコピペ厨。

142 :デフォルトの名無しさん:2009/06/26(金) 06:34:33
Win32APIもhiddenだらけ

143 :デフォルトの名無しさん:2009/06/26(金) 06:35:37
Open Sourceに非らずは、Openに非らず--R.M.S

144 :デフォルトの名無しさん:2009/06/26(金) 08:01:28
要出典

145 :デフォルトの名無しさん:2009/06/26(金) 11:21:50
RMSが「オープンソース」についてそんな発言するなんてありえんだろ。
free(自由)にあれだけこだわるんだから。

146 :デフォルトの名無しさん:2009/06/26(金) 15:06:47
MSがクローズドなんて、一度IBMと仕事で関わってから言えw

147 :デフォルトの名無しさん:2009/06/26(金) 21:02:34
Oracleのサポートに関わるとMSのサポートは神対応に思えるね。

148 :デフォルトの名無しさん:2009/06/26(金) 22:27:11
NvidiaがAMD向けのチップセット出さなくなると
AMD用のマザーボードでGeforceが動作しなくなるそうだ



149 :デフォルトの名無しさん:2009/06/27(土) 11:39:17
それは驚きだな

150 :デフォルトの名無しさん:2009/06/27(土) 13:43:25
たぶんnForceのこと

151 :デフォルトの名無しさん:2009/06/29(月) 01:08:11
新趣向:12桁SHA-1トリップ

http://qb5.2ch.net/test/read.cgi/operate/1245724530/

152 :,,・´∀`・,,)っ-○○○ ◆??? :2009/06/29(月) 22:19:58
乞食うぜっwww

153 :デフォルトの名無しさん:2009/06/29(月) 22:25:22
メインサポが終わってDXCSも使えないXPはスルーで良いでしょ

154 :デフォルトの名無しさん:2009/06/29(月) 22:34:13
>>152
先生ATIは見限っても大丈夫ですよね?
はやりませんよね?

155 :,,・´∀`・,,)っ-○○○ ◆??? :2009/06/29(月) 22:41:56
SSEとかの延長で考えるならLarrabeeが一番楽

156 :デフォルトの名無しさん:2009/06/30(火) 07:01:41
実際にSSEライクなshader(Centaur設計)を搭載した
S3 Chrome400/500の実行効率は半端無いね

157 :デフォルトの名無しさん:2009/06/30(火) 10:52:34
choromeの内部構造公開されてるならリンクくれ

158 :デフォルトの名無しさん:2009/06/30(火) 19:28:59
ttp://www.computerbase.de/artikel/hardware/grafikkarten/2008/test_s3_chrome_440_gtx/
ttp://farm4.static.flickr.com/3033/2433836498_f836563488_o.jpg

ttp://pc.watch.impress.co.jp/docs/column/kaigai/20090626_296571.html
ちなみに、S3 Graphicsも、同じVIA Technologies傘下のCPUメーカーCentaur Technologyの支援を受けてカスタム設計を部分的に採用していると言う。

159 :デフォルトの名無しさん:2009/06/30(火) 19:42:32
お粗末過ぎて笑う気にもならん

160 :デフォルトの名無しさん:2009/06/30(火) 20:12:09
なにが?

161 :デフォルトの名無しさん:2009/06/30(火) 21:00:54
ttp://www.youtube.com/watch?v=pGnrBu3N2QE
まぁ、理論パフォーマンス1/10程度の540に
ここまでせまられたら、お粗末だわな

162 :デフォルトの名無しさん:2009/07/01(水) 10:46:19
混沌としてるな

北森瓦版 - AMDはNVIDIAのCUDAをサポートするのか?
ttp://northwood.blog60.fc2.com/blog-entry-2939.html


163 :デフォルトの名無しさん:2009/07/01(水) 12:14:50
また神奈川hi-hoが暴れてるんだろ

164 :デフォルトの名無しさん:2009/07/01(水) 22:02:03
>>162
メリットが無い

165 :デフォルトの名無しさん:2009/07/08(水) 21:00:12
トリップの計算って確かにGPU向きだね
とっくにあるのか?

166 :デフォルトの名無しさん:2009/07/08(水) 22:34:32
ATi用ならある
Radeon - プロジェクト・ナニ屋 Wiki - プロジェクト・ナニ屋 - SourceForge.JP
http://sourceforge.jp/projects/naniya/wiki/Radeon


167 :デフォルトの名無しさん:2009/07/08(水) 23:57:06
>>166
それCALで本当に書いてる?
リバースしてるけどそんなにCAL使ってるようには見えない

168 :デフォルトの名無しさん:2009/07/09(木) 00:18:30
知らんがな。
作者にメールでもして聞け。

169 :デフォルトの名無しさん:2009/07/09(木) 00:28:06
>>168
もう何回も出してるけどエラーしか返ってこない
VIPPER用語使って素人を演出してみたけど無理だった

170 :デフォルトの名無しさん:2009/07/09(木) 05:55:21
brookでベース書いて、手でcal ilの最適化してる

171 :デフォルトの名無しさん:2009/07/09(木) 12:29:03
CUDA Best Practices Guide Now Available
http://news.developer.nvidia.com/2009/07/cuda-best-practices-guide-now-available.html


172 :デフォルトの名無しさん:2009/07/09(木) 22:33:30
AMDってオープンオープンうぜーだけど
ソース開示してくれって言っても全然開示してくれない

自分たちが見せたいものだけ見せるって
ただの変質者じゃねーか

173 :デフォルトの名無しさん:2009/07/09(木) 22:34:37
Intelに対抗するためのリソースを奢って欲しいだけだからな
乞食

174 :デフォルトの名無しさん:2009/07/09(木) 22:45:47
>>167
ttp://slashdot.jp/developers/08/12/14/1438221.shtml

175 :デフォルトの名無しさん:2009/07/09(木) 22:51:46
CALで文字列ってどうやって扱うの?
strlenだけでも実装してみたい

176 :デフォルトの名無しさん:2009/07/14(火) 10:41:31
R800系はGPGPU向けにアーキテクチャを少し変えるらしい。
ttp://www.nordichardware.com/news,9612.html


177 :デフォルトの名無しさん:2009/07/15(水) 00:34:54
>>176
CUDAをそっくりそのままパクルらしく
Nvidiaの中の人訴訟だっていってたぉ

178 :デフォルトの名無しさん:2009/07/15(水) 06:37:08
nvってほんと馬鹿だな

179 :デフォルトの名無しさん:2009/07/15(水) 06:46:45
>>177
ソース
つか、GPUのハードウェアアーキテクチャの話でプログラム言語を
パクるって話がどうして出てくるんだ?

180 :デフォルトの名無しさん:2009/07/15(水) 07:33:01
>>179
CUDAにほぼ近い言語用意するために
今回ハードのアーキテクチャ一部変更するでしょ


181 :デフォルトの名無しさん:2009/07/15(水) 08:43:49
DX11のCSに対応させれば自然とGPGPU向け強化になるし
現状のCUDAハードの機能的上位互換にもなるだろう。

アーキテクチャ的にはそんなに変える必要は無い。
VLIWのままでも必要ならば演算粒度は16分の1まで下げられるだろ。

182 :デフォルトの名無しさん:2009/07/15(水) 09:53:25
訴訟起こして、CUDAそのものを採用させることで和解?

183 :デフォルトの名無しさん:2009/07/15(水) 10:26:00
必死だな

184 :デフォルトの名無しさん:2009/07/15(水) 17:45:00
消えるcudaになんて対応させたってなんになる

185 :デフォルトの名無しさん:2009/07/15(水) 19:13:37
OpenCLとかなんてCPUでもDSPでも適当なハードで動くし

186 :デフォルトの名無しさん:2009/07/15(水) 20:35:00
>>185
Radeonじゃ動かないよ
AppleがGeforceびったりだし
それをIntelが支援してる

187 :デフォルトの名無しさん:2009/07/15(水) 20:42:41
おやおや、必死ですね

うんうん、Dell,HP,Appleはnvしかないよね
間違っても欠陥が原因で排除なんてしない

188 :デフォルトの名無しさん:2009/07/15(水) 20:47:52
>>187
来年からDELLもHPも
デスクトップ向け製品で
AMDのCPU搭載製品出さないよ

AMD商売下手でバカだからさ
来年NvidiaはAMD向けのチップセット生産できなくなるし

189 :デフォルトの名無しさん:2009/07/15(水) 20:56:11
(笑)

190 :デフォルトの名無しさん:2009/07/16(木) 10:45:28
自作板でやれ

191 :デフォルトの名無しさん:2009/07/16(木) 22:18:20
Intelの上級幹部も
GPGPUはAMDは端にも棒にもひっかからないと明言してるしな


192 :デフォルトの名無しさん:2009/07/16(木) 23:43:49
AMDというかATiは新技術のプロモーションは早いんだけど製品化が上手くいかなかったり、
DirectX7.1とか8.1とか出してはNVIDIAがついてこず自爆とか、
NVがゲーム最適化のために時には数日間隔で拙速ともいえるドライバアップデートをする事があるのに対して
月刊Catalystでアグレッシヴさに欠けるし、カタログスペックだけメーカーって印象が強いんだよな。


193 :デフォルトの名無しさん:2009/07/17(金) 01:32:58
まぁ少なくともGPGPU分野での出遅れと低品質は明白なんだよな……

194 :デフォルトの名無しさん:2009/07/17(金) 03:34:51
なんか必死ですね

195 :デフォルトの名無しさん:2009/07/17(金) 08:29:51
GPUのアーキテクチャ自体
Nvidiaのパクリだしな
Athlon->Pentiumのパクリ
ATi->Geforceのパクリ

196 :デフォルトの名無しさん:2009/07/17(金) 09:42:50
邪魔

197 :デフォルトの名無しさん:2009/07/17(金) 09:47:42
DX11対応のATIのSDKって
API全部一新されるんでしょ?

198 :デフォルトの名無しさん:2009/07/17(金) 13:58:52
ATi も nVidia も ArtX も元は SGI スピンアウトなんだから、似るのは仕方ないかな。

199 :デフォルトの名無しさん:2009/07/17(金) 18:47:25
ひっし

200 :デフォルトの名無しさん:2009/07/20(月) 23:12:11
RV870品質問題で出荷不可能かもな

201 :デフォルトの名無しさん:2009/07/23(木) 02:12:02
CUDA Toolkit and SDK 2.3 released
http://news.developer.nvidia.com/2009/07/cuda-toolkit-and-sdk-23-released.html


202 :デフォルトの名無しさん:2009/07/23(木) 07:30:56
ATIは何もリリース無しオワタ

203 :デフォルトの名無しさん:2009/07/23(木) 22:28:59
ATIはgoogleからも見捨てられたw

Windows7もNvidiaに期待していると声明出される始末だしw

204 :デフォルトの名無しさん:2009/07/25(土) 01:18:46
なんか痛い人がいるな

205 :デフォルトの名無しさん:2009/07/25(土) 10:38:40
ATI、nVidiaという観点で貶し合ってる大半がそんなだ。
自作板帰れとつくづく思う。

206 :デフォルトの名無しさん:2009/07/25(土) 10:45:28
あまいな。
それがゲハ厨のPS3(nVIDIA)とXbox360(ATi)の代理戦争もあったりするから
更にタチが悪い。


207 :デフォルトの名無しさん:2009/07/25(土) 10:52:46
>>206
なるほど、確かに。深いな。

208 :デフォルトの名無しさん:2009/07/25(土) 10:58:37
どうせ有名な神奈川か群馬のゲフォユーザーだろうな
板をわきまえないFUDがそっくり

209 :デフォルトの名無しさん:2009/07/25(土) 11:55:06
>>206
それは知らんかったわw

210 :デフォルトの名無しさん:2009/07/26(日) 02:23:37
>>186
http://www.apple.com/jp/macosx/specs.html

少なくとも、ATI Radeon 4850、Radeon 4870はサポートされてる

211 :デフォルトの名無しさん:2009/08/06(木) 03:38:14
AMD Developer Central - ATI Stream SDK v2.0 Beta Program
http://developer.amd.com/GPU/ATISTREAMSDKBETAPROGRAM/Pages/default.aspx


212 :デフォルトの名無しさん:2009/08/06(木) 07:12:41
まだGPU使えないとか・・

213 :デフォルトの名無しさん:2009/08/06(木) 07:29:18
なぁなぁ
GPGPUで計算したら面白そうな課題って
何かないですか?

214 :デフォルトの名無しさん:2009/08/06(木) 08:29:18
CPU代わりに使う

215 :デフォルトの名無しさん:2009/08/06(木) 22:19:02
>>211
コンパイルもできないなこれw
終わってるw



216 :デフォルトの名無しさん:2009/08/06(木) 22:24:02
1.xすら正式版がまだ出ていないのに2.0β2って流石過ぎる

217 :デフォルトの名無しさん:2009/08/06(木) 22:33:04
AMDは期待の斜め上行き過ぎだなw

2.0はGPUで全然うごかねーしw

218 :デフォルトの名無しさん:2009/08/06(木) 22:39:47
GPGPUのSDKじゃなくてCPU・GPU・DSPをターゲットにしたOpenCLのSDKだからな>Stream SDK2.0β

219 :デフォルトの名無しさん:2009/08/06(木) 22:56:46
いみねぇ・・・
とりあえず、MODドライバでCUDA対応させる話に期待する方がマシじゃねぇの?
マジでうちのRADEON4850の山盛りシェーダーが仕事無くて泣いてるぞ。

220 :デフォルトの名無しさん:2009/08/06(木) 23:04:08
というか9月にローンチされるRadeonって
構造がほぼそっくりGeforceと同じなったよなぁ

CUDAがやっぱりGPUの限界なんだろうな

221 :デフォルトの名無しさん:2009/08/06(木) 23:06:14
構造は全然違うだろ。
同じような構造であんなトランジスタ効率が良いわけ無い。

222 :デフォルトの名無しさん:2009/08/06(木) 23:06:18
アーキテクチャは確定してないぞ

223 :デフォルトの名無しさん:2009/08/06(木) 23:07:36
>>222>>220

224 :デフォルトの名無しさん:2009/08/06(木) 23:12:36
AMDはどんどんダイサイズ増加させて
2012年までにほぼ完全にCUDA向けの
アーキテクチャに移行するよ

225 :デフォルトの名無しさん:2009/08/06(木) 23:31:13
CUDAというか今のNVIDIAの実装って無茶苦茶トランジスタ効率悪いだろ。


226 :デフォルトの名無しさん:2009/08/06(木) 23:59:47
GPUモードとCUDAモードが分かれていて
モード切り替え時に処理がぶちきられるとか効率悪すぎ

227 :デフォルトの名無しさん:2009/08/07(金) 00:31:31
R800 Hemlock 300mm2 x2
RV870 Cypress 300mm2
RV840 Juniper 181mm2
RV830 Redwood 120mm2
RV810 Cedar ―

GT200 576mm2

228 :デフォルトの名無しさん:2009/08/07(金) 01:57:43
つかWin7ではGPGPUインターフェイスをまともに作ってないのか
互換性を完全に無視したのか分からんけど
CCC以外では使えないと言う

229 :デフォルトの名無しさん:2009/08/07(金) 04:11:39
相変わらず、ぬび太が馬鹿な発言を繰り返してるね

230 :デフォルトの名無しさん:2009/08/07(金) 05:50:05
コンパイラに組み込んで自動的にGPGPUに処理振るようにしちゃってよ。
規格乱立・しかもいつまでたっても実装が出てこなくて、なんかめんどくさい。

231 :デフォルトの名無しさん:2009/08/07(金) 08:48:38
>>230
むり。

232 :デフォルトの名無しさん:2009/08/07(金) 20:11:08
Nvidia、CUDAだけでいいじゃん
Radeonコスパ悪すぎだし

233 :デフォルトの名無しさん:2009/08/07(金) 20:58:53
Ctだけでいいよ

234 :デフォルトの名無しさん:2009/08/07(金) 21:44:12
バカだなー
競合が無かったらこんなに安くならんだろw

235 :デフォルトの名無しさん:2009/08/08(土) 12:59:28
ゲロビディア終了のお知らせ

NVIDIA、第2四半期は1億ドルの赤字
http://pc.watch.impress.co.jp/docs/news/20090807_307839.html

236 :デフォルトの名無しさん:2009/08/08(土) 13:50:41
中身読んでないのがバレバレだな

237 :デフォルトの名無しさん:2009/08/08(土) 19:28:53
>同社は同四半期にノートPC向けGPUとチップセット(MCP)のダイ/パッケージング素材セットの問題に対する対応費用として1億1,910万ドルを計上しており、これが業績に大きな影響を与えた。この費用を差し引いた、非米国会計基準では3,770万ドルの純利益を出している。
>同四半期はTeslaやTegraといった新製品の出荷が順調に伸びており、社長兼最高経営責任者のジェンスン・フアン氏は「当社の業績は回復基調にあり、当社製品に対する需要も改善している」と述べている。

どこが赤字だw
その1億って単なる経費で、純利益は黒字じゃねぇかwww

238 :デフォルトの名無しさん:2009/08/08(土) 20:05:14
Teslaって単価高い上に結構売れてるからな
あれで黒字にならん方がおかしい

239 :デフォルトの名無しさん:2009/08/08(土) 21:17:50
都合のいいときだけ欠陥を持ち出すよねnvって

で、dell,apple,hp,sonyなんかにチャンと対策してるのかよw

240 :デフォルトの名無しさん:2009/08/08(土) 21:18:37
結構売れている(笑)

241 :デフォルトの名無しさん:2009/08/08(土) 21:40:05
常時ファンを全開にするのが対策だそうで

242 :デフォルトの名無しさん:2009/08/09(日) 18:33:16
マキーノがGPUをディスりはじめたなw

243 :デフォルトの名無しさん:2009/08/09(日) 18:47:20
>>242
kwsk
kwsk
kwsk
kwsk
kwsk
kwsk
kwsk


244 :デフォルトの名無しさん:2009/08/09(日) 19:10:10
日誌とか雑文とか見れ

245 :デフォルトの名無しさん:2009/08/09(日) 19:52:19
わからんw

246 :デフォルトの名無しさん:2009/08/10(月) 08:54:45
"jun makino"でググれ

247 :デフォルトの名無しさん:2009/08/10(月) 20:44:03
やはり1チップに1024個も演算プロセッサ搭載している
アーキテクチャの方が優れてねーか?

GPGPUって眉唾もんだろ?

248 :デフォルトの名無しさん:2009/08/10(月) 20:59:51
>>248
うんインチキ技術だよ

249 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/10(月) 21:18:20
`コアのことか?

250 :デフォルトの名無しさん:2009/08/10(月) 21:32:24
>>249
団子先生
こんちわ

251 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/10(月) 21:43:36
だんごやさんだよ

252 :デフォルトの名無しさん:2009/08/10(月) 21:49:36
なんなのコイツ

253 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/10(月) 21:59:57
だんごやさんだよ

254 :デフォルトの名無しさん:2009/08/10(月) 22:02:20
マジでうぜえ。

255 :デフォルトの名無しさん:2009/08/10(月) 23:28:24
トリップおかしくね

256 : ◆??? :2009/08/11(火) 08:59:18
こうかな

257 :デフォルトの名無しさん:2009/08/13(木) 18:42:25
GPGPUってビジネス領域で使えそうな技術ですか?
例えばMySQLとかのデータベース処理を早くできるとか

258 :デフォルトの名無しさん:2009/08/13(木) 19:52:29
そう言う用途はCPUの仕事
GPGPUじゃ手に負えない

259 :デフォルトの名無しさん:2009/08/13(木) 21:18:00
>>intel
インテルが発売する製品は可能だって
神様が言ってたよ

260 :デフォルトの名無しさん:2009/08/13(木) 21:26:27
だってあれNiagaraみたいなもんじゃん

261 :デフォルトの名無しさん:2009/08/13(木) 21:40:15
>>259
larrabeeのことですか?

262 :デフォルトの名無しさん:2009/08/13(木) 21:47:22
>>261
うん
CPUのことで神様嘘つかないし
GPUも同じでしょ

263 :デフォルトの名無しさん:2009/08/13(木) 22:01:54
今のGPGPUだとやっぱり科学計算とかシミュレーションとかにしか向かなくて
一般業務アプリケーション領域には向かなさそうですね

264 :デフォルトの名無しさん:2009/08/13(木) 22:07:35
どれも向かないよw

265 :デフォルトの名無しさん:2009/08/14(金) 22:19:07
俺がぱっとES評価したかぎりだと
RV870は灼熱だね
RV830は消費電力少ないが性能はすごい悪い



266 :デフォルトの名無しさん:2009/08/15(土) 19:50:20
何で消費電力じゃなく熱なの?

267 :デフォルトの名無しさん:2009/08/16(日) 11:33:06
GRAPE-DRの方が素晴らしいわ

268 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/16(日) 11:59:16
なんだと><

269 :デフォルトの名無しさん:2009/08/16(日) 15:52:39
えっと、なんだっけ、おはようビーム、だっけ、それ

270 :デフォルトの名無しさん:2009/08/16(日) 18:23:53
スマイルビームじゃね?

271 :デフォルトの名無しさん:2009/08/16(日) 19:18:55
おはようビームってライデンがマッチ開始直後に仕掛けてくるレーザー攻撃?

272 :デフォルトの名無しさん:2009/08/16(日) 19:23:20
GRAPE-DRは消費電力が秀逸
プログラムも書きやすい

GPGPUはどうかな?反論できるかな?


273 :デフォルトの名無しさん:2009/08/16(日) 20:21:14
>>272
私たちの負けです

274 :デフォルトの名無しさん:2009/08/16(日) 22:22:49
完敗ですな

275 :デフォルトの名無しさん:2009/08/17(月) 01:41:33
速さは力

276 :デフォルトの名無しさん:2009/08/17(月) 03:53:22
開発速度ですねわかります

277 :デフォルトの名無しさん:2009/08/17(月) 07:41:43
まあ、GPGPUには口はないからな

278 :デフォルトの名無しさん:2009/08/17(月) 12:52:44
GT300今年にはでなさそうだな 本格的にオワルnvidia

279 :デフォルトの名無しさん:2009/08/17(月) 16:06:52
>>267
> GRAPE-DRの方が素晴らしいわ


おいしいの?

280 :デフォルトの名無しさん:2009/08/17(月) 21:54:55
というかNVIDIAってGeForce8000系から全然進歩してないよね?
あいつらいったい何やってんの?
死ぬの?


281 :デフォルトの名無しさん:2009/08/17(月) 23:13:25
Geforce最強
CUDA最強

AMD最低

282 :デフォルトの名無しさん:2009/08/18(火) 05:51:08
nVIDIA最高
ATi最高

AMD最低

283 :デフォルトの名無しさん:2009/08/20(木) 17:26:11
それには同意せざるをえない

284 :デフォルトの名無しさん:2009/08/21(金) 18:29:35
ATi買ったのがIntelだったら良かったのに…(無理です

285 :デフォルトの名無しさん:2009/08/21(金) 18:32:54
元々は、
Intel & ATi
AMD & nVIDIA
って感じだったのにね。


286 :デフォルトの名無しさん:2009/08/21(金) 21:53:47
>>284
Intelの会社のロードマップとしては
2014年までにATi部門買う予定は
ずっと変わってないよ

ただ法律などでうまくいってないだけ

287 :デフォルトの名無しさん:2009/08/21(金) 22:55:35
IntelにATiもぎ取られたAMDがNVIDIAと合体してハルマゲドン?
ららびーはどうすんのよ

288 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/21(金) 22:57:53
>>286
ねーだろ流石に

289 :デフォルトの名無しさん:2009/08/21(金) 23:00:55
>>288
GPU関連のシニア設計エンジニアをかなり高級な年俸打診して
引っこ抜いてるみたいだよ



290 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/21(金) 23:05:32
人材の引き抜きはやってるけど会社そのものを買う気はないだろ

291 :デフォルトの名無しさん:2009/08/21(金) 23:17:44
今更感はあるよな

292 :デフォルトの名無しさん:2009/08/22(土) 01:54:11
そもそもAMDも。。

293 :デフォルトの名無しさん:2009/08/22(土) 10:05:31
Radeon 5xxxは標準で250W
最大で350Wなんだなw

使い物にならねーだろw

294 :デフォルトの名無しさん:2009/08/24(月) 13:32:13
>293
流石にそれはない
脳内妄想乙

295 :デフォルトの名無しさん:2009/08/24(月) 13:33:58
nVidia最低
Intel悪党

296 :デフォルトの名無しさん:2009/08/24(月) 14:05:36
つまり勝者はIntel

297 :デフォルトの名無しさん:2009/08/24(月) 17:27:41
HPC分野でGPGPUに一番強いベンダーはやっぱりNECですか?

298 :デフォルトの名無しさん:2009/08/24(月) 18:28:33
なんでやっぱりなの?

299 :デフォルトの名無しさん:2009/08/24(月) 18:31:58
HPC屋さんでGPUの経験があるのって、PowerVRのNだけだから、とか?

300 :デフォルトの名無しさん:2009/08/24(月) 18:45:32
NECって過去の会社でしょ。


301 :デフォルトの名無しさん:2009/08/24(月) 18:48:00
NECって、家電とかPCには降りてこないで欲しいよ
ゴミばっかで迷惑だから
スパコンだけ作ってろ

302 :デフォルトの名無しさん:2009/08/24(月) 18:51:05
NECって、PC98くらいしか思い出ないわ。
まだパソコン関連にいるのか・・・。
ケータイもパッとしねーし、家電も陰薄すぎだし
何で稼いでるんだろう・・・。鯖ももHPやDELLやIBMとかと張り合うような市場じゃ全然駄目だし
スパコンもトップ以外は関係ないしなぁ


303 :デフォルトの名無しさん:2009/08/24(月) 20:20:03
ケータイのCPU周辺チップは稼いでるよ
NECエレだけど

304 :デフォルトの名無しさん:2009/08/24(月) 20:34:44
EMMA

305 :デフォルトの名無しさん:2009/08/24(月) 21:21:31
日本の電機屋にそんな甲斐性があればとっくにIntel抜いてるわ

306 :デフォルトの名無しさん:2009/08/24(月) 22:24:38
日本はOS作ってもソフト作ってもツブされるからな

307 :デフォルトの名無しさん:2009/08/24(月) 23:09:55
日本は来年中国とソフトウェアに関する条約締結するでしょう

308 :デフォルトの名無しさん:2009/08/24(月) 23:23:49
日本はOSにしてもCPUにしても圧力でつぶされてきたんだが

309 :デフォルトの名無しさん:2009/08/24(月) 23:35:24
しかし超漢字が世界の標準OSになれたかというと、疑問だな
組み込みTronはよく使ったけどさ

310 :デフォルトの名無しさん:2009/08/24(月) 23:48:12
圧力に負ける国力の無さを恨むがよい
まあ仮に生き延びていたとしても、最終的には英語圏の巨大な開発力に押し潰されていたと思うけどね

311 :デフォルトの名無しさん:2009/08/24(月) 23:51:59
先進国のITは日本の10倍ぐらいの人口と平均1.73倍の
知能の高さを誇る業種だからねぇ

おバカJAVAスクール生はどこの国でも今仕事がなくて
大変らしいけどw

312 :デフォルトの名無しさん:2009/08/25(火) 01:01:31
>>310
アホか
力がありすぎて潰されたんだぞ
理由は外交下手
黒字貿易と引き換えにされただけだ
当時経済力国力ともに世界一だった日本に
何が国力がないだ笑わせんなw

313 :デフォルトの名無しさん:2009/08/25(火) 01:51:46
あまりのスレチに思わず違うスレ開いたかと思った

314 :デフォルトの名無しさん:2009/08/25(火) 02:24:43
今からでも遅くないだろ
道路作る金の半分をつぎ込めばIntelにも勝てる
そんな公共事業は日本ではありえないけどw

315 :デフォルトの名無しさん:2009/08/25(火) 09:16:53
HPCスレかどこかで相手にされなくてスネてる厨房だろ

316 :デフォルトの名無しさん:2009/08/25(火) 11:26:54
intelに勝てるって何で勝つんだよ。x86のライセンスなんか受けられないぞ。

317 :デフォルトの名無しさん:2009/08/25(火) 15:18:15
【政治】 民主党、マニフェストの「年金改革」は政権取った4年後に…職業に関係なく、全ての人が収入の15%を納付する形★3
http://tsushima.2ch.net/test/read.cgi/newsplus/1251173078/

318 :デフォルトの名無しさん:2009/08/25(火) 22:36:28
OSX10.6のOpenCLはGeforce限定でしか動作しないね。
RadeonはやっぱりOpenCL無理なんじゃないのかなぁ

Radeon5870見てそうおもったよ

319 :デフォルトの名無しさん:2009/08/26(水) 02:21:27
>>318
うそ乙
Radeonも対応してる
http://www.apple.com/jp/macosx/specs.html

320 :デフォルトの名無しさん:2009/08/27(木) 11:12:30
在日参政権法案 政党別国会提出状況
ttp://www.geocities.jp/sanseiken_hantai/seitou.htm

自民党 -. 0回
民主党 - 15回
公明党 - 27回
共産党 - 11回 ※共産党は被選挙権も要求

※民主党・公明党で共同提出が5回 ( 自民党の反対で否決 )



民主党とカルト党。どっちも在日朝鮮党。

321 :デフォルトの名無しさん:2009/08/27(木) 23:27:05
情報源明かせないけど
来月のRadeon 5xxxシリーズ発表後の2週間後に
もしかするとAMD OpenCLのGPU版リリースされそう

322 :デフォルトの名無しさん:2009/08/28(金) 08:54:59
乙。 期待しないで待ってるとしよう。

323 :デフォルトの名無しさん:2009/08/28(金) 19:09:49
Q3の予定だから9月中には出るだろう。

324 :デフォルトの名無しさん:2009/08/28(金) 20:58:50
富士通のHPCの偉い人によると「10TFlops位あればHPCって感じ」らしいが、
カタログ値だけなら今度のATiの最上位機種を2枚挿ししたPC5台で出るんだよな。

325 :デフォルトの名無しさん:2009/08/28(金) 20:59:35
富士通のHPCの偉い人って誰?

326 :デフォルトの名無しさん:2009/08/28(金) 21:06:15
>>325
スパーク信者のあのおっさんだろ

327 :デフォルトの名無しさん:2009/08/29(土) 14:04:44
NVidia曰く、向こう6年でCPUのパフォーマンスは3倍にしかならないが
GPUは570倍になる、そうな。本当かね。
http://hardware.slashdot.org/story/09/08/28/1821207/NVIDIA-Predicts-570x-GPU-Performance-Boost


328 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/29(土) 14:33:00
高帯域高消費電力GDDR*に依存してる今のGPUアーキテクチャから脱却しない限り現実として無理だな。
家の中に発電所が必要になるwww

329 :デフォルトの名無しさん:2009/08/29(土) 14:59:11
6年後のことなんか誰にもわからんよ
今NVが必死だってことは誰にでもわかるけどw

330 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/29(土) 16:12:38
8800GTX出してから3年近く殆どアーキが進化しておらず、消費電力だけは増え続けた。
残念ながら、570倍の性能を発揮するにはGWクラスの電源が必要になりそうだという推測しかできない。



331 :デフォルトの名無しさん:2009/08/29(土) 16:18:10
3年後とか6年後とかよりLRBへの対策を講ずることの方が重要だと思うんだが。今どうなってんの?

332 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/29(土) 16:37:49
唯一の可能性としては
消費電力を増やすだけでしかない共有VRAM帯域依存のアーキテクチャから脱却し、
コア毎にローカルでそこそこの容量のメモリを持つ分散メモリ形式に切り替えることで
電力あたりのFLOPS数を引き上げることができる。

Larrabeeの方向性そのまんまだよ。



333 :デフォルトの名無しさん:2009/08/29(土) 17:03:07
いまのGeforceのSPはトランジスタ効率があんまりよくないから、そのへんの再設計をするんじゃないかな
発熱と消費電力が形容できないレベルになってきてるのも確か

334 :デフォルトの名無しさん:2009/08/29(土) 17:10:03
Grape-DR最強

335 :デフォルトの名無しさん:2009/08/29(土) 18:51:07
>>332
ダメCPUのCellに似てるんだが。
大失敗に終わったCellの方向へ行くわけ無いだろ・・・。


336 :デフォルトの名無しさん:2009/08/29(土) 19:03:22
だーかーらー

Grape-DRが唯一絶対なの

337 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/29(土) 19:18:23
>>335
別にスクラッチパッドメモリでなくてもキャッシュでもいい。
誤解してるようだがGeForceはソフトウェアフレームワークが比較的マシなだけで、
更に狭いスクラッチパッドメモリと更にワイドなSIMDで、ハードの特性はCellより遙かにピーキーだ

分散型メモリってのはGRAPE-DRも同じ方向性だ。
メモリ帯域はGPUどころかCPUより狭い。
重力演算に最低限必要なスクラッチパッドメモリで演算を繰り返す仕様。

大量の演算ユニットのスループットを生かすには相変わらず高帯域のメモリは必要なんだが
伝送距離が増えるとそれに比例して電力消費が増えてしまう。
同じGPUでもChromeはタイルレンダを上手く駆使してメモリトラフィックを削減しつつ
スループットを稼いでる。
Larrabeeは共有分散型キャッシュメモリでタイルレンダに特化したGPUってことになる。
レイトレーシングとかは重力演算と一緒で演算結果の再利用頻度が高くなるからな。

338 :デフォルトの名無しさん:2009/08/29(土) 19:45:15
Cellの駄目なところは、犠牲にしたものが大きいわりに
ピークパフォーマンスが高くないところだろ。


339 :デフォルトの名無しさん:2009/08/29(土) 20:58:10
キャッシュ制御を自前でやらないと使い物にならない速度でしか動かないようなのは
勘弁して欲しい。キャッシュに乗り切る用にプログラムサイズ調節したりとかもしたくない。


340 :デフォルトの名無しさん:2009/08/29(土) 21:00:01
Grape-DR最高

341 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/29(土) 21:04:44
>>339
そういう手合いにはCPUが最高のソリューションだ。
CellがGPGPUが万能の利器であるかのように言うのは過ちであって
そういう努力が出来る人間が適切な用途に使ってこそ効果を発揮するものだ

342 :デフォルトの名無しさん:2009/08/29(土) 21:27:51
なんだよそれ。じゃあGPGPUもCellと同じで役立たずな技術なんじゃないか。
誰でも簡単に使えて高パフォーマンスを得られるものを目指すべきだろ。

343 :デフォルトの名無しさん:2009/08/29(土) 21:29:40
>>342
だからGrapeなのです

344 :デフォルトの名無しさん:2009/08/30(日) 01:03:26
>>342
そんな夢のような話は、それこそ夢のような製造技術が実用化されないと現実になりません。

345 :デフォルトの名無しさん:2009/08/30(日) 03:09:44
馬鹿には使えない = 役立たず ってwww
>>342 みたいなのは馬鹿でも困らない仕事だけしてればいいよ

346 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 05:25:09
>>337
なんで伝送距離が増えると消費電力が増えるの?
GDDR系にはイコライザの類いはないと思うのだが。

347 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 05:28:19
>>341
同意。
>>342
そいう人は、CPUが速くなるのを待つほいがいい。

348 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 09:31:45
GPGPUなんて使えない。NVIDIAはそれしかないからプッシュしているだけで
少し知識があれば一番高いPentiumを買うのが一番頭がいい。


349 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 09:56:26
CPU=マイコン
GPGPU=劣化FPGA

350 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/30(日) 09:57:37
>>346
理屈考えろよ
電子を遠くに流そうとすればするほど電力のロスは大きくなる。

一方演算ユニットとかってそんなに消費電力食う訳じゃない。
ローカルのキャッシュメモリあるいはスクラッチパッドメモリを作って
ALU間の電子の移動を最小限にしたほうが良い

少なくともVRAMとの間を何度も往復するよりはよっぽど改善される。
現行のGDDR5帯域当たりの消費電力は1Gbpsあたり0.5Wだ。
GPUの消費電力の何割占めてるかわかるだろ。

ついでに言うとコントローラそのものが熱源になるから熱密度の制約が出てくる。
莫大なトラフィックを捌くコントローラにトランジスタ割くよりも、演算ユニットの数を増やして
同じトランジスタでも熱密度の制約が比較的少ないSRAMの大容量化を行い
メモリ帯域をセーブした方が健全。
レイテンシが小さくなって命令のインターリーブ数も抑えることができる。
レンダリング方法はタイルレンダ主体になるが。

351 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:00:46
>>350
じゃあGrape-DRでよくね?

352 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:39:36
今更GRAPEとかイラネ

353 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:47:44
http://www.4gamer.net/games/076/G007660/20090529065/
NVIDIAの中の人も同じようなこと言ってたり。
最終的にGPUもLarrabeeみたいな感じになるのか?

354 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:48:16
>>348
CPUとGPU両方使えば、より性能が伸びるだろ。
なんで片方しか使わない事になってるんだよw

355 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:49:09
言っているだけで物は出ない(笑)

356 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:49:54
OSX10.6でOpenCL使ってるんだが
なんかいまいちなんだけど



357 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 11:05:09
どんな感じよ?

358 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 11:06:08
もうOpenCL使える実装あんの?

359 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 11:15:28
>>358
10.6ならRadeonとGeforce使ってOpenCLできるよ

360 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 11:17:59
なんと!
ちょっとSnow leopardかってくる!

361 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/30(日) 11:40:36
>>354
スタンフォードの教授だって言っても大学の研究資金って企業からの金で成り立ってるわけだから
決して公正客観だとは思わない方が良い

グラフィックって大雑把に言って点の数だけ並列化できるからトランジスタ分だけ性能が伸びるのは当たり前。
GPUの性能進化なんて野はグラフィックという用途に絞った話で、様々なプログラムを
好き嫌いなく動かさないといけないCPUとは全然土俵が違う。

同じ土俵で戦わせたらどうなるか?
知っての通り、GPGPUがCPUのタスクを全部肩代わり出来るかって言うと全然そうじゃない。
性能以前に動きすらしないプログラムの方が多い。
逆にCPUにGPUの仕事やらせれば同じようにスケールするだろう。それがLarrabeeなわけで。


362 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 11:54:27
http://www.macupdate.com/info.php/id/32266/opencl-benchmark
どうやらSnow LeopardにはOpenCLのGPUドライバだけじゃなくて
CPUドライバも含まれてるっぽいね
でも、Core2じゃない初代Core Duoでは使えないっぽい?

363 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 11:58:43
>>350
伝送距離の話ではなくて、伝送帯域の話では?
DDRはドライバで、電圧が決まっているから、伝送距離が増えてもレシーバ端で受信電圧が下がるだけで、消費電力は変わらないと思うけど。
このあたりはアナログ回路のはなしなので、スレ違いすまん。

364 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 12:45:18
>>363
おいおい。

365 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 13:04:34
ちなみにRadeonなら
CPUシミュレートではあるが、一応LinuxとWindows上で
HelloOpenCL作れたよ。

9月10日にAMDから発表あるから
その後すぐに、ネイティブで実行できるんじゃないのかなぁ

366 :,,・´∀`・,,)っ-○○○ ◆??? :2009/08/30(日) 18:23:56
>>363
無論物理的距離ではなくインターコネクトのコストが最大の問題だ

367 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 18:33:21
さっさとWindows向けのOpenCL実装出してよね!
話ばっかで疲れちゃったよ。

368 :名無しさん@そうだ選挙に行こう:2009/08/30(日) 18:37:38
出力電圧一定で負荷が増えているのに
消費電力が増えないと思えるのが不思議だ。


369 :デフォルトの名無しさん:2009/08/30(日) 20:31:26
>>368
スレ違いなので、最後。
出力は一定とは言っていない。
負荷が大きくなると受信側での電圧が下がる。つまり電流が減るということ。
だから消費費は変わらないと思うと言っただけ。

370 :デフォルトの名無しさん:2009/08/31(月) 00:52:03
>>369
考えて見たら、送信側って定電流であることが多いから、電力は増えるね。最近高周波の勉強してるから、勘違いしてしまった。
アホですまん。


371 :デフォルトの名無しさん:2009/08/31(月) 09:55:41
どんまいける

372 :デフォルトの名無しさん:2009/09/01(火) 19:06:28
ワラタ
伝送距離が長くなったら、配線の抵抗分で流れる電流が減るので、
消費電力はわずかだが減ります。
こんなの中高生レベルで理解できる話だ。オームの法則すら理解してないんだな。

373 :デフォルトの名無しさん:2009/09/01(火) 19:41:05
インピーダンスを理解してない中高卒は黙ってろ

374 :デフォルトの名無しさん:2009/09/01(火) 19:43:46
インピーダンスや高周波を知らないから、
オームの法則だけで理解、説明できるような話を勘違いしてるんだろう。
所詮設計とかやったことない奴の妄言だなあ。

375 :デフォルトの名無しさん:2009/09/01(火) 21:09:10
中学生相手にマジレスすんなよ

376 :デフォルトの名無しさん:2009/09/01(火) 21:26:56
わかってないのは、>>373, >>375
インピーダンスという言葉を知っているだけで中身を理解していない。

377 :デフォルトの名無しさん:2009/09/01(火) 21:43:11
たらったらったらったインピーダンス♪



378 :デフォルトの名無しさん:2009/09/01(火) 22:17:35
OSX 10.6

OpenCLで同じプログラムを動作させた場合
Nvidiaの方が処理速度100倍高速だね

379 :デフォルトの名無しさん:2009/09/01(火) 23:16:58
顔文字忘れてるぞ

380 :デフォルトの名無しさん:2009/09/01(火) 23:21:51
>>372
厳密に言うと、外付けメモリの配線抵抗なんて、DDRの内部終端抵抗に比べれば、
小さいし、抵抗のバラツキも大きいから気にすることないんだけどね。

381 :デフォルトの名無しさん:2009/09/02(水) 21:50:54
でっていう

382 :デフォルトの名無しさん:2009/09/06(日) 05:14:30
Windows7のGPU評価に専用グラフィックメモリと共有システムメモリとは別に
専用システムメモリ(当然0MB)ってのがあるけどこれってVistaにもあったっけ?
DX11世代カードだとVRAMをGPGPUプログラムのメインメモリとして扱えるようになるのかな

383 :,,・´∀`・,,)っ-○○○:2009/09/06(日) 05:26:48
カード上にスワップ用のDDR*が載るのかとオモタ

384 :デフォルトの名無しさん:2009/09/06(日) 10:28:22
いっそGPUに直接HDDをつけられるようにしてくれ。
スワップし放題っw

385 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/06(日) 15:35:30
>>382
正体判明。
GMAみたいなオンボードチップではグラフィック用にメインメモリの一部が固定的に割り当てられる。
GMAの場合専用グラフィックメモリ0MBで、専用システムメモリ32〜64MBくらいになる。

386 :デフォルトの名無しさん:2009/09/06(日) 15:38:58
>>385
なーんだ…

387 :デフォルトの名無しさん:2009/09/07(月) 15:05:33
オランダ監督のコメント
>「オランダはもっとファン・ブロンクホルスト(左サイドバック。日本の右サイド)を探すべきだった。
>彼のところにスペースがあった。日本は中に入っていくチームだったからね」
http://sportsnavi.yahoo.co.jp/soccer/japan/text/kaiken/200909060003-spnavi.html

オランダ監督は日本の右サイドに居て、真ん中に入ってスペースを作るやつが弱点だと指摘しているな


どう見ても中村俊輔ですwwwwww

388 :デフォルトの名無しさん:2009/09/11(金) 08:35:39
RADEON HD5870、825MHzで1600SPだとよ。
5870x2なら1ボードで倍精度1Tだぜ。

389 :デフォルトの名無しさん:2009/09/11(金) 19:40:43
GPUのflops表記に意味は無い

390 :デフォルトの名無しさん:2009/09/11(金) 21:00:33
>>389の脳細胞の数に意味が無い如く、と言うわけだな!

391 :デフォルトの名無しさん:2009/09/11(金) 21:48:48
そう、幾ら数が増えようが
元の効率がだめなのと、すべてのSPを使いきれるわけではないからな
ATIのは

そういった意味でプロセッサとしては
Centaur設計のshaderを擁するS3に及ばないと言い切れる

392 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/11(金) 22:20:26
1つの命令をうん百並列の演算ユニットにブロードキャストして命令発行するのに小回りきくわけないば

SSEはたかだか4並列、AVX〜Larrabee世代ですら8〜16並列に増える程度だ
汎用性を左右する演算粒度が違いすぎる。


393 :デフォルトの名無しさん:2009/09/12(土) 07:56:27
>>391
S3のGPUのプログラミングアーキテクチャを云々できる資料って公開されてたか?
されてるのならクレ。


394 :デフォルトの名無しさん:2009/09/12(土) 08:06:53
AMDはOpenCL取り止めか?
DirectXだけに注力するのか?

395 :デフォルトの名無しさん:2009/09/12(土) 09:30:09
UNIX系OSのために、OpenCL対応はほぼ義務の状態にある。
Stream廃止というなら話は分かるが。

でもPhysXやHavokに相当する統一規格がないんだよな。
BulletがCompute Shaderベースになるといいんだが。

396 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/12(土) 12:28:30
ないだろ。
*NIX自体のマーケットが小さいし、そこに割って入る中立なAPIを作ろうという第3の組織もない。

ならCUDAなりATI Streamなりの元々の独自APIで十分というわけだ

397 :デフォルトの名無しさん:2009/09/12(土) 14:31:21
CUDAとOpenCLとDXCSの3つが
競合する規格になるのかな?

398 :デフォルトの名無しさん:2009/09/12(土) 14:54:19
OpenCLとDXCSは競合しない。
DirectXとOpenGLの様に棲み分けられる。
CUDAはどっちともぶつかるからきついね。

399 :デフォルトの名無しさん:2009/09/12(土) 15:01:24
>ATI StreamSDK 2.0 beta(Windows, CPU 利用)の
>OpenCL 実装だと、8 秒近くもかかってとてつもなく遅い!
>(SnowLeopard だと 0.0001 秒なのに…)
http://lucille.atso-net.jp/blog/?p=907

終わりだろw

400 :デフォルトの名無しさん:2009/09/12(土) 15:31:31
こういう時Intelは静かに仕事こなすな

401 :デフォルトの名無しさん:2009/09/12(土) 15:58:45
珍テルだからな

402 :,,・´∀`・,,)っ-○○○:2009/09/12(土) 16:07:48
AMDはSDK作っても原則無償提供だから人件費の分だけ赤字
そんなに人員割けるわけがない


片やIntelはソフト開発者だけで3000人体制だからな。
ハードだけでなくコンパイラやVTune売っても金を生み出せる企業だから

403 :デフォルトの名無しさん:2009/09/12(土) 16:11:48
AMDのSDK作ってる人2人だけだよw


404 :デフォルトの名無しさん:2009/09/12(土) 18:52:00
力の1000万パワーと技の1000万パワー、二人合わせて2000万パワーズ。
力と技のコンビネーションでさらに倍の4000万パワー。
大丈夫だ、2人でも1万パワー3000人相手なら十分に戦える。

405 :デフォルトの名無しさん:2009/09/12(土) 21:24:22
とりあえず480gflopsが、35.2gflopsに迫られるのはどうかと思いました(マル)

406 :デフォルトの名無しさん:2009/09/12(土) 21:30:36
どうがをわすれてました(○)
ttp://www.youtube.com/watch?v=pmBd9HQgTCQ
ttp://www.youtube.com/watch?v=pGnrBu3N2QE

407 :デフォルトの名無しさん:2009/09/12(土) 21:42:50
動画貼るだけなら、自作板でやってろ。

408 :デフォルトの名無しさん:2009/09/12(土) 21:45:26
>>407
あー?
じゃあおめーは数式でも張れや

409 :デフォルトの名無しさん:2009/09/12(土) 21:55:40
得意の描画でもこんなもんか

410 :デフォルトの名無しさん:2009/09/12(土) 21:56:46
いやぁ、数式だなんて高級な言葉知ってるインテリさんには敵わないやw

411 :デフォルトの名無しさん:2009/09/12(土) 22:12:08
1600SPってことは
よくてarray 20で粒度変わらず
悪くてarray 10で粒度倍

412 :デフォルトの名無しさん:2009/09/12(土) 22:13:16
結局今年もGrape-DRが最強ってことで決まりだな

413 :デフォルトの名無しさん:2009/09/12(土) 22:19:33
ttp://www.4gamer.net/games/045/G004578/20080725028/
ttp://www.4gamer.net/games/045/G004578/20080725028/images/13.jpg

>なお,北米版のプレゼンテーションでは,SIMD Unitが16SPで構成され,
>計1600SPあるように見えるブロックダイアグラムが存在していたが
>――単なるうっかりミスなのか,次世代GPUなりなんなりのものを誤引用したのかは不明――

配線の問題からも、クラスタ数そのままでSP倍増、粒度倍増の可能性大

414 :,,・´∀`・,,)っ-○○○:2009/09/12(土) 22:43:14
ATIだけ汎用性とは逆方向に進んでるな


415 :デフォルトの名無しさん:2009/09/12(土) 23:19:31
>>399
テクスチャをフィルするだけで8秒って
インタプリタ言語でベタに書いたってそんなには
かからないだろ。
デバイスドライバが動いてないのかな?

416 :デフォルトの名無しさん:2009/09/12(土) 23:22:17
>>415
いや違う。
RadeonはOpenCLが苦手だから
処理がとてつもなく遅いらしい

417 :デフォルトの名無しさん:2009/09/12(土) 23:28:42
そもそも2.0betaはRadeon使ってない。
x86で計算しているだけ。

418 :デフォルトの名無しさん:2009/09/13(日) 03:53:01
そ、おなじCPU処理で8万倍の差があるの
AppleとAMDでは

When I run it on ATI Stream SDK 2.0 beta on Windows,
I got terribly slow performance: around 8 secs per frame!
(On SnowLeopard OpenCL(CPU version) it runs around 0.0001 secs per frame)

419 :デフォルトの名無しさん:2009/09/13(日) 04:00:36
>>ATIだけ汎用性とは逆方向に進んでるな

これはある意味正しい選択では
使い物にならないGPGPUに力入れてコスト上げるより
低コストのままベンチスコア上げるほうが売れるだろうし
短期的にはね

そのまま行けばサウンドカードと同じ運命だろうけど

420 :デフォルトの名無しさん:2009/09/13(日) 05:17:17
まあ、CPUの仕事はGPUじゃなくてCPUにやらせりゃいいじゃんというのは、妥当ではあるさね

421 :デフォルトの名無しさん:2009/09/13(日) 08:24:45
>>418
それAMDの掲示板で質問してるやつ
いたけど削除されたよなw

422 :デフォルトの名無しさん:2009/09/13(日) 13:08:48
もしかして今のバージョンのATi ILてVLIWの中身を明示的に指定できないんだろうか?
ざっとリファレンスを読んだだけなんで、俺がやり方を見落としてるだけかもしれないが。

423 :デフォルトの名無しさん:2009/09/13(日) 13:44:45
>>422
ISAで書いてcalclAssembleObjectを使う。

424 :デフォルトの名無しさん:2009/09/13(日) 14:16:37
GPUやCPUのGFLOPS値の一覧があるサイトはありませんか?

425 :デフォルトの名無しさん:2009/09/13(日) 14:35:59
>>423
thx 結局底まで降りるわけか。まあ、面白そうだからいいけどさ。
仕事なんかでやらされる奴はたまらんだろうな。

426 :デフォルトの名無しさん:2009/09/13(日) 15:55:43
いよいよきたっぽい
NVIDIA Forceware 190.89 released - NVISION
ttp://forums.laptopvideo2go.com/topic/25115-nvidia-forceware-190-89-released/
These look to be an OpenCL driver set.

427 :デフォルトの名無しさん:2009/09/13(日) 17:31:20
AMD終わったなw

428 :デフォルトの名無しさん:2009/09/13(日) 19:16:16
ゲーハーかと思った

429 :デフォルトの名無しさん:2009/09/13(日) 21:36:26
今更言うことでもない

430 :デフォルトの名無しさん:2009/09/14(月) 21:36:42
やっぱりCUDAは捨てるんだな。手を出さなくて正解だったぜ。


431 :デフォルトの名無しさん:2009/09/14(月) 22:43:46
>>430
それは負け惜しみw
超並列化の苦労に比べればプラットフォーム間の移植などものの数ではない。
CUDAで50倍高速化させたら快適すぎる。
CPU版が止まって見えて、元に戻れない。

432 :デフォルトの名無しさん:2009/09/15(火) 02:00:30
>>431
なあ、教えてくれ。
なんでCPUに比べて50倍も速くなるんだ?
例えばGTX280とかって240SPだろ?
今の標準的なCPUは4コアだけど、GPUのクロックより2,3倍速いし、しかもSSEだと各コアで4並列できるだろ。
あくまでも単純計算では、5-7.5倍くらいにしかならないようにおもえるのだが。
メモリ帯域に関してもCPUはでかいキャッシュがあるし、仮にキャシュが効かないアプリとしても、
10倍程度だと思うんだ。そういうアプリなのかね?それともCPU版のコードがへたれなのか?
教えてくれ。


433 :デフォルトの名無しさん:2009/09/15(火) 04:10:12
>>431ではないが横レス。
IPCとかスループットとかメモリ帯域とかもっと多くの要因があるからそんなに単純な話ではないが、
例えばSSII09のチュートリアルでは行列積の場合512x512で24倍速いだとか言ってたな。
具体的な実行環境は失念。
SIFTのデモはCPUだと2〜3FPSしか出てないのが100FPS超えてたりとか、
問題とか条件によってはそんくらい行く。

434 :デフォルトの名無しさん:2009/09/15(火) 06:49:36
まぁ、4coreだからって全部使って演算されたら堪らんからな。
CPUより速いとかよりも、CPUの負荷を減らせることも魅力だし。

435 :デフォルトの名無しさん:2009/09/15(火) 07:43:32
CPUとGPUの比較をしてもあまり意味がなくて、結局、GPUはアクセラレータとして捉えるのが良いってことか。

436 :デフォルトの名無しさん:2009/09/15(火) 09:25:00
>>432
CPUはクロックが速くてもメモリ帯域が遅すぎる
処理によっては100倍どころか2000倍も存在する

437 :デフォルトの名無しさん:2009/09/15(火) 11:32:38
経験上その手の数字は信用できないんだよね。
GPUベンダーに都合のいい数字だけを言っているだけで
前提となる条件が一切不明。ソースだせと言いたい


438 :デフォルトの名無しさん:2009/09/15(火) 12:09:15
GPUに適した処理が、50倍とか100倍超になるのは事実。

でもGPUに適した処理、っていうのは、画処理とかの、
大データに対して同一の演算を行うものだから、
CPUが行っている様々な処理の種類なかでは少数。
重たい処理ではあるけど。

そもそも、GPUの性能が50倍とかにならないのなら、
そもそもPCにグラフィックスチップいらないわけで。

439 :デフォルトの名無しさん:2009/09/15(火) 12:10:08
そもそも、が被った。orz

440 :デフォルトの名無しさん:2009/09/15(火) 12:29:53
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもぞもぞもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも
そもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそもそも


441 :デフォルトの名無しさん:2009/09/15(火) 14:28:29
ttp://i27.tinypic.com/5cdtsm.png
ttp://i28.tinypic.com/22zwc0.jpg
ttp://i30.tinypic.com/10icr5u.png
ttp://i28.tinypic.com/fduic7.png
ttp://i29.tinypic.com/2hnown6.png

無難な改良アーキテクチャっぽい

442 :デフォルトの名無しさん:2009/09/15(火) 16:05:33
>>436
良い事考えた。コア毎に独立した爆速メモリ積んで、その容量内で処理が完結するように
すればいいんじゃね?100%近いキャッシュヒット率を稼ぎ出せればCPUでも

443 :デフォルトの名無しさん:2009/09/15(火) 16:27:52
>>441
これはすごい
NVIDIAとCUDA終わったな

444 :デフォルトの名無しさん:2009/09/15(火) 17:43:19
>>441
サンダーテクニカルなアーキテクチャにされるよりはいいよ。

445 :デフォルトの名無しさん:2009/09/15(火) 19:18:38
>>438
>大データに対して同一の演算を行うもの
ここは少し誤解があるような。
CUDAはもっと柔軟性があるよ。
カーネルコードにスレッドIDに依存する処理を入れても遅くならない。
if文も遠慮なく使っていい。
粒度のアンバランスがあってもwarpSize=32がなんとかしてくれることが多いw

CUDAが使えないのは、スレッド間で依存関係があるとき
(あるスレッドが別のスレッドの結果を使うようなとき)
だけでそれ以外は何とかなる。

スレッド間でデータ独立でループが長く、
スレッド数=数百、グリッド数=数百以上とれれば性能を出すのは簡単。

さらに共有メモリー(スレッド間で共有する配列)が使えるアルゴリズムのときは
100倍超の爆速になる。

食わず嫌いの人は、ドキュメントとサンプルコードと格闘してくれ。そうすれば何とかなるよ。

446 :デフォルトの名無しさん:2009/09/15(火) 21:22:19
>>445
嘘言うな。if文なんて最適化のときに削るべき対象だろうが
branch(特にdivergent branch)が増えると明らかに速度が落ちるし
tid使って分岐させる場合、ハーフワープ単位で揃えないと遅くなる

447 :デフォルトの名無しさん:2009/09/15(火) 21:29:40
100倍速くなるってw
CPUにどれだけ糞コード食わせているんだって言うwww

448 :デフォルトの名無しさん:2009/09/15(火) 21:44:32
>>447
CPUに十分最適化されたコード食わせていたとしても、物によっては100倍のオーダーも有り得るぞ
ただ、よっぽどCPUに不向きでGPUに向いてるアルゴリズムの場合に限られるが
普通は10倍〜だな

449 :デフォルトの名無しさん:2009/09/15(火) 22:13:25
でもATIの実装は雪豹の2万倍遅いので
意味がないというわけですね

やっぱりIntelに期待するしかないのですね

ワカリマス

450 :デフォルトの名無しさん:2009/09/15(火) 22:41:17
>>446-447
ネガティブなことを言うときりがないから。
性能はアルゴリズムによるから人それぞれ。
糞CPUコードって自己紹介か?
とにかくやってみろということだよ。

451 :デフォルトの名無しさん:2009/09/15(火) 22:46:31
まぁ、CUDA限定の話はほどほどに。

452 :デフォルトの名無しさん:2009/09/15(火) 22:47:12
>>440
一箇所「もぞもぞ」してるなw

453 :デフォルトの名無しさん:2009/09/15(火) 22:54:16
50倍でも100倍でもいいけど、今後の最適化ポイントを探す参考にしたいから実例を挙げて欲しいなあ。

プロセッサはピーク性能出し切ってようやく10倍でしょ。
メモリはそもそも10倍も速くないでしょ。
メモリの性能に依存するなら10倍未満って事になるよ。
CPUがきちんと最適化されているならGPUが100倍になる理由なんて無いんだけど。

テーブルを引いてくる場合とかかな?
CPUだとテーブルを引く瞬間はSIMD化出来ないから。

454 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/15(火) 22:58:27
CPUに8MBも高速低レイテンシのキャッシュ載っかってるのにそれが有効に使えてないってのはそれはそれで
問題外なような。

ローカリティとか意識してればGPUの1/50なんてことにならないぞ


しかしふと思った
やっぱCUDAって学生が力学とかの宿題解く分にはそこそこ有効なのかね。
書店でHPCプログラミングの本立ち読みしてたら、ああまさに大学生の宿題の応用だなと

455 :デフォルトの名無しさん:2009/09/15(火) 23:00:27
GPUのプロセッサー性能は最新のCPUの1/5くらい。
それが240スレッドで動くから、結局50倍という計算。
もろもろのマイナス要因はあるが、バンド幅の大きさ、レジスタの多さなどの
プラス要因もあるから、うまく行けばトータルでその程度は出るという話。

456 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/15(火) 23:01:09
>>453
GPUもGatherは遅いぞ
Half Warpぶんのベクトル長(512bit)に載っかるデータだけに関しては1サイクルのスループットで読み書きできる

457 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/15(火) 23:02:08
> GPUのプロセッサー性能は最新のCPUの1/5くらい
> それが240スレッドで動くから、結局50倍という計算。


はぁ〜?


458 :デフォルトの名無しさん:2009/09/15(火) 23:05:07
1.3からdoubleがサポートされたが、ピーク性能はfloatの1/10だけど、
実際はいろいろなものに隠蔽されるから、速度低下は1/3-1/4くらいかな。
コンパイル時に-arch=sm_13が必要。
doubleがどうしても必要なときはためらわずに使ってもいい。

459 :デフォルトの名無しさん:2009/09/15(火) 23:09:41
>>453
キャッシュラインの操作(GPUの場合は共有メモリだから厳密には違うけど)が明示的にできるか否かや
バス構成の違い、プロセスがTDMで走るかとかアーキテクチャそのものが違うわけで
アーキテクチャが変われば当然、適した問題も変わってくる
そういう2つを比較するんだから、単にデータシートから求まるピーク性能だけを持ってきても意味ないでしょ

460 :デフォルトの名無しさん:2009/09/15(火) 23:10:18
OpenCLは文字列処理に向いてるのかね?

461 :デフォルトの名無しさん:2009/09/15(火) 23:13:03
GPUを使う以上、文字列操作に向いてるって事はないだろう
SIMD的に規則正しく処理できるようなものならいけるかもしれないけど
普通、文字列操作ってifの塊だし

462 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/15(火) 23:51:43
SSEならchar型16個を並列処理することができるし
SSE4.2でテキストサーチ用の命令が強化されてる。

GPUは1エレメントをchar*4のSIMDとして扱うような芸当はできないから
基本的に32ビットに拡張して扱うしかない

ハッキリ言って向いてない。

Larrabeeも整数は32ビット単位でしか扱えないようになってる。
汎用CPUと差別化してきてるね。

463 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/16(水) 00:12:09
文字列処理は検索とコピーくらいしか並列化しようがないから、スカラの逐次処理との切替が素早くできる
CPU内蔵のSIMDで高速化するのが一番効率的なのです

464 :デフォルトの名無しさん:2009/09/16(水) 00:13:21
だからデータシート云々言うんだったら実例挙げてごらんよ。
それが正しければへぇ、ってなるし、間違ってれば俺なり団子なりが訂正してやんよ。

465 :デフォルトの名無しさん:2009/09/16(水) 00:18:56
スカートのチラリズムを計算したいんだが
方程式しらね


466 :デフォルトの名無しさん:2009/09/16(水) 00:39:10
CPUで動くあるコードを持ってきたとする。でもそのままコンパイルするだけでは動かない。
結局、GPUを使う場合は、多少なりともGPUを意識したコードになり、
必然的にある程度最適化していると言うことで、同じ土俵ではないということ。

前とある学会であった発表で、GPU(G200)を使った結果がQX9650よりも8倍高速化されたというものだったが、
比較がなんとシングルコア。これだったらGPUを使わないでCPUを最適化してMPIでも使えと思った。
でも両方使えばもっとウマーだな。そういうことを考えていくとLarrabeeなりに行き着くのかな。



467 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/16(水) 00:47:08
Cell Speed Challengeの参加者のレポートもそんなんばっかしだよ。

Core 2 QuadのSSEなし1コアに比べてCell(SPE6個・SIMD最適化)でこんだけ速くなりましたとか


468 :デフォルトの名無しさん:2009/09/16(水) 00:53:37
まあ、がんばって最適化してみたら、思うように性能が出なくて、
仕方なしにリファレンスを変えるのは上等手段だしね。
やってきたことを如何に大げさに言うかが重要だからね。
嘘は言っていないから。

469 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/16(水) 01:06:45
まあ、Core 2のSSEの性能と比較したらよっぽど都合が悪かったんだろうなぁと解釈した。
問題自体がCell向きとは言い難かったし。


470 :デフォルトの名無しさん:2009/09/16(水) 01:36:52
両方使うというのは理想だけど
メモリ転送が遅すぎてどっちかでやったほうが速い。
これは並列化するアルゴリズムにもよるから
一概にはいえないけども。

471 :デフォルトの名無しさん:2009/09/16(水) 01:57:48
>>466,470
実際にOpenMPとCUDAを併用して高速化を行った論文もあるぞ
CPU処理の初期データ生成を並列化するだけというものだから
俺たちからしたら知ってるよぉ!レベルの話だが

472 :デフォルトの名無しさん:2009/09/16(水) 02:00:13
連投になるけどOpenCLはCPUやDSPのコードも書けるから
どっちも使うコードがメインになるのかな

473 :デフォルトの名無しさん:2009/09/16(水) 02:19:47
CPUの場合も
OpenCLでやれば、SIMDの組み込み命令がどうだの
プリフェチがどうだの、考えなくていいんでしょ?
それに、CPUでfloat4やfloat4x4を扱うとき
どの環境も決定性に欠ける面もあるし、
OpenCLには期待しているのだけれど、、
とりあえずWindowsXPで動いてくれよ

474 :デフォルトの名無しさん:2009/09/16(水) 02:19:50
>>471
CellやCUDAをきっかけにHPCに興味を持っていろいろと調べたり勉強しているのだが、
結構しょぼい論文が多い気がする。
コンピュータサイエンスにおけるHPCって以外とレベルは高くないのかな?
(そんなことはないと反論を希望したい。)
まあ、今までは特定の研究者しかさわれない分野が最近は一般レベルに落ちてきたら、
これからもっと発展するのか・・・な?

475 :デフォルトの名無しさん:2009/09/16(水) 02:47:08
>>474
HPCってTOP500に代表されるように国際競争の場だから
外部の人間が自由に見れるような論文は当たり障りの無い内容が多いよ
TOP500の上位マシンは企業製で国家機関の管轄だし

このスレ的には例えば東工大が来年7月完成予定のTSUBAME2.0にCUDA採用を決めてて
その前段階としてベクトルマシンとGPUクラスタのワットパフォーマンスとかやってたけど
詳細な論文出てたっけな…

476 :デフォルトの名無しさん:2009/09/16(水) 05:41:06
>>475
そんなことねーよwww

477 :デフォルトの名無しさん:2009/09/16(水) 07:12:36
少なくとも私の業務は企業機密に属するから紹介できないがな。
実装運営部隊ではOpenMPは嫌われていてpthreadで実装したがるのだが、
研究部隊であるうちではOpenMPもcudaもなんでもありで実験に使っている。
勿論、intelにも協力してもらっているのでtbbを意識した最適化も行なっている。

478 :デフォルトの名無しさん:2009/09/16(水) 07:47:28
TBBで書いておくと勝手にGPGPUしてくれるライブラリってない?


479 :デフォルトの名無しさん:2009/09/16(水) 08:22:10
>東工大が来年7月完成予定のTSUBAME2.0にCUDA採用を決めてて

無駄なことをするもんだ

480 :デフォルトの名無しさん:2009/09/16(水) 08:24:11
スパコンではなくGPGPUでという前提だと、現状ではCUDA以外に使えるもんがないからしょーがないべ

481 :デフォルトの名無しさん:2009/09/16(水) 08:35:01
その前程自体がおかしい

482 :デフォルトの名無しさん:2009/09/16(水) 10:54:47
>>480
TSUBAMEはスパコンだが

483 :デフォルトの名無しさん:2009/09/16(水) 12:50:58
>>477
「自称エリートのR&Dが糞コードを書く」の法則ですね

484 :デフォルトの名無しさん:2009/09/16(水) 12:56:07
馬鹿ほど法則を乱造するの法則

485 :デフォルトの名無しさん:2009/09/16(水) 13:54:11
メタすぎっぞオイ

486 :デフォルトの名無しさん:2009/09/16(水) 13:56:48
ああ、メタメタやな

487 :デフォルトの名無しさん:2009/09/16(水) 16:02:19
メメタァ

488 :デフォルトの名無しさん:2009/09/17(木) 00:15:35
>>475
思うに、そういった狭い範囲での競争だから余り飛び抜けた様な内容があるのかな?
どちらかというとお金をかけまくって、ハードの進歩に依存しているような気がする。
スパコンベンチマークにしても未だにLINPACKとかでやっているのがそういったことを
表している様な気がしてならない。そろそろ、HDエンコードxxxxxxxxxxxMfps!とか
やってみた方が一般人には分かりやすいのではないかな?

489 :デフォルトの名無しさん:2009/09/17(木) 01:11:12
一般人が使ったり知る必要がない気がする。
動画のエンコ・デコードや、3Dゲームですら、
PCユーザの中では少数派だし。
ましてや、プログラミングするわけでもないし。

490 :デフォルトの名無しさん:2009/09/17(木) 07:05:09
そのとおり

491 :デフォルトの名無しさん:2009/09/18(金) 07:29:19
GT300は4.8TFなんだなすげーな

492 :デフォルトの名無しさん:2009/09/18(金) 09:08:10
理論値でなく実効値?

493 :デフォルトの名無しさん:2009/09/18(金) 10:25:33
>>491
それが本当だとすると出回ってるダイサイズのデータと考え合わせると、
単位チップ面積あたりのFlops数が大体R870と並ぶ事になるわけで、
噂どおり、かなりアーキテクチャを弄ってるようだな。

>>492
ないない。

494 :デフォルトの名無しさん:2009/09/18(金) 19:11:48
G300のスペックの情報なんて見たことないが

495 :デフォルトの名無しさん:2009/09/18(金) 19:12:55
英語だとそれなりに出てくる。まあ、噂話レベルだが。

496 :デフォルトの名無しさん:2009/09/18(金) 19:51:20
4.8TFlopsったらGT200の5倍弱だろ?
演算性能の水増しが簡単なラデでさえあの性能で300平方超えてるのにそんな真似できるんか?

497 :デフォルトの名無しさん:2009/09/18(金) 20:04:44
サンプルチップの良品率が2%を切っているという愉快な噂も流れているし、
40nmで余裕が出来た発熱マージンを全部使い切った超巨大チップにしてるんじゃないの?

498 :デフォルトの名無しさん:2009/09/18(金) 20:53:31
GT200の時点でGPGPUメインの「時代が付いて来い」設計だからなあ

499 :デフォルトの名無しさん:2009/09/18(金) 21:29:15
GPU会社だけあってGPUの将来が見通せてたんだよ
お絵かきだけじゃもたないってさ

500 :デフォルトの名無しさん:2009/09/18(金) 21:33:41
ATIはオートンが居なくなってから
2000,3000,4000,5000と4世代もアーキ更新なしか
AMDは本当にモノを作れない会社だな

501 :デフォルトの名無しさん:2009/09/19(土) 00:20:12
4.8TFってすげーよな
でもこれってデュアルなんじゃねーの?

502 :デフォルトの名無しさん:2009/09/19(土) 01:59:06
シェーダユニット数だけ見ると, AMD の圧倒的優勢に見えるんだけど...

RadeonHD一万円級 : 800 units
GeForce最上位 : 320 units

GeForce はなぜメモリバス幅が 448bit と中途半端なんだ?


503 :デフォルトの名無しさん:2009/09/19(土) 02:00:56
AMDとかいうウンコの話はこのスレでは必要無い

504 :デフォルトの名無しさん:2009/09/19(土) 02:10:38
>>503

げふぉとかいうクソの話はこのスレでは必要無い.

アンチラデ厨がいるぞ.


505 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/19(土) 08:30:22
デコーダに連なるユニット全て1コアとカウントすれば

ラデオソ・・・ワイドSIMD×VLIWの10コア
GT200・・・ワイドSIMDの30コア


506 :デフォルトの名無しさん:2009/09/19(土) 08:57:52
AMDがBulletを: 新 masafumi's Diary
ttp://masafumi.cocolog-nifty.com/masafumis_diary/2009/09/amdbullet-7c91.html

無料同士で正面衝突かよ。共通規格は遠いなあ・・・

507 :デフォルトの名無しさん:2009/09/19(土) 08:57:53
R800世代でも20coreか

nvは非x86のlarrabeeになりそうだし
方向性としてはモノを作れないAMDだけが明後日方向を向いてとりこのされてる感じだな
カークの言葉を借りれば、粗悪な大量のピクセルを目指して

次世代以降もIntelとnvidiaのにらみ合い
AMDは蚊帳の外

508 :デフォルトの名無しさん:2009/09/19(土) 10:29:44
GeForce GTX 280の演算性能は933GFLOPS、Radeon HD 4870は
1.2TFLOPS(1200GFLOPS)であり、このスペックだけを見ると
Radeon圧倒的優勢に見えるが、一般的なGPGPUアプリケーションは
GeForceアーキテクチャの方が高効率に演算リソースが利用され
ハイパフォーマンスが期待できる。それではRadeonがダメなのかというと、
そんなことはなく、うまくSIMDユニットをフル活用するように
アプリケーションを構成できさえすれば、1.2TFLOPSの性能が発揮できることだろう。


509 :デフォルトの名無しさん:2009/09/19(土) 10:33:44
お絵かき専門のどうしようもない代物だということだな

510 :デフォルトの名無しさん:2009/09/19(土) 10:35:47
>>508
VLIWじゃ無理
RadeonはGeforceと同一の
アーキテクチャにしないと負ける

511 :デフォルトの名無しさん:2009/09/19(土) 10:38:15
一般的なGPGPUアプリケーションってシェーダ効率以前の問題で、
GPU側で処理する粒度が小さすぎて、足回りの差が出ているだけ。
演算性能の殆ど無駄にして、CPUよりは速いレベルで喜んでいるのが殆ど。

50倍、100倍速くなるもともとGPGPU向けのアプリケーションの場合
逆に演算の汎用性なんか殆ど関係なく、最適化すれば
単純に素の演算性能に見合った実効性能がでる。
でかい密行列同士の積とか、Nbodyみたいな奴ね。

512 :デフォルトの名無しさん:2009/09/19(土) 10:56:24
じゃあGrapde-DRでいいじゃん


513 :デフォルトの名無しさん:2009/09/19(土) 11:03:11
Grape-DRは、素の演算性能が低いから
メイン用途のNbodyでGPU相手に太刀打ちできそうにない。

で、GPGPUより汎用性高いとかいう理屈で正当化する
必要に迫られたわけだ。

514 :デフォルトの名無しさん:2009/09/19(土) 11:04:24
GPGPUなんてプログラムまともにかけねーじゃん

515 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/19(土) 11:05:22
メモリ帯域狭いしな

利権・・・じゃなかった理研の人的にはLarrabeeはそれなりに前評判良いらしいけど

516 :デフォルトの名無しさん:2009/09/19(土) 13:01:30
ATIは粒度でかすぎ
16*5*4=320
nv
8*4=32

517 :デフォルトの名無しさん:2009/09/19(土) 13:04:05
charが計算できないものはゴミ

518 :デフォルトの名無しさん:2009/09/19(土) 15:08:57
intelとnv
まだ両者とも物が無いんだよな

519 :デフォルトの名無しさん:2009/09/19(土) 15:13:22
>>518
intelのは来月開発版貰えるだろ


520 :デフォルトの名無しさん:2009/09/19(土) 15:18:53
Larrbeeくれんの?

521 :デフォルトの名無しさん:2009/09/19(土) 15:20:17
>>520
俺は評価キット貸してもらえる
いいだろ?

522 :デフォルトの名無しさん:2009/09/19(土) 15:27:53
NDAに抵触しない範囲でレポよろ

523 :デフォルトの名無しさん:2009/09/19(土) 15:33:14
>>521
まじか
もらったらまず何やるの?

524 :デフォルトの名無しさん:2009/09/19(土) 19:10:30
http://lucille.atso-net.jp/blog/?p=907
追記

Visual Studio 2008 を使っているのですが、デバッグ -> デバッグ開始だととても遅くなる模様(Release ビルドでも).
デバッグ -> デバッグなしで実行だとそれなりの速度でうごきました.
んー、なにか変な実行時デバッグチェックが、OpenCL ドライバかどうか分かりませんが、入っているのですかね.
ちなみに「デバッグなしで実行」でも、0.05 secs くらいかかりました.
(SnowLeopard の 0.0001 秒に比べるとまだ遅い)

525 :デフォルトの名無しさん:2009/09/19(土) 21:06:21
つかAMDが作ったSDKをIntelCPUで動かして遅いって
SSE2・3がAMDで遅いのと同じレベルの話だよな
釣りなのか本気なのか

526 :デフォルトの名無しさん:2009/09/19(土) 21:22:34
>>525
ちなみに同じプログラムを
6コアのOpteronで動かすと19秒もかかるんだぜ?w

527 :,,・´∀`・,,)っ-○○○ ◆??? :2009/09/19(土) 23:01:22
http://software.intel.com/en-us/data-parallel/

Intelがいよいよ動き出した。
Ctのβテスター募集だってさ。

528 :デフォルトの名無しさん:2009/09/19(土) 23:12:08
団子がレビューしてくれよ。
すげー、かっけー、じゃなくて
書きやすさとかを実例でもってさ。

529 :,,・´∀`・,,)っ-○○○:2009/09/19(土) 23:31:30
当然申し込んでるよ

530 :デフォルトの名無しさん:2009/09/19(土) 23:33:57
とりえあずgoogleのメアド3000口分応募しておいた


531 :デフォルトの名無しさん:2009/09/19(土) 23:36:26
GPUでFM音源作ってたころが懐かしいな。
PS1.1縛りであれこれやってたなぁ。

532 :デフォルトの名無しさん:2009/09/19(土) 23:58:21
俺もgmailで4500口分応募した

533 :デフォルトの名無しさん:2009/09/20(日) 00:43:01
>>531
あんたここに居たのか
・・・まぁ居るわな

534 :デフォルトの名無しさん:2009/09/20(日) 07:25:14
>>530
そういうのってスパム扱いでアウトなんじゃなかったっけ?


535 :デフォルトの名無しさん:2009/09/20(日) 11:38:18
GPGPUでエンコードテスト
http://www.nicovideo.jp/watch/sm7902356

536 :デフォルトの名無しさん:2009/09/23(水) 19:42:50
HD5800の正式発表来たな。
Streamを早々に放棄してCSとOpenCLに任せ、
Havokを打ち棄ててスタンスフリーなBullet(CUDAアクセラレーションも行っている)と手を組むとは
実にエレガント。
成功するかどうかは知らんけど。

537 :デフォルトの名無しさん:2009/09/23(水) 20:02:23
いっそのことCUDAを乗せられたら大成功だったと思うんだがな。

さすがにそんなことはできないけどw
HD58x0系のThread Execution Managerの仕組みとか気になる

538 :デフォルトの名無しさん:2009/09/23(水) 20:09:40
今回もRadeonのdoubleは無効なのかね

539 :デフォルトの名無しさん:2009/09/23(水) 20:12:25
無知が来た

540 :デフォルトの名無しさん:2009/09/23(水) 20:14:06
>>536
Rouge Wave次第だから意味ない
実際人のよさげなあのおっさん管理職なだけで
無能だし

541 :デフォルトの名無しさん:2009/09/23(水) 20:14:46
結構いい選択だと思う。 Streamは腐ってたし。
次のATIの実装が腐ってないという保証もないけど。

542 :デフォルトの名無しさん:2009/09/23(水) 20:29:20
CUDA立ち上げた人がAMDに移ってるそうなので、とりあえず動かせるものには仕上げてくるんじゃないかな

4Gamer.net ― DirectX 11が加速するゲームの進化〜AMD,新世代DirectXのポイントとメリットを解説(DirectX)
ttp://www.4gamer.net/games/033/G003329/20090922001/


543 :デフォルトの名無しさん:2009/09/24(木) 00:06:40
>>538
single 2.7TFLOPS double 544GFLOPS
とあるね。
http://journal.mycom.co.jp/photo/special/2009/cypress/images/Photo15l.jpg

544 :デフォルトの名無しさん:2009/09/24(木) 00:10:40
int8は無いのかね?

545 :デフォルトの名無しさん:2009/09/24(木) 00:15:19
>>543 リンク間違い
http://journal.mycom.co.jp/special/2009/cypress/index.html

546 :デフォルトの名無しさん:2009/09/24(木) 00:22:28
>>544
OpenCLにはint8があるけど・・・
http://www.khronos.org/developers/library/overview/opencl_overview.pdf (p.41)

547 :デフォルトの名無しさん:2009/09/24(木) 00:23:59
型名の後の数字はベクタ長だろ。

548 :デフォルトの名無しさん:2009/09/24(木) 00:51:35
>>543
FireGLでないRadeonのGPGPUモードで有効になってるのかなって意味で。
GeForceより演算器数多いから期待してるんだけど。

549 :デフォルトの名無しさん:2009/09/24(木) 00:54:25
>>548
3xxxの頃から普通に使えたでしょ。

550 :デフォルトの名無しさん:2009/09/24(木) 01:43:02
使えたけど使用可能な組み込み関数が少なくて使い物にならなかったような
64bitOSのせいか?

551 :デフォルトの名無しさん:2009/09/25(金) 01:53:20
>>516
> ATIは粒度でかすぎ
> 16*5*4=320
> nv
> 8*4=32

大は小を兼ねるんや!!!


552 :デフォルトの名無しさん:2009/09/25(金) 03:36:39
ああ、そういえばRV870でも結局でかいままだったな

553 :デフォルトの名無しさん:2009/09/25(金) 04:03:38
グプグプゥ

554 :デフォルトの名無しさん:2009/09/25(金) 16:13:47
HD5870x2、500ドル以内だとよ。
倍精度1TFを5万でデスクサイドに置ける時代が来るとはな。

555 :デフォルトの名無しさん:2009/09/25(金) 22:29:29
エアTF

556 :デフォルトの名無しさん:2009/09/25(金) 22:50:08
GT300は1コアで4.8TFだからな
Radeonなんて足元にも及ばん

557 :デフォルトの名無しさん:2009/09/25(金) 23:08:22




ここまでソース無し






558 :デフォルトの名無しさん:2009/09/25(金) 23:09:42
ソースみつけた
http://images.anandtech.com/graphs/rv870_092209122344/20136.png

559 :デフォルトの名無しさん:2009/09/25(金) 23:23:22
>>558
全然ソースになってねえよ

560 :デフォルトの名無しさん:2009/09/25(金) 23:48:37
GT300は250軽く超えるだろ

561 :デフォルトの名無しさん:2009/09/26(土) 04:33:13
ATIは鈍足だなw

562 :デフォルトの名無しさん:2009/09/26(土) 07:24:25
なんの意図でその絵を貼り付けまくってるのか知らんが
ラデオソの低効率を広めたいのかな?

563 :デフォルトの名無しさん:2009/09/26(土) 20:04:01
さて5870買ったが
OpenCLがGPUモードにならないで
何時までもCPUモードなんだが

どうゆうことなのか説明してもらおうか

564 :デフォルトの名無しさん:2009/09/26(土) 20:31:13
CPUメーカーに将来統合される暗示です

565 :デフォルトの名無しさん:2009/09/26(土) 21:11:04
CPUですら遅いライブラリしか出来ないのに
いはんやGPUをや

566 :デフォルトの名無しさん:2009/09/26(土) 21:30:50
>>563
Snow Leopardの話?

567 :デフォルトの名無しさん:2009/09/26(土) 21:31:26
ラデ対応版Bulletの現物マダー
ATiって新規格ブチ上げるのはいつも早いけどそれがまともに動くブツを出さないから
いつまでたってもNVIDIAに勝てないんだよ

568 :デフォルトの名無しさん:2009/09/26(土) 21:47:38
>>563
Snow Leopardじゃそもそも画面すら
写らんよ

569 :デフォルトの名無しさん:2009/09/28(月) 20:03:01
ぐぷぐぷっ

570 :デフォルトの名無しさん:2009/09/29(火) 15:20:51
OpenCL Download Page
http://developer.nvidia.com/object/opencl-download.htm


571 :デフォルトの名無しさん:2009/09/30(水) 01:02:42
OpenCLでCUDA潰して、BulletのOpenCLベース化をサポートしてPhysXを潰す、と。
スマートな発想だが、いつもの如くAMDのOpenCL対応がgdgdで画餅と化すに万札2枚賭けよう

572 :デフォルトの名無しさん:2009/09/30(水) 01:39:39
結局のところCPUと共食いしちゃうようなアクションを本気では起こせないから
これからはOpenCLだDirectComputeだって言って、
とりあえずCUDAのマインドシェアだけ落としておきたいんだろう
OpenCL実装のやる気のなさを見てるとそんな感じに見える

573 :,,・´∀`・,,)っ-○○○:2009/09/30(水) 01:59:20
AMDがいまさらHalf Floatの変換命令をCPUサポートする計画を立てる意味ってどこにあると思う?
どうやらシェーダの前処理としてデータの再パッキングをCPUでやらせたいらしい。

GPUの柔軟性のなさをCPU側で補いつつ、グラフィック性能を追求する方針なんだろうね。

574 :デフォルトの名無しさん:2009/09/30(水) 02:20:53
SDKの中のDirectCompute_Release_Note.txtに

Open the registry editor in the window
Start -> regedit
Click at the very top icon labeled "Computer" in the Registry Editor
Search for D3D_39482904 the string. If found, delete it from the registry.
There should be about 2 instances of this registry key

って操作があったのでやってみたら、190.38beta以外ではネイティヴ動作しなかったDirectX SDKの一部のCSサンプルが
191.03でも動くようになった。

575 :デフォルトの名無しさん:2009/09/30(水) 02:52:34
んでもマルチプラットフォーム展開するBulletとしては実験中のCUDA対応をぶん投げてOpenCLにシフトするのは確実だろうし、
そうなればAMDの実装が腐っていようがBulletがPhysXに勝利するんじゃないか。
AMDがOpenCLをまともに実装すればプラスになるし、最悪の場合(実装断念)でもマイナスにはならない。

576 :デフォルトの名無しさん:2009/09/30(水) 03:38:15
Bulletってどんなゲームに採用されてるの

577 :デフォルトの名無しさん:2009/09/30(水) 06:51:46
http://en.hardspell.com/doc/enshowcont.asp?id=7117
Nvidia works together with Microsoft for high performance GPU computing

578 :デフォルトの名無しさん:2009/09/30(水) 10:21:53
>>571
そのOpenCLもNVIDIAに水を開けられている罠。

579 :デフォルトの名無しさん:2009/09/30(水) 18:38:29
http://www.fudzilla.com/content/view/15741/1/
Nvidia to show DX 11 Fermi today

We expect that Nvidia CEO Jensen Huang will demonstrate the card at the GTC keynote that should start at 1.00 PM Pacific time or roughly 10 PM Central European time.

Fermi has a lot of cache and supports instructions that use to be common only for CPU
and many people believe that this is a hybrid between a graphics card and a CPU.
This might be the direction that Nvidia will be heading.

580 :デフォルトの名無しさん:2009/09/30(水) 21:24:57
GT300は4.8TF確定で
11月に公式発表するって

581 :デフォルトの名無しさん:2009/09/30(水) 21:41:15
ttp://www.techarp.com/showarticle.aspx?artno=88&pgno=5
ttp://www.techarp.com/showarticle.aspx?artno=88&pgno=6
ttp://www.techarp.com/showarticle.aspx?artno=88&pgno=7
ttp://www.brightsideofnews.com/news/2009/9/30/nvidia-gt300s-fermi-architecture-unveiled-512-cores2c-up-to-6gb-gddr5.aspx
ttp://www.brightsideofnews.com/news/2009/4/22/nvidias-gt300-specifications-revealed---its-a-cgpu%21.aspx

>A GPU supports C++ natively?
なんぞこれ
ハードウェアコンパイラー?

582 :デフォルトの名無しさん:2009/09/30(水) 21:42:15
┌────────┬────┬────┬────┬────┬────┐
│                │GTX 380 │GTX 360 │GTS 350 │GTS 340 │GTX 285 │
├────────┼────┼────┼────┼────┼────┤
│SP数          │  512.   │  480.   │  320.   │  256.   │  240.   │
├────────┼────┼────┼────┼────┼────┤
│ROP数         │   64   │   56   │   48   │   40   │   32   │
├────────┼────┼────┼────┼────┼────┤
│コアクロック     │ 700MHz│ 650MHz│ 675MHz│ 625MHz│ 648MHz│
├────────┼────┼────┼────┼────┼────┤
│シェーダクロック... │ 1.6GHz..│ 1.4GHz..│ 1.7GHz..│ 1.5GHz..│1476MHz.│
├────────┼────┼────┼────┼────┼────┤
│メモリクロック    │1100MHz.│1000MHz.│ 900MHz│ 800MHz│1242MHz.│
├────────┼────┼────┼────┼────┼────┤
│メモリバス      │  512bit . |  . 448bit │  384bit . |  . 320bit │  512bit . |
├────────┼────┼────┼────┼────┼────┤
│メモリタイプ.      │ GDDR5  |  GDDR5 │ GDDR5  |  GDDR5 │ GDDR3  |
├────────┼────┼────┼────┼────┼────┤
│消費電力        │ .225W. │ .195W. │ .165W. │ .140W. │ .183W. │
└────────┴────┴────┴────┴────┴────┘

583 :デフォルトの名無しさん:2009/09/30(水) 21:51:59
単にC++で書いたような普通のコードも走りますよって話じゃねぇの?
Bill DallyのMerrimacはクラスタに1つMIPSコア持ってるようだし、
Fermiもシェーダクラスタに1つARMコアでもついてるのかもな。

584 :デフォルトの名無しさん:2009/09/30(水) 21:58:09
http://www.pgroup.com/resources/cudafortran.htm
PGI CUDA Fortran Compiler

585 :デフォルトの名無しさん:2009/09/30(水) 23:50:43
OpenCLにDirect3Dとの相互運用性はないけど、PCゲームに進出するシナリオってあるの?
普通にOpenGL使うんかな

586 :デフォルトの名無しさん:2009/10/01(木) 00:14:46
いまんとこゲームでGPGPUってあんまり聞かないなぁ
流体計算とか、ゲームの中で重要度はまだそんなに高くないし、
OpenGL/Direct3D共にシェーダ言語が意外と多用途に使えるし。

587 :デフォルトの名無しさん:2009/10/01(木) 00:31:29
まだまだこれからだし、物理計算なんて作り手の知能が高くないとスクラッチできないし。
ミドルウェア屋さんが実装して、ディベロッパーがそれを使うって形になるんじゃない?
あとCPUに命令投げるみたいに普通にGPUにも命令飛ばせないと根本的な使い辛さは解消されないよね。

588 :,,・´∀`・,,)っ-○○○:2009/10/01(木) 00:38:36
CPUなら1つの演算ユニット動かすのに1命令だが、
GPUでは1つの命令投げると何十も同じ動きしやがるんだよ。
それ否定したらLarrabee以外選択肢なくなる

589 :デフォルトの名無しさん:2009/10/01(木) 00:50:04
foreachとかTBBのparallel_forだったらどうにかならん?

590 :デフォルトの名無しさん:2009/10/01(木) 01:09:59
Bulletの中の人的にはBlenderでGPUが使えればそれでいいやー、ってとこか

591 :デフォルトの名無しさん:2009/10/01(木) 01:24:16
Bulletの中の人からしたらOpenCLは本命だろうしね
あとはAMDがいらん世話焼いてかきまわしたりNVIDIAが横槍入れたりしなければ
遠くないうちに対応版が出るでしょ
とりあえずユーザーとデベロッパには利益しかない

592 :デフォルトの名無しさん:2009/10/01(木) 02:14:20
詐欺の常套句出ました

593 :デフォルトの名無しさん:2009/10/01(木) 03:29:34
Bulletってどんなゲームに使われてるの?

594 :デフォルトの名無しさん:2009/10/01(木) 04:24:03
でもCS対応の方が需要あると思うんだけど。
DirectXとOpenGLの速度差を考えるとOpenCLよりDirectComputeの方が速いんじゃない?
QuadroはOpenCL特化でGeforceはCS特化とかやりそうだし。

595 :デフォルトの名無しさん:2009/10/01(木) 08:05:33
なんか、穏当な拡張で済ませてきたな>Fermi

596 :デフォルトの名無しさん:2009/10/01(木) 09:20:53
>>595
倍精度が結構いいね。
でもNVは最終的にはCPUを作りたいのかね?
Co-processingとかいうのをきくと。

597 :デフォルトの名無しさん:2009/10/01(木) 09:41:13
完全に汎用なCPUの事なら、それはないだろ。
CPU云々ってのはIntelがチップセットを作るのに必要なバスのライセンスをもう出さないって
ところからそう言う推測が出てきてるだけで。

598 :デフォルトの名無しさん:2009/10/01(木) 10:09:11
実世界で本当にCUDAコンピューティングの時代が幕を開けそうだな

599 :デフォルトの名無しさん:2009/10/01(木) 11:05:20
>>588
> それ否定したらLarrabee以外選択肢なくなる
え?Cellは?

600 :デフォルトの名無しさん:2009/10/01(木) 11:29:18
>>599
寝言は寝て言え。

601 :デフォルトの名無しさん:2009/10/01(木) 11:42:04
新型PS3にlinuxがインストールできないと知ったときのああやっぱりね感

602 :デフォルトの名無しさん:2009/10/01(木) 11:48:53
思いっきりLarrabeeの方向に振ってきたな
AMDだけが遅れてるwww
まあオートンが居なくなった頃に散々言われてたがな

603 :デフォルトの名無しさん:2009/10/01(木) 12:13:52
LarrabeeよりさきにGT300がでそうね
ということでLarrabee終了のお知らせ
お勤めご苦労さん>intel

604 :デフォルトの名無しさん:2009/10/01(木) 12:27:50
MPMDっても高々16カーネルが同時に走るってだけだし、larrabeee程の
柔軟性はなくて、bill dallyの言うstream computingなプログラミング
スタイルでないと効率は出ないと思う。

605 :デフォルトの名無しさん:2009/10/01(木) 16:37:20
ニコイチAMDなんて有難がってたのはベンチ厨だけだろ

606 :デフォルトの名無しさん:2009/10/01(木) 18:00:13
>オートンが居なくなった

アーキテクトがいなくなった時点で進歩するわけがないわな

607 :デフォルトの名無しさん:2009/10/01(木) 18:04:27
Whitepaper NVIDIA’s Next Generation
CUDA Compute Architecture:Fermi
ttp://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIAFermiArchitectureWhitepaper.pdf

NVIDIA's Fermi: Architected for Tesla, 3 Billion Transistors in 2010
ttp://www.anandtech.com/video/showdoc.aspx?i=3651

608 :デフォルトの名無しさん:2009/10/01(木) 18:42:13
FPU,Intが別になったんね
ECCもいいね

609 :デフォルトの名無しさん:2009/10/01(木) 19:37:09
SPで1.5Tflopsっぽい(1.5GHz)

610 :デフォルトの名無しさん:2009/10/01(木) 19:41:22
http://nukkorosu.80code.com/img/nukkorosu11421.jpg

わろす

611 :デフォルトの名無しさん:2009/10/01(木) 19:45:19
で?

612 :デフォルトの名無しさん:2009/10/01(木) 20:31:23
>>607
whitepaper読み終わった。すごすぎる。
Using this elegant model of dual-issue, Fermi achieves near peak hardware performance.
の一文が頭に残っている。早く使いたいです。
CUDAの問題点を調査してゼロから設計したんだな。
後藤さんのレポートもこれをもとにしたようで合わせて読むとわかりやすい。

613 :デフォルトの名無しさん:2009/10/01(木) 21:18:44
4.8TF確定だな
すげーなNVidia

614 :デフォルトの名無しさん:2009/10/01(木) 21:20:41
いや、fpなら1.5tflops辺りだよ
ただし、実行効率が某A社とは段違いなだけで

615 :デフォルトの名無しさん:2009/10/01(木) 21:26:31
intは4.8T確定?

616 :デフォルトの名無しさん:2009/10/01(木) 21:27:06
ちがうだろ

617 :デフォルトの名無しさん:2009/10/01(木) 21:32:52
AMD終わりだなこりゃ

618 :デフォルトの名無しさん:2009/10/01(木) 21:34:49
自作PC板ではR800の登場でGTX300追悼とか言われてんのに
こっちでは全然評価が違うんだねぇ

619 :デフォルトの名無しさん:2009/10/01(木) 21:43:24
ECCも使えないものを、なんで評価できよう

620 :デフォルトの名無しさん:2009/10/01(木) 21:43:44
>>618
自作板はもんもんとかいうホモ集団が
幅利かせてるし。バカVIPPER出入りしてるし
理解できないんだろ

621 :デフォルトの名無しさん:2009/10/01(木) 21:56:03
自作板住人は開発者とイコールではないからな。

622 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/01(木) 21:59:28
A社のは、x, y, z, w tの5つのユニットで一組のALUを構成するVLIWで
それが16個連なって超並列SIMDプロセッサを構成してる。

x, y, z, wは座標軸で、3Dでも実質3軸分しか稼働しない。4軸目はたまに使う程度。5軸目は稀に使う程度。
2D処理に落とし込むと遊びが増える。使って1〜2Way。
VLIW-SIMDは実効性能は低いけど演算ユニットを高密度で搭載できるから
トランジスタ数あたりのFLOPSを大きく稼ぐことができる。

でもそれを引き出すためのスケジューリングは骨が折れる。
結局の所ATIのやってることはPentium 4の空回りGHzと似たようなモン。

NやIntelはフラットなSIMDで、X, Y, Z成分を分解して別々のベクトルに再パッキング(AoS-SoA変換)して
並列処理する。
だから3次元より2次元のほうが相対的に得意だったりするし、動的なスケジューリングがやりやすいから
演算ユニットの利用効率を高めることができる。
カタログスペックより実効効率にフォーカスしている


623 :デフォルトの名無しさん:2009/10/01(木) 22:05:31
NV謹製のGPGPUベンチでGeForce負けてるんだが

624 :デフォルトの名無しさん:2009/10/01(木) 22:09:25
また低効率自慢したいのかatiは
頭が幼稚だから、何でもベンチに見えるようだし

625 :デフォルトの名無しさん:2009/10/01(木) 22:11:27
ATIは実際のスペックじゃ
450GFもでないぞ

626 :デフォルトの名無しさん:2009/10/01(木) 22:13:26
ベンチはIntelとNvの十八番なのに
次は体感でも語ってくれるのかな

627 :デフォルトの名無しさん:2009/10/01(木) 22:17:17
ヤクルトが特大ヤクルトになっても
胸焼けするだけ

628 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/01(木) 22:21:52
いまだにVLIWが夢のアーキテクチャだと思ってる人いるのね
Intelが2度も大失敗してるのに

ダイナミックスケジューラを積まない代わりにその分だけ演算ユニットを大量に積むことで
性能を引き出すアプローチ。演算ユニットの分だけ性能が出るわけではない。
実効性能を高める機構を省いた分を演算ユニットの物量でカバーしてるだけ。

Efficeonは10基の演算ユニットを持ち最大8命令を同時発行できたが
実効性能は額面最大スループットが半分以下のPentium Mの足下にも及ばなかった。


629 :デフォルトの名無しさん:2009/10/01(木) 22:31:35
次期CPUをVLIW互換でやるといって
AMDはアホだろw

630 :デフォルトの名無しさん:2009/10/01(木) 22:33:20
>>628
すごいあほな質問だけど、Atiってスケジュラーなしでどうやって制御するの?

Nvidia Cudaばかり使ってるとなんだか感覚かずれる。

631 :デフォルトの名無しさん:2009/10/01(木) 22:55:17
CPUとしてみるとVLIWは微妙だけど、アクセラレータとしては決して悪くはないだろ

632 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/01(木) 23:05:25
>>630
Radeonは複数命令列をインターリーブして流し込む単純な機構しか備えてない。
CellのPPEやAtomがやってるFGMT、あれだ。
Efficeonは自分自身で中間コード(x86コード)をネイティブコードにコンパイルできたが。

動的スケジューリングの代わりになる機能があるとすれば、それはCPUでVLIWを動的に生成するだけにすぎない。
もちろんEfficeonやJavaみたいなフィードバックコンパイルは出来ない。

じゃあLarrabeeは動的スケジューリングができるのかっていうと、もちろんソフト的にやる。
x86を使ってね。
いや、もちろんGPUとは意味が違う。Larrabeeそのものがx86プロセッサだから
自分自身でダイナミックコンパイラ・VMを動かすことができる。

633 :デフォルトの名無しさん:2009/10/01(木) 23:18:00
LarrabeeもGT300もいつでるんだよ・・・
もう煽るの飽きてきたよ・・・

634 :デフォルトの名無しさん:2009/10/01(木) 23:21:16
Geforce 4.8TF
Larrabee 6.2TF



635 :デフォルトの名無しさん:2009/10/01(木) 23:24:38
多くのアプリけしょんで問題になる
デバイスメモリと共有メモリ間の転送や
カーネルの立ち上げ(全体の同期)とかは
この新しいアーキテクチャで問題が解決されるの?

636 :,,・´∀`・,,)っ-○○○:2009/10/01(木) 23:58:52
>>663
力抜けよ

ディスクリート版が何時でようが3〜4年後にはHaswellの1構成要素だ。
GMAが売れる分だけは売れる。
シェアを狙うのに性能で勝負する必要なんて最初からないのさ。
MMXやSSEが普及したのと同様の原理で、LarrabeeのISAは浸透していく。

逆にx86を持たないがゆえに性能でしか勝負できないNVIDIAは必死だけどさ。
Larrabee側はGPUらしい固定機能ハードは積んでないからゲーム用に別のディスクリートGPU積んで
Larrabeeは物理演算プロセッサとして使ってもいいんだぜ。
そしたら共存できるじゃん。
でも、なんだかんだで「Celeronにも載ってるハードウェア」となれば費用対効果は最強だから
ゲームGPUとしてのニーズすらソフト開発者がこぞって流れる可能性はあるがな。


637 :デフォルトの名無しさん:2009/10/02(金) 01:20:05
一ヶ月ほど前に東工大のTSUBAME2.0が単精度6PFLOPS倍精度3PFLOPS目指すけどGPUを使うって言ってたのはちゃんと宛てがあったんだな

638 :デフォルトの名無しさん:2009/10/02(金) 01:41:08
東工大の学食は安くて旨かったなあ

639 :デフォルトの名無しさん:2009/10/02(金) 01:50:35
つーかベンチ以外に使ってやれよ

640 :デフォルトの名無しさん:2009/10/02(金) 02:04:35
>>636
2世代ほど交代したらIntel CPUにLarrabeeが統合されるから最強だよな >シェア的に
Larrabee自体がSSEに変わる命令セットの実装例だから統合するのは予定路線。

641 :デフォルトの名無しさん:2009/10/02(金) 02:55:37
>>637
東工大はGT200でワットパフォーマンスの検証してたけど
Gt300はそれを超えてくるからな

642 :デフォルトの名無しさん:2009/10/02(金) 03:29:18
実世界で本当にCUDAコンピューティングの時代が幕を開けそうだな

643 :デフォルトの名無しさん:2009/10/02(金) 04:57:34
なんか賞取ったらしい
GPU Technology Conference Blog - NVIDIA
ttp://blogs.nvidia.com/gtc/2009/10/ladies-and-gentlemen-we-have-a-winner.html
Foota WWW Service
ttp://www.futatsugi.net/


644 :デフォルトの名無しさん:2009/10/02(金) 05:45:54
GT300Fermi
http://www.4gamer.net/games/099/G009929/20090930012/
http://pc.watch.impress.co.jp/docs/column/kaigai/20091001_318463.html

645 :デフォルトの名無しさん:2009/10/02(金) 06:06:08
http://nukkorosu.80code.com/img/nukkorosu11421.jpg

646 :デフォルトの名無しさん:2009/10/02(金) 06:46:25
なにげにintのパフォーマンスに興味津々

647 :デフォルトの名無しさん:2009/10/02(金) 06:49:44
ttp://www.youtube.com/watch?v=r17UOMZJbGs
Next Generation GPU Fluids

648 :デフォルトの名無しさん:2009/10/02(金) 15:47:14
http://pc.watch.impress.co.jp/docs/news/event/20091001_318660.html
 気になるスケジュールだが、現在はシリコンがあがってきた段階で、通常、このままのペースで進めば数カ月のうちに市場に登場するHang氏は語っている。
まずはTesla製品がリリースされ、その後にGeForceやQuadroといったグラフィックス製品が登場する見込みだ。

現在はシリコンがあがってきた段階
現在はシリコンがあがってきた段階
現在はシリコンがあがってきた段階

wwwwwwwwwwww

649 :デフォルトの名無しさん:2009/10/02(金) 15:54:23
Nvidia fakes Fermi boards at GPU Technology Conference
http://www.semiaccurate.com./2009/10/01/nvidia-fakes-fermi-boards-gtc/
The board has wood screws crudely driven through it. The vents on the end plate are blocked.
The DVI connector is not soldered to anything, The SLI connectors are somewhat covered by a heat shield.
The 8-pin power connector is connected to nothing. The 6-pin connector is connected to the PCB with glue, not pins and solder.
The board is crudely chopped off with power tools. The 8-pin connector that should be there is not.
The 6-pin connector that should be there is cut. The mounting holes are too close to the edge.
There are also likely many more flaws, but this should be enough to prove a point.

In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.
If you watch the video here, he says, "This puppy here, is Fermi". Bullshit.




In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.
In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.
In the end, what you have here is a faked Fermi board. Jen-Hsun held up a scam card.

wwwwwwwwwwww

650 :デフォルトの名無しさん:2009/10/02(金) 17:15:14
必死の活動ごくろうさん
でも、出るのがたとえ1年遅れても
ATIが追いつくには4-5年掛かりますから

それだけ差のある構造なんだよ

演算に関しちゃATIは、何処からも全く期待されていないし

651 :デフォルトの名無しさん:2009/10/02(金) 17:20:09
ま、パクればすぐか
得意のw

652 :デフォルトの名無しさん:2009/10/02(金) 17:45:27
板はそれを通して木ネジを生のままで動かさせます。 エンドプレートの上の通気は妨げられます。
DVIコネクタは何にもはんだ付けされないで、SLIコネクタは熱シールドでいくらか覆われています。
8ピンのパワーコネクタは何にも接続されません。 6ピンのコネクタはピンとはんだではなく、接着剤でPCBに接続されます。
板は電動工具で生のままで切り離されます。 そこにあるはずである8ピンのコネクタは、そうではありません。
そこにあるはずである6ピンのコネクタは、切られます。 取付け穴があまりに縁の近くにあります。
おそらくもずっと多くの欠点がありますが、これは、主張の正しいことを示すために十分であるべきです。
結局、あなたがここに持っているものは、見せかけられたフェルミ委員会です。 ジェン-Hsunは詐欺のカードを上げました。
あなたがここでビデオを監視するなら、「ここのこの子犬はフェルミです。」と、彼は言います。 ナンセンス。

653 :デフォルトの名無しさん:2009/10/02(金) 17:48:19
せめて機械翻訳を参考に意訳する位の事はしたら?

654 :デフォルトの名無しさん:2009/10/02(金) 17:57:27
そんなことできるのはエスパーくらいだろw

655 :デフォルトの名無しさん:2009/10/02(金) 18:10:30
ぱくったところでAMDに開発環境やサポートの期待なんて出来るわけもない

656 :デフォルトの名無しさん:2009/10/02(金) 18:38:49
fermi自体は粒度大きくして実効効率落としているだろ。


657 :デフォルトの名無しさん:2009/10/02(金) 18:44:39


658 :デフォルトの名無しさん:2009/10/02(金) 19:00:28
理論ベクタ長を変えずに物理ベクタを増やしたら
演算に要するサイクルは?

659 :デフォルトの名無しさん:2009/10/02(金) 19:25:30
Warp内で32のままなら32CudaCoreで処理するには1cycleってことか
分岐粒度は変わらないが、サイクルは縮むわけだ

Intel larrabeeが理論16の物理16で1cycle

ATI r600-rv870が理論64の物理16で4cycle

660 :デフォルトの名無しさん:2009/10/02(金) 19:42:56
L1増量でサイクル稼がなくても良くなったのか?
あ、リードオンリーじゃなくなったんだっけか

CPU-GPU間転送もバックグラウンドで可能とか

661 :デフォルトの名無しさん:2009/10/02(金) 19:58:58
カーネルプログラムのマルチスレッドも可能

662 :デフォルトの名無しさん:2009/10/02(金) 20:10:48
偽物ボードワロタwww

663 :デフォルトの名無しさん:2009/10/02(金) 20:23:04
スクラッチパッドでなくてマジでキャッシュなんか?
だとしたら、ずいぶん無駄なことをしてるように思うが。

664 :デフォルトの名無しさん:2009/10/02(金) 20:31:53
どっちでも処理内容次第で無駄はでるんじゃない。
システム、というか、デバイスの外から見た平均的な
スループットが重要なわけで、限定条件下での処理速度はどうでもいい。

665 :デフォルトの名無しさん:2009/10/02(金) 20:37:46
つまりATIは問題外

666 :デフォルトの名無しさん:2009/10/02(金) 20:38:29
64kb Configurable L1

667 :デフォルトの名無しさん:2009/10/02(金) 20:40:33
4cycleで走るスレッド数

gt200 : 30
cypress : 20
fermi : 64

668 :デフォルトの名無しさん:2009/10/02(金) 20:56:03
そういやGT200やFermiが600MHz台で4800や5800が1GHzに達せんばかりのクロックである事を考えると、
Pen4とCoreの対比とダブるな。
AMDはこれから苦しくなる?

669 :デフォルトの名無しさん:2009/10/02(金) 21:00:08
Geforceはシェーダーが1GHzオーバーで動いてるだろ
まあそこは先進的で、ポジティブな部分だが

670 :デフォルトの名無しさん:2009/10/02(金) 21:13:25
int,fp並列可能なfermiは命令数でもcypressを上回るな(4cycle)
cypress : 20*5=100
fermi : 16*2*4=128

あと、実際には演算パートのクロックは2倍程度違うしな

671 :デフォルトの名無しさん:2009/10/02(金) 21:45:46
ATI換算だとGT300は6.1TFだってな


672 :デフォルトの名無しさん:2009/10/03(土) 11:37:58
>>668
糞ビスタのせいで買い控えされてたPCが
7の発売と同時に更新される。
超性能ではなくとも、年末に製品をそろえたラデが一人勝ちする。
その後はまた買い控えが始まるので、そのころ出すゲフォは苦しくなる。
収入がなくなれば開発は進まなくなる。

年がら年中苦しいAMDは変わらず。

673 :デフォルトの名無しさん:2009/10/03(土) 11:58:13
>>671
どうやって計算したらそうなるの?
SFUの演算を20倍するとか?

674 :デフォルトの名無しさん:2009/10/03(土) 16:22:11
>>672
TSUBAME2.0とかの大量納入の話が無かったらnVidia積んでたよな

675 :デフォルトの名無しさん:2009/10/03(土) 16:53:36
将来的に一番苦しいのはNVIDIAだろう
インテルのララビーとAMDのラデに挟撃され、
さらに、将来はCPUにGPUコアが取り込まれる予定
インテルはチップの動作デモを行った
GPUなんてGeForce9600あたりで、ほとんどのゲームが出来るんだし
ミドルレンジ以下のGPUは売れなくなる可能性だってある
HPC分野で見ても、ララビーやセルに勝てるのか微妙だし

676 :デフォルトの名無しさん:2009/10/03(土) 17:15:37
一番どうでもいいのはAMDだからw
CPUもGPUも取りえが無い

677 :デフォルトの名無しさん:2009/10/03(土) 17:32:27
正直RV870を見て、AMDへの興味はゼロになりました。

678 :デフォルトの名無しさん:2009/10/03(土) 18:08:32
おなじく

679 :デフォルトの名無しさん:2009/10/03(土) 18:17:17
>>677
RV870のおかげで
GT300は250ドル以下だぞ



680 :デフォルトの名無しさん:2009/10/03(土) 18:18:35
なんで潰れる潰れないの話になるんだろ。
投資家の方ですか?

681 :デフォルトの名無しさん:2009/10/03(土) 18:27:14
>>679
無理
あんなものじゃ到底無理

682 :デフォルトの名無しさん:2009/10/03(土) 19:07:11
>>679をCPUで置き換えてみよう
Phenomのおかげで
Corei7は250ドル以下だぞ

683 :デフォルトの名無しさん:2009/10/03(土) 19:36:02
あほかGT300を$250っていくらなんでも貧民向けに出すからといってそんな値段でだすと倒産するわ
ベンチとってEvergreenや自社旧製品と比べてあとは歩留まりやダイサイズを加味した値段でおそらくごく少数が出回るだけだろうね
すごいすごいと言われても結局はミドル以下に弾を出せないと意味ないけどね

684 :デフォルトの名無しさん:2009/10/03(土) 19:37:44
Intel上級研究員「AMDにつぶれてもらっては(司法省との絡みで)困る」

685 :デフォルトの名無しさん:2009/10/03(土) 19:40:14
なんか必死すぎてウザイ

686 :デフォルトの名無しさん:2009/10/03(土) 21:28:07
AMDはインテルを超えるマルチコア技術を持っているし、先行きは暗くない
対してNVIDIAは将来売る製品がない
どっちがやばいのかは明白

大体、GT300発売は来年夏ぐらいだろ
そのころにはAMDのラデオンの新作がハイエンドからミドルレンジ、ローレンジまで
展開しているし、ララビーも製品化されている可能性もある

さらに後1年以内には、AMDもインテルもGPUをCPU内部に統合した製品を出すだろう
一般人どころか平均的な性能で満足する大部分のゲーマーだって、性能的にはこれで十分なんだよね

NVIDIAはもう終わりだよ

687 :デフォルトの名無しさん:2009/10/03(土) 21:29:52
自作板でやってもらえませんか

688 :デフォルトの名無しさん:2009/10/03(土) 21:31:55
>AMDはインテルを超えるマルチコア技術を持っているし

>AMDはインテルを超えるマルチコア技術を持っているし

>AMDはインテルを超えるマルチコア技術を持っているし

増量ですねw

689 :デフォルトの名無しさん:2009/10/03(土) 21:38:04
NVIDIAが唯一先行しているのがGPGPU
しかし、GPGPU分野もインテルのララビーから激しく追い上げられるし
対して金になる分野にも思えない
消費電力だってCellに完敗
GPGPU向けに無駄な改良をしてしまったためにGPUとしても不恰好で
AMDの製品群に追い詰められつつあるNVIDIA

もう完全につんでいます

690 :デフォルトの名無しさん:2009/10/03(土) 21:41:42
>>689
GPGPUの成長予測だとあと5年もすれば
10億ドル市場になるっていわれているけどね

691 :デフォルトの名無しさん:2009/10/03(土) 21:45:15
5年後の市場がそうでも、そこへの投資が早すぎてGPU市場がおざなりになったらVoodooの二の舞になるぞ
IT産業で5年ってシェアがひっくり返るには十分過ぎる時間だからな

692 :デフォルトの名無しさん:2009/10/03(土) 21:46:05
>>690
CPUにGPUコアが封入された時点でゲームセット
わざわざグラフィックのために何万円も出してGPUを買う時代が終焉する

ゲーマーだって、大部分はミドルレンジクラスのGPUでゲームをやってるんだよ?
実際には、GPUに金なんてかけなくないの
安くてゲームがそれなりの性能で切るんならそれで我慢する

だいたいGPGPU分野ではキラーアプリが存在しない
だれがGPGPU向けの製品を買うの?

693 :デフォルトの名無しさん:2009/10/03(土) 21:46:57
GPGPUのキラーアプリはソフトウェアレンダラー

694 :デフォルトの名無しさん:2009/10/03(土) 21:49:12
何か的外れなこと言ってる奴がいるね
ララビーはいまだ実用化にいたらず苦戦中でしょ
GPUとしての性能がGeforceやRadeonには勝てず、
将来的にも当分は勝負にならない
Cellなんか個人のPC用途では、土俵が違うし

695 :デフォルトの名無しさん:2009/10/03(土) 21:59:21
>>694
ララビーは既にサンプルが主要メーカに配られてる
製品化は近いと考えられる
性能はトップの製品に劣るとみられているけど、メインストリームでは
NVIDIAやAMDの脅威になりうるし、ここを奪われたら致命傷になる

Cellは個人用PCでは使われないが、現状ではGPGPUだってそれは同じこと

696 :,,・´∀`・,,)っ-○○○:2009/10/03(土) 22:00:46
「GP」GPUのスレで的外れなことを言ってるね

697 :,,・´∀`・,,)っ-○○○:2009/10/03(土) 22:02:06
おっと
>>694

698 :デフォルトの名無しさん:2009/10/03(土) 22:04:03
>>694
実機デモやったばかりだろ…

699 :デフォルトの名無しさん:2009/10/03(土) 22:04:30
でかくて消費電力も馬鹿食い、それでいて性能も微妙に劣る
それがララビー

700 :デフォルトの名無しさん:2009/10/03(土) 22:06:57
何か勘違いしているようだけどAMDなんか元々注目されていないから
むしろRV870とGT300の発表を以って終了致しましただから
Larrabeeが争ってるのはGT300だから
現実と妄想の壁は厚いのよ

701 :デフォルトの名無しさん:2009/10/03(土) 22:08:57
今日もハリボテ信者が発狂してるなwwww

702 :デフォルトの名無しさん:2009/10/03(土) 22:11:26
勝負とか言ってるけどGT300じゃLarrabeeに勝てないよ

703 :デフォルトの名無しさん:2009/10/03(土) 22:16:21
Larrabeeは2012年に
今のノート用のCorei7をシュリンクしたものを最低64個
搭載するけどね

普通に特定用途なら16TFぐらい余裕

704 :デフォルトの名無しさん:2009/10/03(土) 22:19:45
じゃあ2012年になったらLarrabeeがどうとか言い出せよw

705 :デフォルトの名無しさん:2009/10/03(土) 22:26:08
NVIDIAがかわいそう過ぎる
GPGPUを意識しすぎてGTX300なんて作ろうとしちゃってさ
得意のグラフィック用のGPUを作っていれば、滅びることのなかったのに

GTX300が出る来年夏ごろまでには、グラフィックス市場はAMDが制しているだろうね

NVIDIAはハイエンド専業メーカとして生き残るしか道はないのかな
売り上げは今の10分の1ぐらいになるだろうけど

706 :デフォルトの名無しさん:2009/10/03(土) 22:28:12
おまいらいいかげん自作板カエレ
人に迷惑掛けるなと幼稚園でおそわっただろ?

707 :デフォルトの名無しさん:2009/10/03(土) 22:32:07
ClearSpeedの呪い

708 :デフォルトの名無しさん:2009/10/03(土) 22:36:25
ATiの戦略って、
そこそこのコアをマルチチップ構成にして
ミドルからハイエンドをサポートするって感じかな?
個人的には悪くないと思うなぁ。
つーか、GPUにC++サポートとかそういうリッチな機能必要?
FORTRANやHLSL程度が走ればいいんじゃないの?

709 :,,・´∀`・,,)っ-○○○:2009/10/03(土) 22:37:24
オンボードのシェアばかり拡大していくのが市場の宿命です。
いつまでもゲームはディスクリートGPUの需要を引っ張らない。

ゲームってさ、ハイエンド前提で作るんじゃなくて、普及価格帯のGPUを
Larrabeeはディスクリート版だけではなく、GMA後継としてPC用GPUとして
最底辺の性能をもって、かつCeleron, Pentium DCのチップの隣に混載という
無敵の最高普及レンジに君臨するわけよ。

どうなるかわかるだろ?
PCゲームソフトメーカーは自分たちのタイトルのグラフィックパフォーマンスの
最低性能の底上げとして、いやでもLarrabeeに特化した最適化をやらざるを得なくなるわけ。
いやでも使いこなせるようになるわけ。
GPUとしての性能が低いってのも有る意味確信犯だよ。

GMAを抜いたPCゲーム市場なんて縮小するばかりでジリ貧でしかないからな。
GPUがでかくなってもソフトメーカーは儲からない。

だからこそNVIDIAはDirectXの最新API対応なんぞに見切りをつけ
ごく小数の商用ソフトメーカーに支援をして架空のGPGPUブームをでっちあげ、
ニーズを補填しようとしてるわけ。
ただゲームソフト市場が今後使えない市場という認識だけはあるらしいが
もう尻に火が付いてるから動かざるを得ない。
NVIDIAですらGPGPUをやるのに前向きな理由なんてないんだよ。

しかしまあそのGPGPUという市場すら、CPU側のSIMD性能が向上して
GPGPUでやるのが馬鹿馬鹿しいって雰囲気になったら終息に向かう。
もしSandy Bridgeで1コアあたりのSIMD性能が3倍程度になるなら、
GPGPUでの相対的な性能向上効果は1/3になるってことだからな。

710 :デフォルトの名無しさん:2009/10/03(土) 22:40:07
行くも地獄、戻るも地獄のNvidia…

711 :デフォルトの名無しさん:2009/10/03(土) 22:43:38
3dfxの呪い Voodooの呪い

712 :デフォルトの名無しさん:2009/10/03(土) 22:48:55
GPUって
FPSでHeadShotして「ィヤッホウ!」言ってる層しか買わないもんだと思ってました

713 :デフォルトの名無しさん:2009/10/03(土) 22:49:06
アホか
今のゲーム業界はIntel GMAなんてまるで無視してるじゃん

714 :,,・´∀`・,,)っ-○○○:2009/10/03(土) 22:51:28
もう既にGMAでも動くライトなゲームのほうがマーケット大きいけど?

715 :デフォルトの名無しさん:2009/10/03(土) 22:52:40
LarrabeeがGMAの後継か、インテルの貪欲さがよくわかるね

716 :デフォルトの名無しさん:2009/10/03(土) 22:59:07
くやしかったの?

717 :,,・´∀`・,,)っ-○○○:2009/10/03(土) 23:00:17
自分自身が既にPC用GPUの50パーセントのシェア持ってるんだ。
そりゃ置き換えるだろう。

NVIDIAはNVIDIAで
まだエンドユーザーはDX9で遊んでるのに、
DX11とか立ち上げるのはゲームソフトメーカーいじめだ
とかわけのわからないことを言ってるし

718 :デフォルトの名無しさん:2009/10/03(土) 23:02:34
>>714
なにそれ?
具体的なゲームの名前挙げてみてよ
聞いたことないんだけど
Geforceの〜〜以上とかそういうのが時期を経て
GMAでも動かせるようになってきただけだd路

719 :デフォルトの名無しさん:2009/10/03(土) 23:04:58
>>717
Nvidiaにとって
DX11はチューニング難しいからな
かなり苦慮してるし

720 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/03(土) 23:07:47
続々生まれてる韓流(笑)基本無料オンラインゲームは昔からGMA程度で動くが。


721 :デフォルトの名無しさん:2009/10/03(土) 23:08:22
>>715
それ、失敗の呪文にしか聞こえないんだがw

722 :デフォルトの名無しさん:2009/10/03(土) 23:11:32
>>720
有名どころのリネージュ2とかThe Tower of AIONとかは
GeforceやRadeonでしか動かなかったけど

723 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/03(土) 23:11:32
http://www.4gamer.net/games/036/G003691/20090227016/

ディスクリートGPUを買ってやるゲームが成長性のある市場だなんて
誰も思ってないよ。

724 :デフォルトの名無しさん:2009/10/03(土) 23:15:18
そもそもM$様も@pple様もIntel様も
AMDの糞野郎ですら

ゲーム市場は毎年200億円ずつ市場規模が縮小していって
価値のない分野として見捨てはじめてるんだよ


725 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/03(土) 23:18:05
リネージュ2あたりはNVIDIAが支援したタイトルの典型なんですが
NVIDIAはCUDAに肩入れした分ゲームソフト向けの支援は渋ってるから
今後そういうタイトルは減るばかりだよ。


まあこの辺見ろよ。GMAでも動くクラスのゲームは成長してる。
http://eir.eol.co.jp/EIR/View.aspx?template=ir_material&sid=2451&code=3812

726 :デフォルトの名無しさん:2009/10/03(土) 23:18:28
売り上げの3分の1を占めるチップセット市場で、インテルとAMDに締め出しを暮らし
死亡が確定

GPU自体もハイエンドの一部ユーザーにしか見向きがされなくなりつつあり

GPGPUもCPUのマルチコア化、SIMD命令の強化で微妙になりつつある

NVIDIAはこれから先どうするんだろうね

727 :デフォルトの名無しさん:2009/10/03(土) 23:28:12
お前ら至急葬儀会場にお戻りやがれw

728 :デフォルトの名無しさん:2009/10/03(土) 23:29:18
ゲロビディアはチップセット事業の
撤退で来年以降200億円近く損失が発生する

GPUでどうにかして補填しないと後が無い状況になる
資金調達やばいし

729 :デフォルトの名無しさん:2009/10/03(土) 23:30:04
つまりSandyやFusionが今後のトレンドになるのは確定的に明らか

730 :デフォルトの名無しさん:2009/10/03(土) 23:39:55
AMDちゃんとFusionsしたい

731 :デフォルトの名無しさん:2009/10/03(土) 23:45:28
来年の事を云うと鬼が笑う、ってな。
とりあえずGPGPUスレの人間としては、現状ではまだ市場に存在しないLarrabeeや動く実装を提供しないAMDではなく
NVIDIAを使うしかない。
メーカーの先行き予測論争なら板違いだから、まとめて自作PC板にでも行ってくれ。

732 :デフォルトの名無しさん:2009/10/03(土) 23:50:30
>>731
>来年の事を云うと鬼が笑う、ってな。
まぁそれはいいけどwGPGPUで資金調達失敗しているという
事実はどうするんですかね?評価下がるかもって予測あるし

動くものだけを追いかけていると、良い成果は得られないよ



733 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/03(土) 23:52:32
まあ潰しのきかない技術に見切りつけたいって人はいるんじゃないかと。
鳴る物いりで登場したCellのスレは今お葬式モードだし。
あそこの英語プログラミングマニュアルが出たときの盛況っぷり知ってるからな

俺は現世代飽きてSandy Bridgeのシミュレータで遊んでるような人種だからな

734 :デフォルトの名無しさん:2009/10/03(土) 23:54:18
>>733
おもしろそーだな
俺もまぜてくれよ

735 :デフォルトの名無しさん:2009/10/03(土) 23:56:30
良い成果とはこのスレに転がってるどうでもいい御託のことか?

736 :デフォルトの名無しさん:2009/10/03(土) 23:58:16
>>755
まさかCorei7のシングルスレッドとCUDAを比較し、CUDAが有利と
頭に蛆がわいてるレベルの論文の方が有用だと言いたいのか?

737 :デフォルトの名無しさん:2009/10/04(日) 00:08:43
さあ、>>755に期待がかかります。

738 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 00:09:59
>>736
多くの大学の研究室は貧乏なんだぜ
NVIDIAはGPGPUの宣伝のためなら端金に糸目は付けない
Intelは黙ってても売れる製品の販促なんてやらないが

739 :デフォルトの名無しさん:2009/10/04(日) 00:49:40
>>731
Brook+とCALは実装あるだろ

740 :デフォルトの名無しさん:2009/10/04(日) 01:38:57
GPGPU自体の将来性も怪しいけどな
CPUがメニーコア化したらすぐに終わるんだが
ソフトウェアの対応がないから、一般向けでは
最大で4コア以上は、提供しなさそうな感じだし
HPC研究者的には、なんとも先の読めない面倒な状況だよね

741 :デフォルトの名無しさん:2009/10/04(日) 01:45:35
目にーコアかしてもCPUじゃぱふぃーが悪いかん。
今現在でも4コアいじょいら年じゃね除隊

742 :デフォルトの名無しさん:2009/10/04(日) 01:50:34
>>741
後藤さんのインテル技術者へのインタビューでも4コア以上は提供しないっぽいことを
インテルの技術者がいってるしね
代わりに、GPUコアの搭載とチップ面積の小型化を選択したようだ

743 :デフォルトの名無しさん:2009/10/04(日) 02:13:30
GPU Technology Conferenceに行ってきたが、かなりひどかったね。
CPUとの比較はほどんどが、シングルコア。かたやTeslaときたもんだ。
NVIDIAもこんな発表させるなよと思うが、そういう発表も無いよりましだから仕方が無いか。
まあ多くのケースでTeslaの方が速いのだが、マルチコアとだとインパクトが下がるしなあ。でもCPU使うならせめてOpenMPくらいは使えよと思う。

744 :デフォルトの名無しさん:2009/10/04(日) 03:12:54
>>731
来年のこととはGT300のことですねwww

745 :デフォルトの名無しさん:2009/10/04(日) 03:29:49
>>731
現状ではNVIDIAのCUDAを使うのがベストなのは分かるが
性能を出すための勉強を今してもGT300が出ると無駄になる
かもしれないと考えると、やる気がなくなるよな

並列アルゴリズムの勉強を一生懸命したほうがよさそうだ

746 :デフォルトの名無しさん:2009/10/04(日) 03:54:26
現在、Larrabeeに備えて何を勉強しておけばいいの?

747 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 04:00:15
Larrabeeを汎用演算に使うって要するにx86ベースのCPUをそのまんまCPUとして使うってことだからな

【組み込み関数派】
*mmintrin.hで書いたSSEプログラムをLarrabee Prototype Libraryに移植

【高級言語派】
Ctを予習しておく

【OpenCL派】
とりあえずCUDAでもなんでも使っとけ

【アセンブラ派】
だんご食べる?




生産性とパフォーマンスのバランス的に美味しいのはCtじゃないかと思う。

748 :デフォルトの名無しさん:2009/10/04(日) 04:50:37
Ctはインテル特化の技術
つぶしを効かしたいならOpenCL

749 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 05:38:43
CtはLarrabeeに限らずx86 CPU用のSIMD/マルチコアを包括するフレームワークだ。
SSEからAVX, Larrabeeおよび今後のIntel SIMD拡張命令及びマルチコアに対応するコードを透過的に記述出来る。
Cコンテナに対する演算の記法がC++のテンプレートそのものなのである意味で再利用性はある。

かたやOpenCLは事実上のGPU専用言語。
普通のCPUでも動くコードが書けるってのはメリットに見せかけて、再帰すら書けなかったり、
Cと比べて制約が多い。
CPUでだけ使う場合に既製のコードをOpenCLに移植するメリットが基本的に無い。

潰しがきくのはどっちかは明らかだと思うが。

750 :デフォルトの名無しさん:2009/10/04(日) 07:52:55
NV自体CPUとの連携が重要と言っているのに
CPUどうするのかというプランが具体的に明らかに
されていない点が一番危ないな。
結局CPU内蔵する方向に行くしかないのに。
ARMでいくのかね。

751 :デフォルトの名無しさん:2009/10/04(日) 08:08:01
CADソフトやBlenderなどはGeforceじゃなきゃ話にならんよ
一部のゲームもな
結局互換性で勝つ

752 :デフォルトの名無しさん:2009/10/04(日) 08:54:47
>>749
CUDAとかでCPUコードを書くのはデバッグのためでしょ。
>CPUでだけ使う場合に既製のコードをOpenCLに移植するメリットが基本的に無い。
何を自明なことを

753 :デフォルトの名無しさん:2009/10/04(日) 09:32:45
>OpenCLは帰起さえ書けない

じゃ団子が帰起を使えるようにいろいろ改良したOpenCL+を作れば良いんだ

754 :デフォルトの名無しさん:2009/10/04(日) 09:34:30

× 帰起
○ 再帰

755 :デフォルトの名無しさん:2009/10/04(日) 10:06:24
OpenCLで再起実装できないでしょ
Applesも現時点のいずれのアーキテクチャ
でも不可能だって諦めてるし

756 :デフォルトの名無しさん:2009/10/04(日) 10:06:29
と言うかopenCLを走らせるようなマシンで再帰使うのって効率的にどうよ?
そもそもGPUでまともに再帰使えるんか?

757 :デフォルトの名無しさん:2009/10/04(日) 10:08:30
>>733
> 鳴る物いりで登場したCellのスレは今お葬式モードだし。
Cellスレどこよ?見つからないんだが。

758 :デフォルトの名無しさん:2009/10/04(日) 10:14:03
CELL
http://pc12.2ch.net/test/read.cgi/tech/1249915266/
なんでみつからないのかがわからない

759 :デフォルトの名無しさん:2009/10/04(日) 10:41:28
OpenCL自体が劣化CUDAだろ

760 :デフォルトの名無しさん:2009/10/04(日) 11:06:10
CUDAはNV製品に特化して作られた言語
OpenCLはそれをベースに、汎用的にどのGPUでもそれなりに動いてくれるように作られた言語
そりゃ、後者が機能で前者に劣るのは当然

761 :デフォルトの名無しさん:2009/10/04(日) 11:18:55
性能出るようにOpenCLを作り直せばいいじゃん

762 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 11:33:50
>>756
無理

ワープ単位で命令ポインタが同じ方向にしか動かせないから
似非スカラを辞めない限り無理
言語レベルで分岐があればネイティブコードレベルではプレディケートで両方のパスを実行

とろくさいこと山の如し

LarrabeeはベクトルをC++的なあのベクトルとして扱ってるからいざとなればスカラに落とし込むことで
再帰を表現可能。
もちろんその時同じハードウェアスレッド内の要素は並列処理じゃなくて逐次処理になる。

extactps rcx, xmm0, 0
call procN
extactps rcx, xmm0, 1
call procN
extactps rcx, xmm0, 2
call procN
extactps rcx, xmm0, 3
call procN


763 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 11:34:55
↑はSSEの4並列処理の場合
スカラに落とし込むときのイメージとしてはこんな感じね

764 :デフォルトの名無しさん:2009/10/04(日) 11:39:32
末尾再帰をループにするくらいじゃね。
文法上再帰を許しても、ループに出来ない場合
コンパイル時にエラーが出るとか。

765 :デフォルトの名無しさん:2009/10/04(日) 11:47:45
RadeonはR600以降で32段までの関数呼び出しが可能

766 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 11:48:02
ループの場合って、ハード的にはそれぞれ終端に達した要素からプレディケートレジスタのビットを落としていって
最終的に0になったときに全部一緒に抜けるんだよな

767 :デフォルトの名無しさん:2009/10/04(日) 18:17:12
Larrabeeなんて2年以上選択肢からは外れるのは確定的なんだから
今Larrabeeの話しなんかしててもしょうがない
現状ではnVidia一択
今後AMDやIntelが良くなればそのときに買い換えればよい
グラボなんて別に高くないし、取り替えられるのだから

768 :デフォルトの名無しさん:2009/10/04(日) 18:19:56
いいね
金持ちは

769 :デフォルトの名無しさん:2009/10/04(日) 18:40:28
>>767
Larrabeeはハードを140ドル未満で投入してくるぞ


770 :デフォルトの名無しさん:2009/10/04(日) 18:48:53
>>768
じゃあ、貧乏人だったらLarrabeeを今買うか?
そんなの不可能だろう?
貧乏人であってもLarrabeeなんて不毛な話だよ

771 :デフォルトの名無しさん:2009/10/04(日) 18:50:03
>>769
いやだからそれは2年後に考えればいいということだろ。

将来性とか考えずに今現在の時点で費用対効果を考えればnVidia一択であると>>767は言ってるんだから。

772 :デフォルトの名無しさん:2009/10/04(日) 19:04:07
>>771
>>769の主張だと足並み揃う2年後でよくねって思うけど
NVidiaがドカタ言語に仕上げてくれるなら今から取り組む価値はあるけど

だんごと一緒にLarrabeeのシミュレータで遊んでいたほうが
有意義だと思う



773 :デフォルトの名無しさん:2009/10/04(日) 19:06:54
larrabeeがIGPに組まれれば
他社製品は意味をなくす

774 :デフォルトの名無しさん:2009/10/04(日) 19:14:07
larrabeeなんて今の段階では商品になるかどうかすら危うい
シミュレータで遊ぶにしても2年は長い

775 :デフォルトの名無しさん:2009/10/04(日) 19:20:46
NVidiaしか選択肢がないと言ってる人間多いけど
実際GT300って今年中に出るの?

776 :デフォルトの名無しさん:2009/10/04(日) 19:36:36
>>775
多分来年の春ごろ
夏ごろになる可能性もある
それまではAMDがグラボ市場の覇者

そして、再来年の春にはGPU搭載CPUが発売され
ゲーマーがGPUを購入する時代が終焉する

今のGPUはGPGPU用のアクセラレーターとしての価値しかなくなる

ちなみに、NVは売り上げの3分の1を占めるチップセット市場からも
撤退を余儀なくされている

数年以内にNVはまともの売れる製品がなくなる
さよなら、NV

      ,,,
( ゚д゚)つ┃

777 :デフォルトの名無しさん:2009/10/04(日) 19:45:15
鬱陶しいから帰れ

778 :デフォルトの名無しさん:2009/10/04(日) 19:49:40
どうせintelが残るだけ

779 :デフォルトの名無しさん:2009/10/04(日) 20:10:25
今は性能でAMDが優位といってもGPGPUに限れば開発環境などの関係で、
実質的にnVidiaしか選択肢ないんだよ
悲しいことに

780 :デフォルトの名無しさん:2009/10/04(日) 20:38:04
性能で優位なんて初耳

781 :デフォルトの名無しさん:2009/10/04(日) 20:40:07
デベロッパーが扱いづらい今のRadeonをCPUに統合しても何もいいことないんじゃない?
平行で新設計のGPUでもつくってんのかね?AMDは

782 :デフォルトの名無しさん:2009/10/04(日) 20:47:27
fusionでcpuと一体化する分、さらに単純なアレイプロセッサ化していくんじゃねぇの?

783 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 21:01:17
半精度・単精度変換命令をCPU側に実装する分GPU側の回路削られそうだな

784 :デフォルトの名無しさん:2009/10/04(日) 21:09:17
そんな回路ゴミみたいなものだろ。
bit切り出しと単純な例外処理だけじゃない。

785 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 21:19:02
そうか。Larrabeeがコア毎に持ってるけどそんな密度じゃないのね。
Intelがやる理由はキャッシュ容量・メインVRAM帯域の節約のためらしいが。


786 :デフォルトの名無しさん:2009/10/04(日) 21:21:52
このスレでさえGPGPUの未来について希望的な観測がないのかよ

787 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 21:24:18
なんせ逆神Fixstars様がついておられるからな



788 :デフォルトの名無しさん:2009/10/04(日) 21:26:28
N社はモックアップをESだと言っちゃう悲惨な状況だからねえ
Larrabeeでさえデモやってるのに

789 :デフォルトの名無しさん:2009/10/04(日) 21:31:01
OpenGLとかDirectXはLarrabeeでも使えるんですか?

790 :デフォルトの名無しさん:2009/10/04(日) 21:35:24
何でも使えるだろソフトなんだから
それこそglideとかHEIDIもやろうと思えば

791 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 21:36:53
LarrabeeにとってはGPUはアプリケーションだからな

PCSX2のGSエミュとかやらせたらフレームレートと再現度両立できそうだって
開発者が言ってたりする

792 :デフォルトの名無しさん:2009/10/04(日) 23:48:14
あれ、だんごって一時期はララビ批判してなかったっけ
しばらくこの板来てなかったから記憶が定かでないが

793 :デフォルトの名無しさん:2009/10/04(日) 23:53:28
>>792
俺が改心させてやった

794 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/04(日) 23:57:13
してねーよ

批判してるのは先見性の無い奴だけ

方向性は正しいだろ
まあAMDがBulldozerをあっさりAVX互換化したくらいだし
FusionがLRBni互換になっても何ら不思議じゃない


795 :デフォルトの名無しさん:2009/10/05(月) 00:11:09
団子は一流のセールスマンになれる
転職をおすすめしとく

796 :デフォルトの名無しさん:2009/10/05(月) 00:12:30
団子って、何歳?
まだ20代だったらお友達になって欲しい。

797 :,,・´∀`・,,)っ-○○○:2009/10/05(月) 00:16:29
俺顧客サポートの仕事やってるけど

798 :デフォルトの名無しさん:2009/10/05(月) 00:17:05
先見性があっても出なかった製品なんぞいくらでもある
SEDとか

799 :デフォルトの名無しさん:2009/10/05(月) 00:19:07
また出会い厨かよ

800 :デフォルトの名無しさん:2009/10/05(月) 00:23:45
>>798
で?

801 :,,・´∀`・,,)っ-○○○:2009/10/05(月) 00:24:36
技術要因だけで市場を制することはできん。

ゲーム業界には、前世代で圧倒的な勝利を飾ったのに後継機種で会社傾けるほどの大赤字
なんて例もあるからね。
ただIntelはマーケティングを含めて隙がなさ過ぎる。

Intelは22nmが順調に微細化できれば2〜4コア+Larrabee 8コアくらいの統合チップ出してくるだろうよ

802 :デフォルトの名無しさん:2009/10/05(月) 00:31:06
MACヲタってどうなったの?

803 :デフォルトの名無しさん:2009/10/05(月) 00:32:09
それなら普通に10〜12コアのCPUを出すほうがよくね?
で、いつものゴミオンボつけて売り出す
情弱向けに誇大広告うてば勝手に売れてく
いつものパターン

804 :デフォルトの名無しさん:2009/10/05(月) 00:32:18
>>802
獲物のアム厨がレッドブックに載ったので名無しに戻ったらしい

805 :デフォルトの名無しさん:2009/10/05(月) 00:37:19
>>804
なんじゃそりゃ。
Cellとともに滅びたのかと思ってた。

806 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/05(月) 00:39:31
>>803
そのゴミオンボの後継がLarrabeeなんだが。
SIMD以外はシンプルにしないと10〜12コアなんて載らないよ。
8コアくらいでも22nmになれば70〜80mm²になる。
これは32nmのSandy Bridgeに載るGPUと同程度。


807 :デフォルトの名無しさん:2009/10/05(月) 03:54:15
オンボ用にカットした物なんて性能低いじゃん
そんなものは今までGPUだった分のトランジスタも活用できる程度でしかない
TSMCも1年遅れ程度になってきたからあまり優位に立てないのもあるが
CPUはもう限界だしそんなに速くなくてもGPU(Larrabee)があるし…とIntel自身が白状している
Larrabeeは全方位アクセラレーターだ

808 :デフォルトの名無しさん:2009/10/05(月) 04:18:11
日本語でおk

809 :デフォルトの名無しさん:2009/10/05(月) 05:28:04
設計良くてもTSMCがどうにかならん事にはなあ。
外注受けてるとこでここより技術が上なのはGFしかないし。

810 :デフォルトの名無しさん:2009/10/05(月) 05:38:04
GFが上とかwww

811 :デフォルトの名無しさん:2009/10/05(月) 21:31:04
SOIにしろ、金だけ払ってIBMに丸投げしてるだけなんだけどな

812 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/05(月) 22:48:51
>>807
その上でだ。
Larrabeeは8コアあればNVIDIA換算で128SPくらいだよな。


813 :デフォルトの名無しさん:2009/10/05(月) 23:26:44
2009年9月18日 (金)
PixeluxとAMD、Digital Molecular Matterエンジン向けのOpenCLアクセラレーションを開発
ttp://khronos.jp/news/2009/09/pixeluxamddigit.html

PixeluxはAMDと共同で、Digital Molecular Matterエンジン向けのOpenCLアクセラレーションを開発しています。
Pixeluxはルーカス・フィルムで特殊効果制作に使用された Digital Molecular Matterエンジンを開発しています。

ってことはクローズに数千ドルの融資を獲得したから
オープンにしてレッドオーシャンで戦う必要はないんだな

814 :デフォルトの名無しさん:2009/10/05(月) 23:34:06
intel Ctのプレゼンで16コアとか25コアが出てくるんですが
あれいつの話になるんですかね?

815 :デフォルトの名無しさん:2009/10/05(月) 23:35:43
出てくるときに32コアといううわさもある

816 :デフォルトの名無しさん:2009/10/05(月) 23:37:05
ドイツでラトナーが32コア2GHzと明かしたな

817 :デフォルトの名無しさん:2009/10/05(月) 23:37:32
>>815
来年ならデモ機レベルで64コア出せるって言ってるよ

818 :デフォルトの名無しさん:2009/10/06(火) 00:06:20
ディスクリートの方はその位で出すでしょ
「GPUとして」GTX280レベルを出すならその位要る

819 :デフォルトの名無しさん:2009/10/06(火) 00:10:04
脳内ソース来ました

820 :デフォルトの名無しさん:2009/10/06(火) 01:28:50
例えNVより効率悪くても、プロセス技術に物言わせて超高回転化でカバー可能だからきついな

821 :デフォルトの名無しさん:2009/10/06(火) 08:08:21
>>820
同意。
俺もCPUの論争で散々言ったが、Intelはプロセス技術にもの言わせてるだけだよな。

団子がPPCのヘタレっぷりとVLIWのItaniumを槍玉に挙げてx86最強とか、
未だにRISCだのCISCだのニュースの記事を鵜呑みにしたような事を言っているのを聞くと、
それは違うんじゃないかと言いたくなる。

822 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/06(火) 08:50:47
PPC G4が【同クロック】のAtomに負けてもそう思うか?

823 :デフォルトの名無しさん:2009/10/06(火) 08:52:39
はいはい負け惜しみ負け惜しみ

824 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/06(火) 09:13:29
少なくともAtomに関してはSoC製造をTSMCに委託できるように契約してるし
キツキツにチューンしてるわけではないようだが。

デコーダ側が2命令/clkなのにLoad + 演算 + Storeを同時発行できるのは
少なくともRISCみたいな2〜4バイト固定のフォーマットじゃ出来ない芸当だ。

あと、Itaniumは例外視すべきじゃないよ。最強のプロセス技術をもってしてアレなんだろ?
逃げるのはただの詭弁でしかない。

825 :デフォルトの名無しさん:2009/10/06(火) 11:33:37
未だにRISC信者いるのがきもい
整数演算性能に関していえばRISC ISAは前世紀に事実上死んでる
当時のSPECint見てみればわかるが、所詮はキャッシュメモリの容量で
性能稼いでただけのハリボテということが露見している

---------------------------------------
Model Name: TDZ300
CPU: 200MHz Pentium Pro Processor
FPU: Integrated
Number of CPU(s): 1
Primary Cache: 8KBI+8KBD / Secondary Cache: 256KB(I+D)

SPECint95 8.04 / SPECint_base95 8.04 ※95年12月登録
http://www.spec.org/cpu95/results/res9512/p040.html

Model Name: RS/6000 43P-140
CPU: 200 MHz PowerPC 604e
FPU: Integrated
Number of CPU(s): 1
Primary Cache: 32KBI+32KBD on chip / Secondary Cache: 1MB(I+D) off chip

SPECint95 7.79 / SPECint_base95 6.99 ※97年4月登録
http://www.spec.org/cpu95/results/res97q2/cpu95-970414-01779.html
----------------------------------------

浮動小数だけはレジスタ本数とオペランド数ないと性能稼げないから
スタック形式のx87は圧倒的に不利だったが(その点でLarrabeeには死角はない)
整数性能に関して言えばIntelの対RISC性能はP5で肉縛しP6で追い越し
NetBurstで大きく引き離した

826 :デフォルトの名無しさん:2009/10/06(火) 11:36:13
肉薄orz

827 :デフォルトの名無しさん:2009/10/06(火) 11:44:30
インテルのはいつも都合いい数値しか出さないからなぁ。
実効性能ではPPCのが上でしょ。

828 :デフォルトの名無しさん:2009/10/06(火) 11:47:05
pu

829 :デフォルトの名無しさん:2009/10/06(火) 12:39:19
ここGPGPUスレだから
Larrabeeすら関係無いIntel賛美は他でやれ

830 :デフォルトの名無しさん:2009/10/06(火) 12:44:57
>>827
中立な数字出したら完全敗北なのが>>825なんだが。
AppleのIntel移行すら未だに認められない糞マカ乙

831 :デフォルトの名無しさん:2009/10/06(火) 12:58:38
RISCは命令セットを単純にしてクロック上げやすくすることで
結果性能向上をはかるもので、命令あたりの演算の密度は犠牲にしてる。

同クロック・同命令発行数なら、CISCに性能で勝てるわけがないだろ。
ついでにいうとGPUも命令あたりの演算処理単位からいえば一種のCISCだ。

832 :デフォルトの名無しさん:2009/10/06(火) 12:59:21
だってさ

833 :デフォルトの名無しさん:2009/10/06(火) 13:25:05
x86の命令でなんか演算密度高い命令とかあったっけ?

834 :デフォルトの名無しさん:2009/10/06(火) 13:41:28
主記憶がレジスタと同じ応答性とスループットになればRISCが勝つよ

835 :デフォルトの名無しさん:2009/10/06(火) 13:47:08
>>833
ぶっちゃけメモリアドレスをオペランドにとれる命令全部。
ベースアドレス+インデックス×スケール+即値によるアドレスの算出と
ロード操作を1命令に含めることができる。
同じ命令内のオペレーション間で依存関係が決まってるから
スケジューリングもしやすい。
んで、アドレス演算のルールに特化した特殊な演算ユニット(AGU)で
解決することで性能向上を図ってる。

RISCだとアドレスの算出すら整数命令で、汎用の整数ユニットを使って
計算することになるから、そこで大きな性能差が生じる。

836 :デフォルトの名無しさん:2009/10/06(火) 14:03:52
x86の強力なアドレッシングモードはLarrabeeのパワーの源と言ってみる
事実GeForceはワープ内の要素ごとに独立にメモリアドレス計算やってたり、
メモリ周りの命令に関してはかなり効率悪いし

fermiのSPは浮動小数と整数が2並列発行できるようにして
浮動小数演算をやりつつアドレス計算もできるようになってるが
それまでのGT200まで整数と浮動小数は排他動作だったから
読み書き対象のアドレス計算のたびに浮動小数演算の発行が止まってたわけで
実効性能を下げる要因になってた。

837 :デフォルトの名無しさん:2009/10/06(火) 18:25:32
>>827
この板にもベンチマークとかシミュレーターの意義がわからない馬鹿が居たんだな

838 :デフォルトの名無しさん:2009/10/06(火) 19:18:53
>>836
じゃfermiで解決だね

839 :デフォルトの名無しさん:2009/10/06(火) 19:34:30
>>838
全然解決してねー。

サイクルあたり2命令しか発行できないのに
アドレス生成だけに1命令分取られるだけでも大きなロス

Larrabeeのほうは、アドレス生成つきロードを伴うマスクつき積和算と
スカラ命令あるいはストア操作を同時にデコード・発行できる。
つまり1クロックあたりの実効オペレーション数で水をあけられる可能性がある。

840 :デフォルトの名無しさん:2009/10/06(火) 21:03:42
?
int,fpって並列可能なんだよね?
2つのIU使って16spに命令出すの?
fermiって

841 :デフォルトの名無しさん:2009/10/06(火) 21:37:24
>>835
で、そんなアドレッシングがどれだけ使われるわけよ?

842 :デフォルトの名無しさん:2009/10/06(火) 22:01:35
おまえらGPGPUのネタがないからって自作板化するなよ

843 :デフォルトの名無しさん:2009/10/06(火) 22:04:16
>>839
GPUの場合、メインになる大規模配列へのアクセスなんかだとアドレス計算なんかは
コードで明示しなくてもハードで自動でやるんでなかったっけ?

844 :デフォルトの名無しさん:2009/10/06(火) 22:05:11
俺821だけどさ、RISCなんか微塵も擁護してないわけよ。

PPC含めていろんなアーキを触るのは楽しいけれど、
x86が現実的に俺が金を出せる中では最強だと思っているわけよ。

でもRISCとかCISCじゃないでしょ?と言いたかったんだ。
現にAVXではデコーダが軽くなるように変更してるでしょ?
今までの実装に負けを認めてるわけよ。

でもそれはRISCに負けたわけじゃないし、CISCが勝っているわけでもない。
Intelは今まで割と酷いアーキだったと思うんだけど……分かんないかなあ。

845 :デフォルトの名無しさん:2009/10/06(火) 22:14:32
捨ててまた拾うなんてこの世界じゃ常識なのに
負けを認めただの何だの
典型的なIntelアンチですね

846 :デフォルトの名無しさん:2009/10/06(火) 22:33:49
11月25日GT300発売決定しました

847 :デフォルトの名無しさん:2009/10/06(火) 22:37:38
>>843
ソースレベルと機械語レベルを混同してる

848 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/06(火) 22:57:22
>>844
なにが勝って何が負けたの?

x87もMMXもSSEも潰さずに新たなSIMD命令を追加出来るのはまさに可変フォーマットたるCISCのメリットだろ
命令長の縛りで好きにOperand空間を拡張したりできないのがRISCだよ。

360のCPUなんか、SIMDレジスタを128本に拡張した分、4オペランド命令や1バイト単位の操作命令が
削られてたりする。

それから君はAVXを根本的に理解していない。

849 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/06(火) 23:40:41
まあ俺に言わせればABCDの4レジスタの時代から1バイト、もう1バイトと継ぎ接ぎしていった
伝統的CISCアーキテクチャの新たな1ページですよAVXにしてもLRBniにしても
可変アドレッシングモードがある限りx86はどこまでもCISCだ。
add eax, ecxみたいな1バイト命令がたとえば4バイト固定に変わりますか?なりません。



850 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/06(火) 23:58:37
>>841
どっかのプログラムをテキトーに逆アセンブラかけてみろ。アホみたいに使われてる。
AMDのCPUがALUとは別個にAGUを3つも装備しちゃうくらい使われてる

あとついでにいうと32ビットとか64ビットとかの即値を命令ストリームからダイレクトに供給できることも
パフォーマンス要因として大きい。

どっかの情けないCPUには32ビットレジスタに16ビットずつにわけて即値ロードする命令があったりするけど
パーシャルライトのレイテンシで氏ねる。
メモリ空間が広がるほど、即値のビット幅に対する要求がシビアになる。

CellのSPUなんて直接アドレッシングできるメモリが物理的に256KBしかないから即値フィールドが16ビットもあれば
左に2ビットあればロード命令の即値フィールドとしては十分だが、
特化型じゃない普通のCPUでは4GB以上に対してアドレッシングするわけで。
論理メモリ空間が広がるほどRISCは使えなくなる。

8バイト固定長のRISCにすればいいだろって?
氏ねばいいと思うよw


851 :デフォルトの名無しさん:2009/10/07(水) 00:11:52
結局、CISCの利点のおかげで儲かったおかげで、プロセスルールに投資できて、
それがIntelの優位性をより伸ばした。そんな説がありえるのか?

852 :デフォルトの名無しさん:2009/10/07(水) 00:18:50
>>851
Fab商法がうまくいったからだろ
アーキテクチャ云々より
Fab1個丸ごと単一商品の生産工場っていう
資金回収能力が凶悪過ぎる方法実現できているだけ



853 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 00:21:52
コード資産の継承って点で可変フォーマットであることに助けられてきたのは確かだね。
ステート切替によって複数の命令セットのフォーマットを混在できるARMはCISCに分類する学者さんもいるし

ハイエンドRISCが死に絶えるなか公共事業で生きながらえてるIBMのPOWERですら
BCDアクセラレーションや8バイト命令モードなど既にRISCのポリシーから逸脱してる

854 :デフォルトの名無しさん:2009/10/07(水) 00:33:05
強い者が勝つのではない、勝った者が強いのだ

855 :デフォルトの名無しさん:2009/10/07(水) 00:55:59
なるほど、勝ったものが強いか・・ん?

856 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 00:56:30
ARMがSHやMIPSを凌ぐほどになったのは2バイト形式のThumb命令入れた当たりからだよ

それはそうとNVIDIAの経営相当厳しそうだな

857 :デフォルトの名無しさん:2009/10/07(水) 01:17:00
ジレンマがあるよね
現状はNVIDIAしかないし、将来はNVIDIAきつそうだと言っても
AMDに乗り換えてもすぐIntelの天下になる可能性もあるし
かといって、今Intelは製品がないから乗り換えようがない

858 :デフォルトの名無しさん:2009/10/07(水) 01:42:00
そう言えば、昔Itaniumなんてのもあったね
LarrabeeもItaniumの匂いがするなw

859 :,,・´∀`・,,)っ-○○○:2009/10/07(水) 01:44:20
俺に言わせればFermiのほうがItaniumっぽいけどな


860 :デフォルトの名無しさん:2009/10/07(水) 03:02:03
面白いのはItaniumを倒したのはXeonなんだよなw
勝ったXeon軍の首領もEMCに行っちゃったし

861 :デフォルトの名無しさん:2009/10/07(水) 03:04:05
というかそもそもItaniumは失敗したと言うより
Itaniumが狙った市場が消滅した。ってのが正しいんだが・・・
そもそもx86サーバーとかの市場は、元々Xeonの管轄だったわけで・・・
x86サーバーの市場が、そのままかつてSparkやPPCやAlphaがあった市場を喰った。
それだけのこと。

862 :デフォルトの名無しさん:2009/10/07(水) 03:07:56
なるほどNVIDIAは自爆街道まっしぐらと

863 :デフォルトの名無しさん:2009/10/07(水) 03:18:06
ま、AMDは最初から蚊帳の外だがw

864 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 03:18:52
>>860
Xeon以前にNehalemが出るまでIntel史上最大の脅威と言わしめたOpteronが遠因だろ
あれの存在があったからこそ、苦戦を強いられながらもXeonを64ビット対応せざるを得なかった。

IA-64 vs x86-64(AMD64)で雑誌の特集組まれてたくらいだし


x86の有用性を自社以外が示してしまったのは皮肉だよな。

毒を食らわば皿までとはよくいったもので、OpteronはIntelの何かに火を付けてしまったようだ
全プロセッサ市場x86化計画の始まりだよ。


XScale捨ててAtom、結果大成功。
GPUもこのノリでx86化したいらしい。




865 :デフォルトの名無しさん:2009/10/07(水) 04:05:27
Larrabeeがx86なのは統合を成功させるための手段であって目的ではない

866 :デフォルトの名無しさん:2009/10/07(水) 05:20:18
>>864
話うまっ

867 :デフォルトの名無しさん:2009/10/07(水) 06:01:32
demo x86布教運動してたゲルシンガーが居なくなっちゃったね

868 :デフォルトの名無しさん:2009/10/07(水) 07:14:34
最近のオレゴンチームがアレだったからなぁ。
不要論でちゃって、組織統合と同時に退職させられたのかな。

869 :デフォルトの名無しさん:2009/10/07(水) 08:05:40
え?Nehalem-EPで絶好調だったよ
企業のIT予算減ってるとか言われてたのにモバイルよりサーバーのが回復してた
まあクビって感じじゃないよな

870 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 08:16:52
破格の条件で抜擢されたっていわれてるけど

871 :デフォルトの名無しさん:2009/10/07(水) 08:23:11
AtomってPen4より遅いんでしょ?

872 :デフォルトの名無しさん:2009/10/07(水) 12:55:29
トランジスタ規模相応の性能。
てか性能よかったら棲み分けにならない。

873 :デフォルトの名無しさん:2009/10/07(水) 19:25:09
fumeFX??提携?買収?
ttp://www.4gamer.net/games/099/G009929/20091001065/SS/009.jpg

874 :デフォルトの名無しさん:2009/10/07(水) 20:59:23
プログラム板のこのスレに何人のプログラマーがいるのか疑問だ
言ってることがITmedia並みで笑える

875 :デフォルトの名無しさん:2009/10/07(水) 21:13:55
単純な疑問なんだがATIの場合分岐粒度って64 "pixel"で
nvidiaの場合って32個の"32bitデータ"?(8pixel相当?)

876 :デフォルトの名無しさん:2009/10/07(水) 21:33:11
Intelは16wideで1cycle : 32bitの16個
nvidiaは8spで4cycle or 32spで1cycle : 32bitの32個
ATIは16shader(16*5=80sp)で4cycle : 64pixel(32bitの256・・・)

877 :デフォルトの名無しさん:2009/10/07(水) 21:45:51
526 名前:Socket774[sage] 投稿日:2009/10/07(水) 14:11:06 ID:jGgZ/LK7
>>496の大雑把な内容
Nvidia kills GTX285, GTX275, GTX260, abandons the mid and high end market
Full on retreat, can't compete with ATI
ttp://www.semiaccurate.com/2009/10/06/nvidia-kills-gtx285-gtx275-gtx260-abandons-mid-and-high-end-market/


285は既にEOL、260は11or12月にEOL、275は2週間以内にEOL、295も終わりそう。
ハイエンド、ミドルレンジから脱落する。
Fermiの派生モデルはテープアウトすらしていないので、少なくとも2Qは掛かる。
Fermiはダイサイズあたりの性能が低く派生モデルを作ってもフルラインナップで価格競争力で劣る。
ハンダの欠陥問題、G212の失敗、G214の大失敗、G215の遅延、G216とG218の壊れたGDDR5コントローラ。
救世主となるチップはない、プランBはない、全て失敗した。
赤字販売を続けるか、撤退して少ない赤字を出すかしかない。
資金が尽きる前に開発の問題を修正し競争力のある製品を出せるかが問題。
1月にはローエンドからも脱落する。
Nvidiaは全てのパートナーから憎まれており助けてくれるパートナーはいない。
Nvidiaに必要なのは経営陣の総入れ替えだが、その出て行くべき奴らは株主なので起こりそうもない。
ゲームオーバー。
ジェンセンは年俸1ドルでも貰い過ぎである。

878 :デフォルトの名無しさん:2009/10/07(水) 21:52:52
Intelは16wideで1cycle : 4pixel
nvidiaは8spで4cycle or 32spで1cycle : 8pixel
ATIは16shader(16*5=80sp)で4cycle : 64pixel

879 :デフォルトの名無しさん:2009/10/07(水) 21:53:03
http://www.z-z-z.jp/BLOG/log/eid450.html

NVIDIAのFERMIコアベースの製品が出てくるのは早くて今から三ヶ月後、
高確率で半年後といわれています(半導体業界関係者の意見)
NVIDIAとしては、今回の発表は、株価対策、あるいはユーザーへの
サービスを兼ねての「やってます」アピールだったといえます。

880 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 21:54:23
>>878
はぁ?

881 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 22:04:23
α値があろうがなかろうが5Way ALUで1ピクセルずつしか割り当てられないのがRadeon
R, G, Bで別のベクトルに再パッキングして並列処理できるのがLarrabeeとGT

たとえばLarrabeeはRGBなら 16/3 pixelな


882 :デフォルトの名無しさん:2009/10/07(水) 22:38:00
>>881
> α値があろうがなかろうが5Way ALUで1ピクセルずつしか割り当てられないのがRadeon
4ピクセル割り当てられますが?

883 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 22:42:40
グレースケール乙


884 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 22:44:25
4サイクルで4ピクセルとか言うなよ

885 :デフォルトの名無しさん:2009/10/07(水) 22:47:38
>>881
アルファを出力しないでどうやってブレンディングするんだよ。
ブレンディングが行われるのはプログラマブルシェーダの後段だぞ。
Larrabee : 4pixelであってる。
あとグレースケールってのはFetch4というかGatherのことを言ってるんだろうが、
あれは読み込みであって出力が4つ同時に出来る訳じゃないぞ。
グラフィックス用途の場合大抵シャドウマッピングでソフトシャドウやるときに都合がいいってだけの機能だ。

>>882
どうやって?MRTとか冗談言い出すんじゃないだろうな?

886 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 23:30:27
だから分岐粒度の話だろ。
RGBだろうがRGBAだろうがSoAに変換して処理するんだから16並列だ


887 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/07(水) 23:39:43
まさか RGBA RGBA RGBA RGBA で4ピクセル処理するとか思ってないよな?
VPUは水平加算もなければ、128ビット単位×4でマスク実行するためのビットマスク生成命令も存在しない。
Larrabee Prototype Libraryを読み直してこい

888 :デフォルトの名無しさん:2009/10/08(木) 00:10:50
>>887
失礼。粒度に関してはこちらの勘違いだった。
ただGeForceはチャンネル毎にスレッド立ててるってソースが見つからなかったんだけど何か知らないか?

889 :デフォルトの名無しさん:2009/10/08(木) 00:14:27
>>850
なんか即値最強みたいに言ってるが、浮動小数点数のロードも命令に埋め込むつもりか?

890 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/08(木) 00:27:14
おいおいトンデモ意見が出たな
ロードアドレス算出用のディスプレースメントって「即値」以外のなんなの?
リニアなメモリ空間アドレッシングするのに4バイトくらいないと実質的に使い物にならん。
変量がそんなに必要ないときは1バイトdispモード、そのものが必要ないならdispなしモードでいいし



あーSSE4には汎用整数レジスタにXMMレジスタの浮動小数値を転送する命令(あるいはその逆)が
あったりするけどあれって何のためにあるかわかるよね?
まあLarrabeeとは話がそれるが。

891 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/08(木) 00:31:42
ロードユニットが忙しいときにしたいときに、単精度の定数を汎用レジスタ上に即値モードで転送して
movdとかinsertpsで挿入とかよくやるテクニックじゃん

892 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/08(木) 00:32:23
ロードユニットが忙しいときにロード命令節約したいときに、ね

893 :デフォルトの名無しさん:2009/10/08(木) 00:34:22
せめて小分けにして書くな

894 :デフォルトの名無しさん:2009/10/08(木) 00:43:03
団子が忙しいときに推敲命令節約したいときに、ね

895 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/08(木) 00:44:41
俺は頭で考えてレスなどしない


896 :デフォルトの名無しさん:2009/10/08(木) 00:45:59
餓鬼ですね。

897 :,,・´∀`・,,)っ-○○○:2009/10/08(木) 00:48:35
無我の境地というのだよ

898 :デフォルトの名無しさん:2009/10/08(木) 00:56:25
僕らのアイドル ダンゴリオン

899 :デフォルトの名無しさん:2009/10/08(木) 06:01:02
atiの分岐粒度がデカ過ぎるのは判った

900 :デフォルトの名無しさん:2009/10/08(木) 07:39:45
で、Larrabeeはいつ出るのかね?

901 :デフォルトの名無しさん:2009/10/08(木) 09:16:44
5年後くらいにCellの6割くらいの性能で。

902 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/08(木) 09:21:05
Sandy Bridgeの4コアが200GFLOPSオーバーだから意味ねーよ。

Haswell世代だとやはりCPU4コアだけで300〜400GFLOPS

903 :デフォルトの名無しさん:2009/10/08(木) 09:32:24
コンシューマで画処理以外の何に使うのかなぁ?

904 :デフォルトの名無しさん:2009/10/08(木) 09:45:15
粒度的にはレイトレ向き

905 :デフォルトの名無しさん:2009/10/08(木) 10:07:42
レイトレのデモができる段階なんだから一年以内には出るだろ
その点GT300なんてハリボテ模型だからな。
量産できないアーキなんてペーパーアーキもいいところだ。

906 :デフォルトの名無しさん:2009/10/08(木) 10:15:19
レイトレも画処理だろう。。

907 :デフォルトの名無しさん:2009/10/08(木) 10:18:33
>>900
ハリボテ展示する会社の製品よりは早いだろうなwww

908 :デフォルトの名無しさん:2009/10/08(木) 13:42:09
http://www.4gamer.net/games/098/G009883/20091007054/
Larrabeeは計画破棄が濃厚だね。

Larrabee計画の顔役ともいえるPatrick P. Gelsinger(パット・ゲルシンガー)上級副社長が,
IDF 2009の直前にIntelを退職するという“事件”もあったが,
業界内にはLarrabeeについて,後ろ向きな情報が飛び交っている。
「IntelがLarrabee計画を中止する」といったものまで含まれていたほど。
「Gelsinger氏とともに,主要エンジニアもIntelを去った」という情報もある。

909 :デフォルトの名無しさん:2009/10/08(木) 14:26:31
>>833
たとえばここの
http://www.ddj.com/architect/217200602?pgno=5

vcmpgtpi k2, v3, [rsi+Edge1TrivialRejectCornerValues4x4+rcx*4]{1to16}
っていう命令は何やってるかっていうと
(1) ベースポインタ(rsi)にメンバのオフセット定数(Edge1TrivialRejectCornerValues4x4)
  を加算、さらにインデックス値(rcx)を4倍して加算
(2) 得られたアドレスに対して32ビット値にロード
(3) さらにその値をSIMDテンポラルレジスタの16要素にブロードキャスト
(4) その値と、ベクトルレジスタ(v3)の各要素のほうが大きいかどうかを比較し、
それぞれの要素の真偽値をマスクレジスタ(k2)に格納

こんな複雑な操作をLarrabeeでは1命令でしかもパイプラインで1サイクルのスループットで実行できる。
AGU -> LDU -> PERM -> VPU のパイプライン実行だ。
同じような操作を疑似RISC ISAで書くと6命令とかかかるわけ。
shl $offset, $idx, 2
addi $offset, $offset, Edge1TrivialRejectCornerValues4x4
lqa $vtemp, $addr, $offset
rotqby $vtemp, $vtemp, $addr
shufb $vtemp, $vtemp, $vtemp, $ptn
cmpgti $k2, $v3, $vtemp

SPUの命令セットに似てる?気のせい気のせい。
同じ操作を1サイクルのスループットでこなすには6命令同時発行できないといけない。
6命令なんて、POWER6+ですらやってない。
デコーダから実行ユニットまで少ないトランジスタ数で実装できるRISCは
トランジスタリソースの限られた組み込み向けとしては今でも有効だが
数千万〜数億トランジスタが当たり前となった今となっては
パフォーマンスを追及する向きじゃない。Cellもぶっちゃけ効率悪いし。

910 :デフォルトの名無しさん:2009/10/08(木) 16:52:48
>>908
Larrabee楽しみにしてたのに。GPUとして売ろうとしたのは時期尚早だったのかな。


911 :デフォルトの名無しさん:2009/10/08(木) 17:51:21
自演つまらん

912 :デフォルトの名無しさん:2009/10/08(木) 18:42:57
団子は言っていること無茶苦茶だな。
NVのATIに対する利点は再パックしなくても
効率があまり落ちないところにあるのに。

ATIの場合スカラ演算で少ない命令の場合に
1つ分ではALUの無駄が多すぎるが、
命令が多い、スカラを4つパックして入力するなど工夫をする事で
処理命令数を増やせば、5とはいわずとも平均3-4命令は埋まる。
ここまで出来れば素の演算性能で上回る事例も多い。

まあ、レジスタのxyzwをいい感じで指定して、
バンクコンフリクトを排除する必要もあるから
かなり面倒ではある。

ILの仕様が糞で、どのバンクを使うかを明示しなきゃならんから
コンパイラが最適化する余地が無いしね。

913 :デフォルトの名無しさん:2009/10/08(木) 18:53:38
で、ここまでしたうえなら、扱う粒度が大きくなるから
データ毎に処理が分かれるような対象では
効率が下がりますねという話になる。
ただ、この辺は演算規模が大きい場合には殆ど問題にならない。
CPUで出来る程度の演算負荷の少ない処理を
GPUで代替しようとするときにはかなり大きな問題になる。

914 :デフォルトの名無しさん:2009/10/08(木) 19:47:57
>>912
高級言語レベルの話とネイティブマシン語レベルの話を混同するなよ
CUDAはgather/scatterをラップしてるだけにすぎない。
32WayのSIMT(SIMD)でX, Y, Zをどれでも等しく操作するってのは
要するにロード・ストアの度にAoS/SoAの変換をやってるから。

Larrabee C++ APIはラップせずにSIMDをSIMDとして直接見せてるだけ。
ピクセル毎のプレディケートさえ必要なければ文字通り再パックしないまま
つまりRGBA RGBA RGBA RGBAの構造のまま効率的に処理する方法も
提供されてる。32ビット4要素毎にSwizzleする命令もあるし。
OpenCL経由の場合はGatherがデフォだろうが。

915 :デフォルトの名無しさん:2009/10/08(木) 19:55:32
>>912
> 処理命令数を増やせば、5とはいわずとも平均3-4命令は埋まる。
固定機能再現するだけでも2-3な訳だが。
> ILの仕様が糞で、どのバンクを使うかを明示しなきゃならんから
ATI ILでどれだけxだのyだの指定してもISAにしたときは無視されるぞ。

916 :デフォルトの名無しさん:2009/10/08(木) 19:59:11
C/C++からネイティブコード触れるのはLarrabeeの特権だな




917 :デフォルトの名無しさん:2009/10/08(木) 20:01:14
ppp

918 :デフォルトの名無しさん:2009/10/08(木) 20:25:05
>固定機能再現するだけでも2-3な訳だが。

固定機能のエミュに終始するならDX9使ったらって話
それでも2/5-3/5、64pixel中何pixelに適応になって、shaderが何個空転するのか

919 :デフォルトの名無しさん:2009/10/08(木) 20:45:30
>>918
それがどうしたの?DX9使っても結局ドライバのなかで同じシェーダが生成されるんだぞ。
効率低いことに変わりはない。

920 :デフォルトの名無しさん:2009/10/08(木) 21:03:38
?
DX10以降でDX9以前の固定機能相当の処理はshaderでの置き換えが必須だが
de9でDX9以前の固定機能使うんならshader自体使う必要がないわけだが

921 :デフォルトの名無しさん:2009/10/08(木) 21:54:51
話がかみ合わないなぁ

922 :デフォルトの名無しさん:2009/10/09(金) 00:04:09
つまり、Larrabeeは出るのかね?出ないのかね?

923 :デフォルトの名無しさん:2009/10/09(金) 00:07:07
つまり、地球は丸いのかね?平たいのかね?

924 :デフォルトの名無しさん:2009/10/09(金) 00:46:22
海の水はどうしてですか?

925 :,,・´∀`・,,)っ-○○○:2009/10/09(金) 01:02:45
>>912
バーカ

926 :デフォルトの名無しさん:2009/10/09(金) 01:23:05
うわ
>>912可哀想www

927 :デフォルトの名無しさん:2009/10/09(金) 14:52:48
http://gpu.fixstars.com/index.php/Fermi%E6%A6%82%E8%A6%81#.E3.82.B7.E3.82.A7.E3.82.A2.E3.83.89.E3.83.A1.E3.83.A2.E3.83.AA.E3.81.AE.E5.A2.97.E9.87.8F.E3.81.A8L1.E3.82.AD.E3.83.A3.E3.83.83.E3.82.B7.E3.83.A5.E3.81.AE.E6.90.AD.E8.BC.89

フィクスタ社員なにやってんだよwwww

928 :デフォルトの名無しさん:2009/10/09(金) 15:58:09
> ECCがサポートされました。宇宙線が多い日も安心して使えます。

これか?

929 :デフォルトの名無しさん:2009/10/09(金) 18:10:45
>>915
doubleでxyとzwのペアじゃないと
加算をペアリングしてくれないぞ。

930 :デフォルトの名無しさん:2009/10/09(金) 21:28:38
FermiはShared Memoryとキャッシュで切り替えられるのが良いね。
Cellのようにキャッシュがないとデータ転送が面倒だし、かと言ってx86の様に全てキャッシュだと最適化が面倒になるし。
ただ、キャッシュの方式が気になるところ。あと欲を言えば、もっとサイズが大きければいいのだが。

931 :デフォルトの名無しさん:2009/10/09(金) 21:45:33
>>930
Larrabeeは普通にコヒーレント無視でロードストアできるオプションあるがな

スカラ風の命令セットに見せかけるためにネイティヴのSIMDすら抽象化されてて
直接触れないCUDAで最適化も糞もない

932 :デフォルトの名無しさん:2009/10/09(金) 22:22:17
>>929
それは仕様にそう書いてあるから。そして趣旨がずれてる。
ATI ILでxyで倍精度加算を書いてもISAではzwで加算されたりする。

933 :デフォルトの名無しさん:2009/10/09(金) 23:04:59
LarrabeeのTDPって300Wなのかよ。
縛熱だな。Fermiどころじゃないじゃん。

934 :デフォルトの名無しさん:2009/10/09(金) 23:07:39
そりゃ電源ピンのところでぶった切られてて物理的に電源供給できないFermi(模型)は0Wだからな。


935 :デフォルトの名無しさん:2009/10/09(金) 23:24:09
また脳内ソースで書き込む時間が始まるお…

936 :デフォルトの名無しさん:2009/10/09(金) 23:25:49
http://www.techpowerup.com/64974/Intel_Larrabee_Capable_of_2_TFLOPs.html

937 :デフォルトの名無しさん:2009/10/09(金) 23:37:36
Larrabee頓挫の危機

938 :デフォルトの名無しさん:2009/10/09(金) 23:52:08
危機ってことにしないと都合が悪いんだなゲホ厨は
512SP止まりじゃクロックあたりのピークFLOPS数すらLarrabeeに並ばれるからな

939 :デフォルトの名無しさん:2009/10/09(金) 23:55:06
Sunday, July 6 2008

940 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/10(土) 01:48:21
Cellの32コア版もSPARCも計画後退してるし
明らかに性能出ない設計の上、模型しかできてないFermi

遅れに遅れたLarrabee、なぜか競合製品までことごとく頓挫して命拾いしてるよなー

941 :デフォルトの名無しさん:2009/10/10(土) 02:08:40
みんな注力している領域なのに、これだけ苦労してて、ひょっとしてこの道は
間違っているんじゃないだろうかとふと思うよね。

結局、半導体メーカーの都合で作っちゃっているからこうなっているのかな。

でも、生みの苦しみであって、なにか大きな変革が本当に起きることだってあるとは思って、
個人的に期待しているんだけど。

942 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/10(土) 02:34:52
トップ500システムのメインプロセッサの地位をXeonをもって8割がた制圧しちゃったIntelにとっては、
今はHPC分野は攻める市場じゃなくて守る市場。
Larrabeeなんて必要ないんだよ。攻めてくる競合製品がなければな。

じゃあ無意味なのかっていうとそうでもなくて
ただ、未完成ながらも実働デモをして競合他社にプレッシャーを与え続けてるだけでも十分効果はあると思うのです。

当然ながらRV770を倍増して毛が生えただけのGPUを投入したATIは競争には加わっていない
GPUとしては優秀だがGPGPU的なマーケットにはことごとく相性が悪い。

943 :デフォルトの名無しさん:2009/10/10(土) 02:48:18
>>941
ほんとそう思うよ。
結局超並列の計算が果たしてどれだけ必要なのか疑問に思ってきた。
周りを見渡しても必要用とされているのはほとんど研究用用途ぐらいしかないし、それだと金にならない。
結局今までのスパコンの市場を食っただけで拡大していないのではないか?と思ったりする。
ちょっと前なら金融工学のシミュレーションが伸びてきたりしていたけど、今の金融危機でそういうのも、
余り受けていないようだし。半導体のシミュレーションとかだったら今のFPGAに置き換えられるかもしれないけど、
そうなると大規模なシミュレーションをするために新しいCPUやGPUを開発する→以下ループになって手段が目的かするような気がする。

何か身近なもので大きなイノベーションでもあればいいんだけど。


944 :デフォルトの名無しさん:2009/10/10(土) 02:52:08
Sonyの久多良木は失敗し、
Intelのゲルシンガは失脚し、
Nvidiaのフアンは久多良木以上に暴走している。

一方、AppleのジョブズはCellを否定し、Intel化で成功し、
任天堂の岩田は高性能はいらないと入力デバイスの進化で大成功を収め、
AMDは純GPU路線で、順調にシェアを伸ばしている。

ストリームコンピューティングの将来は一体…。

945 :デフォルトの名無しさん:2009/10/10(土) 03:04:03
>>942
ずいぶん弱気になったねw
今まで散々「出す出す詐欺だろ」とか「Itaniumの二の舞だろ」
「どうせ性能では勝てないんだし、中止だろ」みたいに言われても
先見性がないとか、GMAで絶対勝つるとか何とか言ってたのに
結局「未完成でもいいんです。発売しなくてもいいんです。
プレッシャーを与えるだけで良いんです」ってかw

946 :デフォルトの名無しさん:2009/10/10(土) 03:05:06
結局、先見性があったのは団子ではなく、「どうせ出ないだろ」と
言ってた連中のほうだったなw

947 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/10(土) 03:21:05
馬鹿だな
守るべき市場だからこそ壁役が必要なんだよ
敵がいないのに出してどうする。Xeonと共食いじゃ利益にならんぜよ。

Fermiが出てきたとして倍精度600GFLOPS程度だぜ。しかもまだ模型しか作れてない。
肩すかしにも程がある。
それどころかNVIDIA自体が倒産しそうな勢い。

結局倍精度1TFLOPSなんて必要なかった。とんだ肩すかしだろ。


Intelは用意周到ゆえに肩すかしを喰らいまくってるからな。
「Phenom II-FX」を警戒してXeonと同じLGA1366をデスクトップに含めて投入したのに
フラグシップですら最低レンジの920にすら及ばぬ性能じゃな。
噛ませ犬はCore 2 Quadでも十分だった。

なんにせよ費用対効果ってのものがある。

948 :デフォルトの名無しさん:2009/10/10(土) 03:24:25
Skulltrailとかもあったな〜

949 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/10(土) 03:28:06
ワンチップ倍精度1TFLOPSを実現するのに

Larrabeeは予定通りのスペックのものを2GHz動作で出せばよい。
4GHzのCellだと64コア必要。まだ32コアすら出てきてない。
Fermiなら768SP版が必要だ。しかしそれ以前の問題だ。
SPARC?あばばばば

こんな状況だぜ。
結果として及ばぬ性能どころか大幅に勝ちすぎたわけだ。
現時点で他の陣営は量産にほど遠い。

950 :デフォルトの名無しさん:2009/10/10(土) 05:24:38
この分野では団子さんの言うとおり、インテルが一番有利だね。
なんだかんだでXeonのクラスタを沢山くめばいいわけだがら。

何GFlopsとか、何TFlopsとか言っても、実際そこまで出せるのって
結局レジスタにのった場合でしょ。
CPUの速さはもうほどほどにして、インテルもメモリの方に投資して、
メモリアクセス数cycleとかのDRAMを開発したらいいのに。

1TFlopsでメモリのレイテンシが400〜800cycleよりも、
256GFlopsでメモリレイテンシが10cycleだったら、実アプリにおいてはは後者の方が上何じゃない?





951 :デフォルトの名無しさん:2009/10/10(土) 05:47:15
ワンチップ倍精度1TFLOPSを実現するのに

Fermiは予定通りのスペックのものを2GHz動作で出せばよい。

952 :デフォルトの名無しさん:2009/10/10(土) 06:02:52
(注)
larrabeeって言い張ってた、あのショボイレイトレquakeもはたして実機なのか
既存のCPUでの動作なのか、非常に疑わしい

ゲルシンガーが居なくなって立ち消えになるんじゃないかと思われる

AMDはどうでもいいw

953 :デフォルトの名無しさん:2009/10/10(土) 06:11:45
日本語で

954 :デフォルトの名無しさん:2009/10/10(土) 06:17:08
larrabeeも張りぼて
AMDはカス

でOK

955 :デフォルトの名無しさん:2009/10/10(土) 06:30:30
私はゲロ大好きです

でOK

956 :デフォルトの名無しさん:2009/10/10(土) 06:55:28
いいえ、カスが大嫌いなだけです

でOK

957 :デフォルトの名無しさん:2009/10/10(土) 07:12:23
ま、あの画質で
あの程度の動き
あの程度のカクカクっぷりだと
corei7あたりでも出来そう

958 :デフォルトの名無しさん:2009/10/10(土) 07:24:00
> Larrabeeは予定通りのスペックのものを2GHz動作で出せばよい。
これ、予定通りに出せたとしても理論値でしかなく、実効値は3〜4割にしかならんでしょ?
どうせインテルだし。

959 :デフォルトの名無しさん:2009/10/10(土) 09:07:00
rv870は実行5%くらいだがな

960 :デフォルトの名無しさん:2009/10/10(土) 09:11:43
リアルタイムレイトレーシングだっけ
すでにAMDがデモ公開してたような

961 :デフォルトの名無しさん:2009/10/10(土) 09:40:09
レイやトライアングルが少なければCPUでも出来る
問題は

962 :デフォルトの名無しさん:2009/10/10(土) 09:43:12
AMDは映画製作会社とかと共同で
ライブラリつくりまくってるからな

公には一切公開できない成果たくさんあるよ

963 :デフォルトの名無しさん:2009/10/10(土) 10:12:25
GPGPUの分野ではnVidiaがだめでもAMDが出てくるのは確実だし、
ライバルがだめそうだからLarrabeeを出さないとか言ってるのは
理屈が破綻してるな

964 :デフォルトの名無しさん:2009/10/10(土) 10:40:53
これに関してはAMDはintelの犬だろ

965 :デフォルトの名無しさん:2009/10/10(土) 10:58:05
>>960
AMDのGPU部門トップ,Rick Bergman氏が語る「1〜10年後のグラフィックステクノロジー」
http://www.4gamer.net/games/045/G004578/20081001053/

966 :デフォルトの名無しさん:2009/10/10(土) 11:35:06
>>964
お前AMDをディスってんの?
どう考えても犬とかアリエン・ロッベンだろ








誇り高きコバンザメだよ

967 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/10(土) 11:57:43
ローカルなL2断片(256KB)に載っかる部分までなら上り計64KB/clkの帯域が得られるとのことなので
そこでスカラ命令側でベースアドレス/インデックス更新とループカウントしつつ
SIMD命令側では3rdオペランドはノンテンポラルモードでのメモリアドレッシングにす
これで実効効率も9割以上は堅い。

ちなみにFermiはロード・ストアユニットを2アクティブワープで共用という、致命的なパフォーマンス阻害要因がある。
レジスタ間でこね回す演算でないとどうやっても性能が出ない。
積和算をやりながらだと残り1命令しか発行出来ないって仕様も致命的。

FermiはRISCライクなんだよね


968 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/10(土) 12:01:07
>>951
シュリンク率考えればあり得ないな。

GF9800GTX+が1.8GHzとか、SPが128基程度でメモリ帯域も狭かったりとTDPに余裕があったからこそだろ
NVIDIAは40nmでまだ製品を投入してない。


969 :デフォルトの名無しさん:2009/10/10(土) 15:17:53
ダンゴや
また自作板で万人に解らん
API使ったネタ話すの自粛するんだ

970 :デフォルトの名無しさん:2009/10/10(土) 16:38:29
わかんなくても「ヘーそんな事も出来るんだ」程度に楽しんでるから別に団子はそのまんまでいいよ
金払うに値する次のトリッパーを期待しつつ待つ

971 :デフォルトの名無しさん:2009/10/10(土) 21:47:35
アプリのGPU化が進むと、インテルもAMDもCPUの存在価値がなくなるから、
基本的にやる気ないだろ。
NVIDIAには頑張ってもらいたいな。
もうCPUはOSが動けば十分なのでAtomクラスで十分w

972 :デフォルトの名無しさん:2009/10/10(土) 22:07:44
>>971
>CPUの存在価値がなくなるから、
とてもGPGPUスレ住民の意見とは思えん
AtomクラスでいいならGPGPU系技術も必要なかろう

973 :,,・´∀`・,,)っ-○○○:2009/10/10(土) 22:12:43
そこまでなるとCPUとGPUは同じダイで充分だよな。
x86命令を解釈するGPUアーキテクチャでも作らないとな。
統合プロセッサのコードネームは「Haswell」ってのはどうだろう?




>>971身の程を知れバーカ

974 :デフォルトの名無しさん:2009/10/11(日) 00:53:47
CPUの速度向上が遅くなったからこそのGPGPUだというのに

975 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/11(日) 00:58:07
ところが、GPGPUで賄えるような演算ほどSIMD・マルチコア化での速度向上率も高いんだよね。

976 :デフォルトの名無しさん:2009/10/11(日) 05:13:18
素人目には、CPUの方がとか、GPUの方がとかじゃなくて、
CPUもGPUも両方活用すると
演算スピードが鬼速になると思ってしまうんだが、そうじゃないの?


977 :デフォルトの名無しさん:2009/10/11(日) 06:00:10
>>975
まあ、GPUはスーパーメニーコアプロセッサーとでも表現できるものだからね
SIMD化はもちろん、マルチコア化でどんどん差を縮められる

ただ、サーバー用途以外の一般デスクトップでは、
4コアを超えるマルチコア化の予定がキャンセルされてるけどね

まして、ノートだと2コアのままで当分は行くらしい

978 :デフォルトの名無しさん:2009/10/11(日) 08:51:58
CPUへの統合化が進んでからが本番田世なぁ
今はメーカーによって作りがまちまちやし手法も微妙に違うからいまいち手が出しにくい

979 :デフォルトの名無しさん:2009/10/11(日) 09:13:30
>>976
GPUは処理を並列してこそ意味があるわけで、
そのために大量のデータをGPUに転送しておかないと
いけない。
ただPCI-Expのバス帯域が狭くて転送コストが
馬鹿みたいに高い。
だから同時にCPU+GPUというのは理想だけど難しい。

980 :デフォルトの名無しさん:2009/10/11(日) 09:32:15
だから、コンシューマで、
画像処理以外何に使うのかがよくわからない。

981 :,,・´∀`・,,)っ-○○○:2009/10/11(日) 10:33:11
GPU動かすのにCPU時間も使うんだよ。


982 : ◆0uxK91AxII :2009/10/11(日) 15:11:23
素人目には、GPGPUは使い途が無さ杉る。
まだやっていたのかっていう印象。

983 :,,・´∀`・,,)っ-○○○ ◆??? :2009/10/11(日) 15:23:00
NVIDIA曰くCUDAユーザー人口は世界6万人とかいうレベルだからな
水増ししてるだろうからもっと少ないと思うが



984 :デフォルトの名無しさん:2009/10/11(日) 16:05:46
あなたもその一人じゃん

985 :デフォルトの名無しさん:2009/10/11(日) 16:38:27
だんご of 6万か・・・
すげぇな。

986 :デフォルトの名無しさん:2009/10/11(日) 16:50:51
>>983
それってCUDA関係の資料ダウソした
人数ってだけだから信じるなよw

987 :デフォルトの名無しさん:2009/10/11(日) 17:05:02
じゃ、6万未満ってことか

988 :デフォルトの名無しさん:2009/10/11(日) 17:14:12
ここはアンチスレか。

989 :デフォルトの名無しさん:2009/10/11(日) 17:53:33
全世界で6万?
なんというかまぁ可愛らしい数字だな

990 :デフォルトの名無しさん:2009/10/11(日) 18:14:46
俺5000人位かと思ってた

991 :,,・´∀`・,,)っ-○○○:2009/10/11(日) 18:30:51
まあなんというか
NVIDIAもこんな不確かなものに命運かけなきゃいけないんだからな

992 :デフォルトの名無しさん:2009/10/11(日) 18:35:04
そう?

993 :デフォルトの名無しさん:2009/10/11(日) 18:41:47
個人的にはSIMDすらも使い用途が無いと感じる。
SIMDを駆使すれば、1Tflopsですよ〜っていわれても
画像処理など特定の用途じゃなければ、自然にC++のソースに
組み込むのは難しいし、
(例えば、SoAをAoSにしたり、プリフェチを埋め込んだり、
C++のソース的には不自然だよなこーいうの)
結局組み込めないのなら、無駄なスペックと感じる。


994 :デフォルトの名無しさん:2009/10/11(日) 18:46:12
特定の用途には有効なんだろ。 何屁理屈こねてるんだよ。

995 :デフォルトの名無しさん:2009/10/11(日) 18:51:59
>>994
例えば、そのリソースを使って
1.5倍速のFPUが作れるならそっちの方がいい。
作れればの話しだけど。
結局、4並列、8並列すれば、カタログスペックもx4、x8するけど
俺のアプリはx1のままだ。

996 :デフォルトの名無しさん:2009/10/11(日) 18:57:31
どうやら知能が低いらしい

997 :デフォルトの名無しさん:2009/10/11(日) 18:58:41
CPUは高性能
プログラムを組む奴が低知能

どうにもならんわなw

998 :デフォルトの名無しさん:2009/10/11(日) 18:59:36
つーか、CPUにSIMD必要?
SIMDが発揮出来るような用途は、必ずGPUとかち合うし、必ずGPUに負けるっしょ。
つまり、GPUが載ってるPCじゃ、CPUのSIMDなんて使われず終いじゃん。
結局、カタログスペックの為のセールス的意味しかないと断言。

999 :デフォルトの名無しさん:2009/10/11(日) 19:01:55
>>996-997
いや、考えてもみろよ。
例えば、AoSでどうやって組むんだよ。OOPのクラスと真っ向からかち合うよ?
おかしくね?C++プログラマに、OOPと衝突するような組み方要求する機能って。

1000 :,,・´∀`・,,)っ-○○○:2009/10/11(日) 19:02:42
外部プロセッサじゃデータ転送のレイテンシもスループットも話にならない。



1001 :1001:Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

209 KB
★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)