2012年2月25日土曜日

デュアルチャネルメモリは何を意味する

デュアルチャンネル(デュアルチャネル)メモリに意味はあるのか? : 月見酒(MINT's World)

解説

デュアルチャンネルメモリの効果を疑問視する声が時々聞かれます。

上記の様にメジャーな所でも「意味無し」と云ってしまっている様な物の記事が出たりして、どうしても効果が疑われる要素が見えてしまっています。

丁度実験に向いているサンプルが揃ったので、詳しく検証してみることにしました。

環境と設定

実験ハードウェア構成
BASENEC「Express5800/110Gd(N8100-1279Y)」
CHIPSETIntel 3000 + ICH7R
CPU
  • Intel「Celeron D 341(Prescott-V 2.93GHz)」
  • Intel「Pentium Dual-Core E2140(Allendale 1.80GHz)」
RAMMicron「MT9HTF6472AY-667D4(512MB)」× 2
GRAPHICXGI「Volari Z9s」(オンボード)
SATA HDDHGST「Deskstar® 7K160 HDS721680PLA380」
OS
  • Windows XP Professional + Service Pack 3 RC2(Build:3311) + DirectX 9.0c + Internet Explorer 6 Service Pack 1
システムの設定
  • nLite によって、余計なドライバやコンポーネントは削ってある。
  • クラシック表示。
  • 一般的に早くなるだろうと謂われている設定。
  • スクリーンフォントの縁を滑らかにする。
BIOS 設定
  • BIOS Ver.0024 クアッドコア対応版
  • AHCI モード有効
  • EIST 無効
グラフィックボード設定

ドライバー Ver.1.08.03。調整項目無し。

etc…

基本性能比較

まず、メモリ性能のみを比較してみます。 OS の再インストールはせず、その都度パーツの組み合わせだけをいじって計測しています。 最高値を求めている訳ではなく同じ条件で比較さえできれば構わないので、多少他の実験等で汚した状態をそのまま使っています。

CrystalMark 2004R3 v0.9.124.404b

Celeron D 側は、FSB が 533MHz であるため、Read がこれで実効値の限界。 Write だけがデュアルチャンネル化で改善したと見ると、自然な様に思えます。

一方 Pentium Dual-Core の方は、キャッシュの高効率ぶりが光るのですが、メモリ本体の転送速度は Write の数値にやや疑問。 Single 2枚刺しには、何かオーバーヘッドでもあるのでしょうか? Read の方は、一往 DDR667 と FSB 800MHz のどちらで頭を打つかで二分されている様に見えます。

Celeron D 341 + DDR533 LT = 4,4,4,12Pentium DC E2140 + DDR667 LT = 5,5,5,15
1枚SingleDual1枚SingleDual
Total699569657222806173609356
Read3395.11 MB/s
(3395)
3333.97 MB/s
(3333)
3386.46 MB/s
(3386)
3844.81 MB/s
(3844)
3781.64 MB/s
(3781)
4119.30 MB/s
(4119)
Write1411.20 MB/s
(1411)
1428.26 MB/s
(1428)
1560.65 MB/s
(1560)
987.99 MB/s
(987)
690.46 MB/s
(690)
1545.32 MB/s
(1545)
Read/Write1377.17 MB/s
(1377)
1390.39 MB/s
(1390)
1463.54 MB/s
(1463)
996.63 MB/s
(996)
664.43 MB/s
(664)
1487.01 MB/s
(1487)
Cache7907.24 MB/s
(790)
7921.61 MB/s
(792)
7913.06 MB/s
(791)
22124.78 MB/s
(2212)
22038.52 MB/s
(2203)
21835.41 MB/s
(2183)

SiSoftware Sandra 11.33

Celeron D でデュアルチャンネルを使った時のレイテンシーが、他と全く違う傾向になっている原因は不明。 キャッシュの値が、デュアルチャンネルでは増えている点も奇妙ですが、こちらはそういう計測の仕組みなのかもしれません。

転送速度については、CrystalMark 2004R3 と似た傾向のデータが出ており、Core 2 系のキャッシュ効率が高い事も一致する点で、基礎データはほぼ正しいと思われます。 Celeron D のトレースキャッシュの威力も見え隠れしていますが、総合的には厳しい様ですね。 また、デュアルチャンネル時に 1MB 以上が急激に遅くなっている所が、謎めいています…。


フラッシュメモリにする方法
Celeron D 341 + DDR533 LT = 4,4,4,12Pentium DC E2140 + DDR667 LT = 5,5,5,15
1枚SingleDual1枚SingleDual
Integer STREAM3334 MB/s3288 MB/s3351 MB/s3842 MB/s3736 MB/s4223 MB/s
Float STREAM3340 MB/s3296 MB/s3400 MB/s3800 MB/s3758 MB/s4216 MB/s
Latency
(Speed Factor)
174ns
(100.8)
176ns
(102.3)
176ns
(101.4)
123ns
(56.5)
114ns
(57.7)
124ns
(56.2)
1kB 3.5 clk
(2.2 ns)
3.2 clk
(2.0 ns)
5.1 clk
(1.7 ns)
3.5 clk
(2.2 ns)
3.2 clk
(2.0 ns)
3.5 clk
(2.2 ns)
4kB 3.5 clk
(2.2 ns)
3.1 clk
(1.9 ns)
5.1 clk
(1.7 ns)
3.5 clk
(2.2 ns)
3.1 clk
(1.9 ns)
3.5 clk
(2.2 ns)
16kB 3.3 clk
(2.1 ns)
3.1 clk
(1.9 ns)
5.6 clk
(1.9 ns)
3.3 clk
(2.1 ns)
3.1 clk
(1.9 ns)
3.5 clk
(2.2 ns)
64kB 16.3 clk
(10.2 ns)
14.5 clk
(9.1 ns)
5.6 clk
(12.1 ns)
16.3 clk
(10.2 ns)
14.5 clk
(9.1 ns)
16.1 clk
(10.1 ns)
256kB 17.9 clk
(11.2 ns)
16.0 clk
(10.0 ns)
6.7 clk
(15.9 ns)
17.9 clk
(11.2 ns)
16.0 clk
(10.0 ns)
18.2 clk
(11.4 ns)
1MB 21.4 clk
(13.4 ns)
20.4 clk
(12.8 ns)
391.5 clk
(133.5 ns)
21.4 clk
(13.4 ns)
20.4 clk
(12.8 ns)
21.3 clk
(13.3 ns)
4MB 166.5 clk
(104.0 ns)
153.2 clk
(95.7 ns)
444.2 clk
(151.4 ns)
166.5 clk
(104.0 ns)
153.2 clk
(95.7 ns)
167.1 clk
(104.4 ns)
16MB 187.7 clk
(117.3 ns)
171.5 clk
(107.2 ns)
468.5 clk
(159.7 ns)
187.7 clk
(117.3 ns)
171.5 clk
(107.2 ns)
187.4 clk
(117.1 ns)
64MB 197.0 clk
(123.1 ns)
182.1 clk
(113.8 ns)
515.6 clk
(175.8 ns)
197.0 clk
(123.1 ns)
182.1 clk
(113.8 ns)
198.1 clk
(123.8 ns)
Cache
(Speed Factor)
5941 MB/s
(13.5)
5737 MB/s
(14.5)
6117 MB/s
(13.5)
10066 MB/s
(50.7)
9858 MB/s
(58.0)
12101 MB/s
(32.9)

各テスト比較

デュアルチャンネル化で意味がありそうな Pentium Dual-Core 環境で、いろいろと計測してみます。 HDD の状態を両方の環境で完全一致させる事が困難なので、HDD の数値とそれを考慮に入れるトータルの数値は参考と見た方が好いでしょう。

HDBENCH Ver.2.610

まともに測れていない。

解像度
1024×768 (60Hz)
ALLTextScrollDDReadWriteMemoryDrive
Single
32bit カラー67717160676178398139011139210714871972624939441829197200.10:10MB
16bit カラー71133160676178372308851843021317222296522293944182932
Dual
32bit カラー69148161585179643139001139010717871981919939441841347200.10:10MB
16bit カラー73424161453179315308751838921278223298191993944183905
他のドライブについて
ReadWriteDrive
Single18513921851392ERAM:10MB
Dual18513921851392

HDBENCH Ver.3.30

メモリの数値のみ、それらしい結果が出ている。HDD については、前述の通り参考値。


プログラムする方法tkを-350
解像度
1024×768 (60Hz)
ALLIntegerFloatMemory
Read
Memory
Wright
Memory
RW
Direct
Draw
RectangleTextEllipseBitBltReadWriteCopyDrive
Single
32bit カラー673312279951519401192448555414632919933831054940456822069707305707200.10:100MB
16bit カラー670302282201519391159328278312385729183284733726082689567042530468
Dual
32bit カラー778822288601522961273848987117653719932331124876357361577929691547200.10:100MB
16bit カラー788292288601522961273339594818821029183434762725776744177704966564
他のドライブについて
ReadWriteCopyDrive
Single10893611077894264063ERAM:100MB
Dual10778941077894269169

HDBENCH Ver.3.40 β6

HDBENCH 系で唯一 RAM ドライブについてそれなりに計測できるバージョンだが、それっぽい結果が出ている。

ReadWriteRandom
Read
Random
Write
Drive
Single99224810611391868613962406ERAM:100MB
Dual1091296112116718686131123217

CrystalMark 2004R3

前述のメモリ能力の追認と、HDBENCH で見られた RAM ドライブの能力差だけが確定的。


どのようにバーコードスキャナが動作し
Display Mode
1024×768 32bit (Normal)
SingleDual
CrystalMark5306753475
ALU total1438214402
Fibonacci 58935912
Napierian 26902697
Eratosthenes19821979
QuickSort 37953792
FPU total1713816361
MikoFPU 1551827
RandMeanSS 1043610371
FFT 26802692
Mandelbrot 24492449
MEM total84909317
Read 3838.34 MB/s (3838)4114.17 MB/s (4114)
Write 1076.97 MB/s (1076)1495.11 MB/s (1495)
Read/Write 1338.32 MB/s (1338)1481.53 MB/s (1481)
Cache 22163.78 MB/s (2216)22053.24 MB/s (2205)
HDD (7200.10) total86449208
Read 68.95 MB/s (2758)71.76 MB/s (2870)
Write 65.98 MB/s (2639)69.17 MB/s (2766)
RRead512K 32.49 MB/s (1299)36.72 MB/s (1468)
RWrite512K 28.64 MB/s (1145)31.76 MB/s (1270)
RRead64K 6.91 MB/s (276)7.70 MB/s (308)
RWrite64K 13.18 MB/s (527)13.17 MB/s (526)
HDD (RAMDRIVE) total7161275651
Read 1000.74 MB/s (10503)1059.64 MB/s (10798)
Write 1019.13 MB/s (10595)1096.79 MB/s (10983)
RRead512K 1793.40 MB/s (14467)1849.48 MB/s (14747)
RWrite512K 891.31 MB/s (9956)1197.54 MB/s (11487)
RRead64K 2035.46 MB/s (15677)2067.88 MB/s (15839)
RWrite64K 982.89 MB/s (10414)1259.56 MB/s (11797)
GDI total28202592
Text 152152
Square 548546
Circle 17211722
BitBlt 399172
D2D total10161018
Sprite 10 58.58fps (5)58.58fps (5)
Sprite 100 50.12fps (50)50.26fps (50)
Sprite 500 30.68fps (153)30.83fps (154)
Sprite 100020.65fps (206)20.79fps (207)
Sprite 50005.85fps (292)5.85fps (292)
Sprite 100003.10fps (310)3.10fps (310)
OGL total577577
Scene 1 Score 542542
Lines 5724300057399000
Scene 1 CPUs 1616
Scene 2 Score 3535
Polygons 261000261000
Scene 2 CPUs 11

Final Reality

現在の環境では公正な結果が出ないので、単なるお遊びデータ。


Sound
無し
SingleDual
Radial blur5N296.91 rips41.067318.39 rips44.037
Chaos zoomer5N537.56 rips26.120591.82 rips28.757
25 Pixel5N163.59 kpps5.228174.13 kpps5.565
Robots5N10.45 rips2.70711.60 rips3.005
Fillrate5N7.64 MPps1.6548.34 MPps1.805
City scene5N10.98 rips2.72412.00 rips2.978
Video card bus transfer5N89.41 MBps2.84795.04 MBps3.026
Direct3D bus transfer5N1404.87 MBps120.0751582.18 MBps135.229
Visual appearance51.85 percent51.85 percent
Overall 3D1.492 1.559
Overall 2D33.594 36.397
Overall bus rate38.015 42.687
OVERALL SCORE16.601 18.179

PCMark 04 Build1.30

SingleDouble
PCMark ScoreN/AN/A
Multithreaded Test 1
File Compression 6.013 MB/s 6.049 MB/s
File Encryption 50.790 MB/s50.908 MB/s
Multithreaded Test 2
File Decompression 50.951 MB/s51.230 MB/s
Image Processing 23.421 MPixels/s 23.319 MPixels/s
Multithreaded Test 3
Virus Scanning 4617.282 MB/s 4438.902 MB/s
Grammar Check 4.058 KB/s 4.193 KB/s
Other Test
File Decryption 51.128 MB/s 51.099 MB/s
Audio Conversion 2894.056 KB/s 2890.616 KB/s
Web Page Rendering 5.893 pages/s5.936 pages/s
WMV Video Compression67.691 fps66.770 fps
DivX Video Compression73.924 fps77.513 fps
Physics Calculation and 3DN/AN/A
Graphics Memory - 64 Lines127.019 fps126.979 fps

PCMark 05 Build1.10

SingleDouble
PCMark ScoreN/AN/A
HDD - XP Startup10.053 MB/s10.077 MB/s
Physics and 3DN/AN/A
2D - Transparent WindowsN/AN/A
3D - Pixel ShaderN/AN/A
Web Page Rendering 2.644 pages/s 2.651 pages/s
File Decryption 44.077 MB/s44.079 MB/s
2D - Graphics Memory 64 lines60.084 fps 60.050 fps
HDD - General Usage 5.788 MB/s5.813 MB/s
Multithreaded Test 1
Audio Compression 1672.638 KB/s1624.228 KB/s
Video Encoding 284.908 KB/s301.345 KB/s
Multithreaded Test 2
Text edit 95.919 pages/s 95.890 pages/s
Image Decompression 22.616 MPixels/s22.638 MPixels/s
Multithreaded Test 3
File Compression 3.798 MB/s3.765 MB/s
File Encryption 21.516 MB/s22.316 MB/s
HDD - Virus Scan 62.105 MB/s58.484 MB/s
Memory Latency - Random 16MB9.212 MAccesses/s9.326 MAccesses/s

GogoWinBench Ver.1.28

GOGO DLL ver.2.39b for only bench (Feb 28 2002)
肝腎のメモリの能力差については何とも言い難い結果。


MMXSSE音響解析スレッドSingle(倍速)Dual(倍速)
×××1 73.7473.35
××1 83.9983.46
×1 207.95206.36
×××2 142.12141.10
××2 160.61160.40
×2 378.27376.73
××1 26.5026.38
×1 29.1629.05
1 49.6749.44
××2 52.2152.16
×2 57.7357.51
2 93.4493.07

GogoBench Ver.3.11a

GOGO DLL ver.3.11(Dec 28 2002)

MMXSSESSE2QSingle(倍速)Dual(倍速)
×××0 28.9329.05
××0 33.8333.82
×0 41.6541.78
0 42.5042.60
×××5 53.0752.96
××5 54.7554.05
×5 141.28138.91
5 145.55143.59
×××8 63.1662.41
××8 63.8563.37
×8 206.45203.63
8 212.30210.36

GogoBench Ver.3.13

GOGO DLL ver.3.13(May 25 2004)

MMXSSESSE2QSingle(倍速)Dual(倍速)
×××0 29.1529.26
××0 35.2235.22
×0 41.6241.62
0 42.3942.42
×××5 58.8859.28
××5 60.9361.04
×5 140.51140.54
5 144.31144.75
×××8 71.5771.72
××8 72.7072.59
×8 203.85205.97
8 210.43212.37

スーパーπ Ver.1.1

Dothan 2GHz より 400MHz 遅くてシングルスレッドであるにも関わらず 9秒の差を付けて勝利している点に、Core 2 Duo との相性の良さが垣間見える。


104万桁

まとめ

  • メインメモリにアクセスするのは基本的に CPU かローエンドの GPU なので、メモリのバス速度と FSB との差を埋める以上の効力は無い。
  • その差が大きくないと、効果もほとんど見えないのではないか?
  • 2枚差しシングル動作の場合にオーバーヘッドが有る様な無い様な何とも言えない結果が出ており、あえてデュアルチャンネルを避ける必要は無い。
  • 処理するデータの流れから考えると、メインメモリをグラフィックメモリとして利用する場合には少し効果が有るかも(もちろんバス速度に差が有る場合)。
  • 全て同じ速度の場合になるとまた結果が変わるかもしれないが、見た目に転送速度の差が有りそうな状態でも実使用上で差が見えない以上、神経質になる必要性は無い。

以上の様に考えるべき物と結論付けられそうです。



These are our most popular posts:

デュアルチャンネル(デュアルチャネル)メモリに意味はあるのか? : 月見 ...

デュアルチャンネルメモリの効果を疑問視する声が時々聞かれます。 PC Watch: 元麻布春男の週刊PCホットライン:Intelのフレックスモードとメモリ増設. 上記の様に メジャーな所でも「意味無し」と云ってしまっている様な物の記事が出たりして、どうしても 効果が ... read more

デュアルチャネル - Wikipedia

デュアルチャネルまたはデュアルチャンネルは、広義には同一の規格の通信 インターフェイスを二重に備えること。 ... 例えば、Intel Core 2 で FSB が 6.4GB/s ( 800MHz) の場合、シングルチャネルの DDR2-800 (6.4GB/s) と同速度であり、 デュアルチャネルの意味はなく、速度はごくわずかしか向上しない、又は全く ... メモリ 増設の際、既設のメモリと併用する前提でデュアルチャネル動作スロットに新規のメモリ を増設した場合、デュアル ... read more

Dual Channel DDRとは【デュアルチャネルDDR】 - 意味/解説/説明/定義 ...

DDR SDRAMのメモリモジュールを2枚1組で使用して同時に読み書きすることで、 データ転送速度を向上させること。RDRAMなどを利用する場合に比べ、比較的安価で データ転送速度の向上を見込める。 デュアルチャネルとは、同じ規格・同じ容量のメモリ を二 ... read more

メモリの性能の説明

メモリってなに? ・, メモリの性能とは? メモリ容量 メモリの種類 FSB(メモリーバス) デュアルチャンネル(デュアルチャネル/トリプル ... メモリとは、「Memory(メモリー)」の事 で、つまり「記憶」という意味です。 ... データを保存するパーツには「ハードディスク(HDD )」というものがあり、こちらはデータを長期的に保存できますが、カセットテープやビデオ ... read more

0 件のコメント:

コメントを投稿

登録 コメントの投稿 [Atom]

<< ホーム