デュアルチャネルメモリは何を意味する
デュアルチャンネル(デュアルチャネル)メモリに意味はあるのか? : 月見酒(MINT's World)
解説
デュアルチャンネルメモリの効果を疑問視する声が時々聞かれます。
上記の様にメジャーな所でも「意味無し」と云ってしまっている様な物の記事が出たりして、どうしても効果が疑われる要素が見えてしまっています。
丁度実験に向いているサンプルが揃ったので、詳しく検証してみることにしました。
環境と設定
- 実験ハードウェア構成
-
BASE NEC「Express5800/110Gd(N8100-1279Y)」 CHIPSET Intel 3000 + ICH7R CPU - Intel「Celeron D 341(Prescott-V 2.93GHz)」
- Intel「Pentium Dual-Core E2140(Allendale 1.80GHz)」
RAM Micron「MT9HTF6472AY-667D4(512MB)」× 2 GRAPHIC XGI「Volari Z9s」(オンボード) SATA HDD HGST「Deskstar® 7K160 HDS721680PLA380」 - OS
- Windows XP Professional + Service Pack 3 RC2(Build:3311) + DirectX 9.0c + Internet Explorer 6 Service Pack 1
- システムの設定
- nLite によって、余計なドライバやコンポーネントは削ってある。
- クラシック表示。
- 一般的に早くなるだろうと謂われている設定。
- スクリーンフォントの縁を滑らかにする。
- BIOS 設定
- BIOS Ver.0024 クアッドコア対応版
- AHCI モード有効
- EIST 無効
- グラフィックボード設定
ドライバー Ver.1.08.03。調整項目無し。
etc…
基本性能比較
まず、メモリ性能のみを比較してみます。 OS の再インストールはせず、その都度パーツの組み合わせだけをいじって計測しています。 最高値を求めている訳ではなく同じ条件で比較さえできれば構わないので、多少他の実験等で汚した状態をそのまま使っています。
CrystalMark 2004R3 v0.9.124.404b
Celeron D 側は、FSB が 533MHz であるため、Read がこれで実効値の限界。 Write だけがデュアルチャンネル化で改善したと見ると、自然な様に思えます。
一方 Pentium Dual-Core の方は、キャッシュの高効率ぶりが光るのですが、メモリ本体の転送速度は Write の数値にやや疑問。 Single 2枚刺しには、何かオーバーヘッドでもあるのでしょうか? Read の方は、一往 DDR667 と FSB 800MHz のどちらで頭を打つかで二分されている様に見えます。
Celeron D 341 + DDR533 LT = 4,4,4,12 | Pentium DC E2140 + DDR667 LT = 5,5,5,15 | |||||
---|---|---|---|---|---|---|
1枚 | Single | Dual | 1枚 | Single | Dual | |
Total | 6995 | 6965 | 7222 | 8061 | 7360 | 9356 |
Read | 3395.11 MB/s (3395) | 3333.97 MB/s (3333) | 3386.46 MB/s (3386) | 3844.81 MB/s (3844) | 3781.64 MB/s (3781) | 4119.30 MB/s (4119) |
Write | 1411.20 MB/s (1411) | 1428.26 MB/s (1428) | 1560.65 MB/s (1560) | 987.99 MB/s (987) | 690.46 MB/s (690) | 1545.32 MB/s (1545) |
Read/Write | 1377.17 MB/s (1377) | 1390.39 MB/s (1390) | 1463.54 MB/s (1463) | 996.63 MB/s (996) | 664.43 MB/s (664) | 1487.01 MB/s (1487) |
Cache | 7907.24 MB/s (790) | 7921.61 MB/s (792) | 7913.06 MB/s (791) | 22124.78 MB/s (2212) | 22038.52 MB/s (2203) | 21835.41 MB/s (2183) |
SiSoftware Sandra 11.33
Celeron D でデュアルチャンネルを使った時のレイテンシーが、他と全く違う傾向になっている原因は不明。 キャッシュの値が、デュアルチャンネルでは増えている点も奇妙ですが、こちらはそういう計測の仕組みなのかもしれません。
転送速度については、CrystalMark 2004R3 と似た傾向のデータが出ており、Core 2 系のキャッシュ効率が高い事も一致する点で、基礎データはほぼ正しいと思われます。 Celeron D のトレースキャッシュの威力も見え隠れしていますが、総合的には厳しい様ですね。 また、デュアルチャンネル時に 1MB 以上が急激に遅くなっている所が、謎めいています…。
フラッシュメモリにする方法Celeron D 341 + DDR533 LT = 4,4,4,12 | Pentium DC E2140 + DDR667 LT = 5,5,5,15 | |||||
---|---|---|---|---|---|---|
1枚 | Single | Dual | 1枚 | Single | Dual | |
Integer STREAM | 3334 MB/s | 3288 MB/s | 3351 MB/s | 3842 MB/s | 3736 MB/s | 4223 MB/s |
Float STREAM | 3340 MB/s | 3296 MB/s | 3400 MB/s | 3800 MB/s | 3758 MB/s | 4216 MB/s |
Latency (Speed Factor) | 174ns (100.8) | 176ns (102.3) | 176ns (101.4) | 123ns (56.5) | 114ns (57.7) | 124ns (56.2) |
1kB | 3.5 clk (2.2 ns) | 3.2 clk (2.0 ns) | 5.1 clk (1.7 ns) | 3.5 clk (2.2 ns) | 3.2 clk (2.0 ns) | 3.5 clk (2.2 ns) |
4kB | 3.5 clk (2.2 ns) | 3.1 clk (1.9 ns) | 5.1 clk (1.7 ns) | 3.5 clk (2.2 ns) | 3.1 clk (1.9 ns) | 3.5 clk (2.2 ns) |
16kB | 3.3 clk (2.1 ns) | 3.1 clk (1.9 ns) | 5.6 clk (1.9 ns) | 3.3 clk (2.1 ns) | 3.1 clk (1.9 ns) | 3.5 clk (2.2 ns) |
64kB | 16.3 clk (10.2 ns) | 14.5 clk (9.1 ns) | 5.6 clk (12.1 ns) | 16.3 clk (10.2 ns) | 14.5 clk (9.1 ns) | 16.1 clk (10.1 ns) |
256kB | 17.9 clk (11.2 ns) | 16.0 clk (10.0 ns) | 6.7 clk (15.9 ns) | 17.9 clk (11.2 ns) | 16.0 clk (10.0 ns) | 18.2 clk (11.4 ns) |
1MB | 21.4 clk (13.4 ns) | 20.4 clk (12.8 ns) | 391.5 clk (133.5 ns) | 21.4 clk (13.4 ns) | 20.4 clk (12.8 ns) | 21.3 clk (13.3 ns) |
4MB | 166.5 clk (104.0 ns) | 153.2 clk (95.7 ns) | 444.2 clk (151.4 ns) | 166.5 clk (104.0 ns) | 153.2 clk (95.7 ns) | 167.1 clk (104.4 ns) |
16MB | 187.7 clk (117.3 ns) | 171.5 clk (107.2 ns) | 468.5 clk (159.7 ns) | 187.7 clk (117.3 ns) | 171.5 clk (107.2 ns) | 187.4 clk (117.1 ns) |
64MB | 197.0 clk (123.1 ns) | 182.1 clk (113.8 ns) | 515.6 clk (175.8 ns) | 197.0 clk (123.1 ns) | 182.1 clk (113.8 ns) | 198.1 clk (123.8 ns) |
Cache (Speed Factor) | 5941 MB/s (13.5) | 5737 MB/s (14.5) | 6117 MB/s (13.5) | 10066 MB/s (50.7) | 9858 MB/s (58.0) | 12101 MB/s (32.9) |
各テスト比較
デュアルチャンネル化で意味がありそうな Pentium Dual-Core 環境で、いろいろと計測してみます。 HDD の状態を両方の環境で完全一致させる事が困難なので、HDD の数値とそれを考慮に入れるトータルの数値は参考と見た方が好いでしょう。
HDBENCH Ver.2.610
まともに測れていない。
- 解像度
- 1024×768 (60Hz)
ALL | 浮 | 整 | 矩 | 円 | Text | Scroll | DD | Read | Write | Memory | Drive | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Single | ||||||||||||
32bit カラー | 67717 | 160676 | 178398 | 13901 | 11392 | 10714 | 87 | 19 | 72624 | 93944 | 182919 | 7200.10:10MB |
16bit カラー | 71133 | 160676 | 178372 | 30885 | 18430 | 21317 | 222 | 29 | 65222 | 93944 | 182932 | 〃 |
Dual | ||||||||||||
32bit カラー | 69148 | 161585 | 179643 | 13900 | 11390 | 10717 | 87 | 19 | 81919 | 93944 | 184134 | 7200.10:10MB |
16bit カラー | 73424 | 161453 | 179315 | 30875 | 18389 | 21278 | 223 | 29 | 81919 | 93944 | 183905 | 〃 |
他のドライブについて
Read | Write | Drive | |
---|---|---|---|
Single | 1851392 | 1851392 | ERAM:10MB |
Dual | 1851392 | 1851392 | 〃 |
HDBENCH Ver.3.30
メモリの数値のみ、それらしい結果が出ている。HDD については、前述の通り参考値。
プログラムする方法tkを-350- 解像度
- 1024×768 (60Hz)
ALL | Integer | Float | Memory Read | Memory Wright | Memory RW | Direct Draw | Rectangle | Text | Ellipse | BitBlt | Read | Write | Copy | Drive | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Single | |||||||||||||||
32bit カラー | 67331 | 227995 | 151940 | 119244 | 85554 | 146329 | 19 | 9338 | 3105 | 4940 | 45 | 68220 | 69707 | 30570 | 7200.10:100MB |
16bit カラー | 67030 | 228220 | 151939 | 115932 | 82783 | 123857 | 29 | 18328 | 4733 | 7260 | 82 | 68956 | 70425 | 30468 | 〃 |
Dual | |||||||||||||||
32bit カラー | 77882 | 228860 | 152296 | 127384 | 89871 | 176537 | 19 | 9323 | 3112 | 4876 | 35 | 73615 | 77929 | 69154 | 7200.10:100MB |
16bit カラー | 78829 | 228860 | 152296 | 127333 | 95948 | 188210 | 29 | 18343 | 4762 | 7257 | 76 | 74417 | 77049 | 66564 | 〃 |
他のドライブについて
Read | Write | Copy | Drive | |
---|---|---|---|---|
Single | 1089361 | 1077894 | 264063 | ERAM:100MB |
Dual | 1077894 | 1077894 | 269169 | 〃 |
HDBENCH Ver.3.40 β6
HDBENCH 系で唯一 RAM ドライブについてそれなりに計測できるバージョンだが、それっぽい結果が出ている。
Read | Write | Random Read | Random Write | Drive | |
---|---|---|---|---|---|
Single | 992248 | 1061139 | 1868613 | 962406 | ERAM:100MB |
Dual | 1091296 | 1121167 | 1868613 | 1123217 | 〃 |
CrystalMark 2004R3
前述のメモリ能力の追認と、HDBENCH で見られた RAM ドライブの能力差だけが確定的。
どのようにバーコードスキャナが動作し- Display Mode
- 1024×768 32bit (Normal)
Single | Dual | |
---|---|---|
CrystalMark | 53067 | 53475 |
ALU total | 14382 | 14402 |
Fibonacci | 5893 | 5912 |
Napierian | 2690 | 2697 |
Eratosthenes | 1982 | 1979 |
QuickSort | 3795 | 3792 |
FPU total | 17138 | 16361 |
MikoFPU | 1551 | 827 |
RandMeanSS | 10436 | 10371 |
FFT | 2680 | 2692 |
Mandelbrot | 2449 | 2449 |
MEM total | 8490 | 9317 |
Read | 3838.34 MB/s (3838) | 4114.17 MB/s (4114) |
Write | 1076.97 MB/s (1076) | 1495.11 MB/s (1495) |
Read/Write | 1338.32 MB/s (1338) | 1481.53 MB/s (1481) |
Cache | 22163.78 MB/s (2216) | 22053.24 MB/s (2205) |
HDD (7200.10) total | 8644 | 9208 |
Read | 68.95 MB/s (2758) | 71.76 MB/s (2870) |
Write | 65.98 MB/s (2639) | 69.17 MB/s (2766) |
RRead512K | 32.49 MB/s (1299) | 36.72 MB/s (1468) |
RWrite512K | 28.64 MB/s (1145) | 31.76 MB/s (1270) |
RRead64K | 6.91 MB/s (276) | 7.70 MB/s (308) |
RWrite64K | 13.18 MB/s (527) | 13.17 MB/s (526) |
HDD (RAMDRIVE) total | 71612 | 75651 |
Read | 1000.74 MB/s (10503) | 1059.64 MB/s (10798) |
Write | 1019.13 MB/s (10595) | 1096.79 MB/s (10983) |
RRead512K | 1793.40 MB/s (14467) | 1849.48 MB/s (14747) |
RWrite512K | 891.31 MB/s (9956) | 1197.54 MB/s (11487) |
RRead64K | 2035.46 MB/s (15677) | 2067.88 MB/s (15839) |
RWrite64K | 982.89 MB/s (10414) | 1259.56 MB/s (11797) |
GDI total | 2820 | 2592 |
Text | 152 | 152 |
Square | 548 | 546 |
Circle | 1721 | 1722 |
BitBlt | 399 | 172 |
D2D total | 1016 | 1018 |
Sprite 10 | 58.58fps (5) | 58.58fps (5) |
Sprite 100 | 50.12fps (50) | 50.26fps (50) |
Sprite 500 | 30.68fps (153) | 30.83fps (154) |
Sprite 1000 | 20.65fps (206) | 20.79fps (207) |
Sprite 5000 | 5.85fps (292) | 5.85fps (292) |
Sprite 10000 | 3.10fps (310) | 3.10fps (310) |
OGL total | 577 | 577 |
Scene 1 Score | 542 | 542 |
Lines | 57243000 | 57399000 |
Scene 1 CPUs | 16 | 16 |
Scene 2 Score | 35 | 35 |
Polygons | 261000 | 261000 |
Scene 2 CPUs | 1 | 1 |
Final Reality
現在の環境では公正な結果が出ないので、単なるお遊びデータ。
- Sound
- 無し
Single | Dual | ||||
---|---|---|---|---|---|
Radial blur | 5N | 296.91 rips | 41.067 | 318.39 rips | 44.037 |
Chaos zoomer | 5N | 537.56 rips | 26.120 | 591.82 rips | 28.757 |
25 Pixel | 5N | 163.59 kpps | 5.228 | 174.13 kpps | 5.565 |
Robots | 5N | 10.45 rips | 2.707 | 11.60 rips | 3.005 |
Fillrate | 5N | 7.64 MPps | 1.654 | 8.34 MPps | 1.805 |
City scene | 5N | 10.98 rips | 2.724 | 12.00 rips | 2.978 |
Video card bus transfer | 5N | 89.41 MBps | 2.847 | 95.04 MBps | 3.026 |
Direct3D bus transfer | 5N | 1404.87 MBps | 120.075 | 1582.18 MBps | 135.229 |
Visual appearance | 51.85 percent | 51.85 percent | |||
Overall 3D | 1.492 | 1.559 | |||
Overall 2D | 33.594 | 36.397 | |||
Overall bus rate | 38.015 | 42.687 | |||
OVERALL SCORE | 16.601 | 18.179 |
PCMark 04 Build1.30
Single | Double | |
---|---|---|
PCMark Score | N/A | N/A |
Multithreaded Test 1 | ||
File Compression | 6.013 MB/s | 6.049 MB/s |
File Encryption | 50.790 MB/s | 50.908 MB/s |
Multithreaded Test 2 | ||
File Decompression | 50.951 MB/s | 51.230 MB/s |
Image Processing | 23.421 MPixels/s | 23.319 MPixels/s |
Multithreaded Test 3 | ||
Virus Scanning | 4617.282 MB/s | 4438.902 MB/s |
Grammar Check | 4.058 KB/s | 4.193 KB/s |
Other Test | ||
File Decryption | 51.128 MB/s | 51.099 MB/s |
Audio Conversion | 2894.056 KB/s | 2890.616 KB/s |
Web Page Rendering | 5.893 pages/s | 5.936 pages/s |
WMV Video Compression | 67.691 fps | 66.770 fps |
DivX Video Compression | 73.924 fps | 77.513 fps |
Physics Calculation and 3D | N/A | N/A |
Graphics Memory - 64 Lines | 127.019 fps | 126.979 fps |
PCMark 05 Build1.10
Single | Double | |
---|---|---|
PCMark Score | N/A | N/A |
HDD - XP Startup | 10.053 MB/s | 10.077 MB/s |
Physics and 3D | N/A | N/A |
2D - Transparent Windows | N/A | N/A |
3D - Pixel Shader | N/A | N/A |
Web Page Rendering | 2.644 pages/s | 2.651 pages/s |
File Decryption | 44.077 MB/s | 44.079 MB/s |
2D - Graphics Memory 64 lines | 60.084 fps | 60.050 fps |
HDD - General Usage | 5.788 MB/s | 5.813 MB/s |
Multithreaded Test 1 | ||
Audio Compression | 1672.638 KB/s | 1624.228 KB/s |
Video Encoding | 284.908 KB/s | 301.345 KB/s |
Multithreaded Test 2 | ||
Text edit | 95.919 pages/s | 95.890 pages/s |
Image Decompression | 22.616 MPixels/s | 22.638 MPixels/s |
Multithreaded Test 3 | ||
File Compression | 3.798 MB/s | 3.765 MB/s |
File Encryption | 21.516 MB/s | 22.316 MB/s |
HDD - Virus Scan | 62.105 MB/s | 58.484 MB/s |
Memory Latency - Random 16MB | 9.212 MAccesses/s | 9.326 MAccesses/s |
GogoWinBench Ver.1.28
GOGO DLL ver.2.39b for only bench (Feb 28 2002)
肝腎のメモリの能力差については何とも言い難い結果。
MMX | SSE | 音響解析 | スレッド | Single(倍速) | Dual(倍速) |
---|---|---|---|---|---|
× | × | × | 1 | 73.74 | 73.35 |
○ | × | × | 1 | 83.99 | 83.46 |
○ | ○ | × | 1 | 207.95 | 206.36 |
× | × | × | 2 | 142.12 | 141.10 |
○ | × | × | 2 | 160.61 | 160.40 |
○ | ○ | × | 2 | 378.27 | 376.73 |
× | × | ○ | 1 | 26.50 | 26.38 |
○ | × | ○ | 1 | 29.16 | 29.05 |
○ | ○ | ○ | 1 | 49.67 | 49.44 |
× | × | ○ | 2 | 52.21 | 52.16 |
○ | × | ○ | 2 | 57.73 | 57.51 |
○ | ○ | ○ | 2 | 93.44 | 93.07 |
GogoBench Ver.3.11a
GOGO DLL ver.3.11(Dec 28 2002)
MMX | SSE | SSE2 | Q | Single(倍速) | Dual(倍速) |
---|---|---|---|---|---|
× | × | × | 0 | 28.93 | 29.05 |
○ | × | × | 0 | 33.83 | 33.82 |
○ | ○ | × | 0 | 41.65 | 41.78 |
○ | ○ | ○ | 0 | 42.50 | 42.60 |
× | × | × | 5 | 53.07 | 52.96 |
○ | × | × | 5 | 54.75 | 54.05 |
○ | ○ | × | 5 | 141.28 | 138.91 |
○ | ○ | ○ | 5 | 145.55 | 143.59 |
× | × | × | 8 | 63.16 | 62.41 |
○ | × | × | 8 | 63.85 | 63.37 |
○ | ○ | × | 8 | 206.45 | 203.63 |
○ | ○ | ○ | 8 | 212.30 | 210.36 |
GogoBench Ver.3.13
GOGO DLL ver.3.13(May 25 2004)
MMX | SSE | SSE2 | Q | Single(倍速) | Dual(倍速) |
---|---|---|---|---|---|
× | × | × | 0 | 29.15 | 29.26 |
○ | × | × | 0 | 35.22 | 35.22 |
○ | ○ | × | 0 | 41.62 | 41.62 |
○ | ○ | ○ | 0 | 42.39 | 42.42 |
× | × | × | 5 | 58.88 | 59.28 |
○ | × | × | 5 | 60.93 | 61.04 |
○ | ○ | × | 5 | 140.51 | 140.54 |
○ | ○ | ○ | 5 | 144.31 | 144.75 |
× | × | × | 8 | 71.57 | 71.72 |
○ | × | × | 8 | 72.70 | 72.59 |
○ | ○ | × | 8 | 203.85 | 205.97 |
○ | ○ | ○ | 8 | 210.43 | 212.37 |
スーパーπ Ver.1.1
Dothan 2GHz より 400MHz 遅くてシングルスレッドであるにも関わらず 9秒の差を付けて勝利している点に、Core 2 Duo との相性の良さが垣間見える。
- 104万桁
まとめ
- メインメモリにアクセスするのは基本的に CPU かローエンドの GPU なので、メモリのバス速度と FSB との差を埋める以上の効力は無い。
- その差が大きくないと、効果もほとんど見えないのではないか?
- 2枚差しシングル動作の場合にオーバーヘッドが有る様な無い様な何とも言えない結果が出ており、あえてデュアルチャンネルを避ける必要は無い。
- 処理するデータの流れから考えると、メインメモリをグラフィックメモリとして利用する場合には少し効果が有るかも(もちろんバス速度に差が有る場合)。
- 全て同じ速度の場合になるとまた結果が変わるかもしれないが、見た目に転送速度の差が有りそうな状態でも実使用上で差が見えない以上、神経質になる必要性は無い。
以上の様に考えるべき物と結論付けられそうです。
0 件のコメント:
コメントを投稿
登録 コメントの投稿 [Atom]
<< ホーム