新しいHPC向けAmazon EC2インスタンス"c3.8xlarge"が大セールしていたので簡単なベンチマークをとった

気がついたら、1ヶ月以上ブログ書いてなかったのでサクッと。タイトルは半分釣り、半分は本当。


昨日、AWSから新しい世代のHPC向けのAmazon EC2インスタンスが発表されました。"c3.*"からはじまるやつです。

安ッ!

で、今朝、下記のブログで知ったのですが、Spot Request(スポットインスタンス)の相場を見ると、"c3.8xlarge"が東京リージョンの1つのZoneで「$0.0001」という状態www


"c3.8xlarge"といえば、Intel Xeon E5-2680 v2 (2.80GHz)といったIvy Bridge世代のアーキテクチャのCPUを使っていて、Xeonの世界でいうと最新のCPU。

というところで、マッツォさんが上記インスタンスのベンチマークをとってみるとおっしゃってたので、それまでのつなぎということで、fioUnixBenchで、インスタンスが特価のうちに、簡単にベンチマークをとってみました。
何かの参考までに。

fio

基本的な計測方法は、以下のエントリで紹介したやり方と同じです。


"c3.8xlarge"には、320GBのSSD2枚積まれているので、それら2つをソフトウェアRAID0で束ねて計測してみました。

Benchmark Type Bandwidth IOPS
4k, sequential read 284.8MB/s 72907
4k, sequential write 156.5MB/s 40058
4k, randam read 277.0MB/s 70902
4k, randam write 157.7MB/s 40376
32m, sequential read 923.9MB/s 28
32m, sequential write 857.8MB/s 26


噂の高速SSDを積んだAmazon EC2インスタンスのI/Oベンチマークをとってみた - 元RX-7乗りの適当な日々」この時に使った"hi1.4xlarge"のSSDと比べて、読み込み性能は落ちているものの、書き込み性能はシーケンシャル・ランダムともに倍近くのIOPSが出ています。
帯域のスループットについては、900MB/sec前後というところで、"hi1.4xlarge"で計測した時には及ばないものの十分な性能といえそうです。


HPC向けということで、CPUに着目されがちかもしれませんが、ディスクI/Oが大きい側面においても、SSDが採用されているということで、ランダムアクセスについても大きな性能が使えるのはよいですね。

尚、"hi1.4xlarge"についても、上記エントリが1年以上前というところで、今計測すると、また変わった結果になってるかもしれないので、ご参考までに。

UnixBench

こちらは、スコアのみ載せておきますね。

   #    #  #    #  #  #    #          #####   ######  #    #   ####   #    #
   #    #  ##   #  #   #  #           #    #  #       ##   #  #    #  #    #
   #    #  # #  #  #    ##            #####   #####   # #  #  #       ######
   #    #  #  # #  #    ##            #    #  #       #  # #  #       #    #
   #    #  #   ##  #   #  #           #    #  #       #   ##  #    #  #    #
    ####   #    #  #  #    #          #####   ######  #    #   ####   #    #

   Version 5.1.3                      Based on the Byte Magazine Unix Benchmark

   Multi-CPU version                  Version 5 revisions by Ian Smith,
                                      Sunnyvale, CA, USA
   January 13, 2011                   johantheghost at yahoo period com

1 parallel

Benchmark Run: Fri Nov 15 2013 06:15:05 - 06:42:53
32 CPUs in system; running 1 parallel copy of tests

Dhrystone 2 using register variables       36364023.1 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     2253.5 MWIPS (9.6 s, 7 samples)
Execl Throughput                               1457.3 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks        252994.1 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           64724.5 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        924402.0 KBps  (30.0 s, 2 samples)
Pipe Throughput                              334377.2 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                  42925.0 lps   (10.0 s, 7 samples)
Process Creation                               2824.8 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   3546.7 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   1483.8 lpm   (60.0 s, 2 samples)
System Call Overhead                         310765.9 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   36364023.1   3116.0
Double-Precision Whetstone                       55.0       2253.5    409.7
Execl Throughput                                 43.0       1457.3    338.9
File Copy 1024 bufsize 2000 maxblocks          3960.0     252994.1    638.9
File Copy 256 bufsize 500 maxblocks            1655.0      64724.5    391.1
File Copy 4096 bufsize 8000 maxblocks          5800.0     924402.0   1593.8
Pipe Throughput                               12440.0     334377.2    268.8
Pipe-based Context Switching                   4000.0      42925.0    107.3
Process Creation                                126.0       2824.8    224.2
Shell Scripts (1 concurrent)                     42.4       3546.7    836.5
Shell Scripts (8 concurrent)                      6.0       1483.8   2473.1
System Call Overhead                          15000.0     310765.9    207.2
                                                                   ========
System Benchmarks Index Score                                         528.7

16 parallel

Benchmark Run: Fri Nov 15 2013 06:42:53 - 07:11:01
32 CPUs in system; running 16 parallel copies of tests

Dhrystone 2 using register variables      526181203.9 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                    35062.2 MWIPS (9.7 s, 7 samples)
Execl Throughput                              10787.7 lps   (29.9 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks        369124.4 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           92971.3 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks       1208334.5 KBps  (30.0 s, 2 samples)
Pipe Throughput                             5178081.6 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 380450.6 lps   (10.0 s, 7 samples)
Process Creation                              17695.7 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                  22406.4 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   2874.4 lpm   (60.2 s, 2 samples)
System Call Overhead                        3579896.9 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0  526181203.9  45088.4
Double-Precision Whetstone                       55.0      35062.2   6375.0
Execl Throughput                                 43.0      10787.7   2508.8
File Copy 1024 bufsize 2000 maxblocks          3960.0     369124.4    932.1
File Copy 256 bufsize 500 maxblocks            1655.0      92971.3    561.8
File Copy 4096 bufsize 8000 maxblocks          5800.0    1208334.5   2083.3
Pipe Throughput                               12440.0    5178081.6   4162.4
Pipe-based Context Switching                   4000.0     380450.6    951.1
Process Creation                                126.0      17695.7   1404.4
Shell Scripts (1 concurrent)                     42.4      22406.4   5284.5
Shell Scripts (8 concurrent)                      6.0       2874.4   4790.7
System Call Overhead                          15000.0    3579896.9   2386.6
                                                                   ========
System Benchmarks Index Score                                        2830.3


UnixBenchの結果については、下記エントリにいくつか載せていますので、比較の参考にしてください。


それでは!=͟͟͞͞(๑•̀=͟͟͞͞(๑•̀д•́=͟͟͞͞(๑•̀д•́๑)=͟͟͞͞(๑•̀д•́




まとめ


クラウドAMAZON EC2/S3のすべて (ITpro BOOKs)

クラウドAMAZON EC2/S3のすべて (ITpro BOOKs)