大規模分散処理用フレームワークの「Hadoop」が、Amazon EC2で簡単に利用できるようにサービス化されたようだ。
その名も「Amazon Elastic MapReduce」
「Hadoop」は、Googleの基盤(MapReduce)を参考に作られたクローンであり、オープンソースソフトウェアです。大量のデータ処理を分散処理するためのプラットフォームなので、Hadoopの仕組みにのっとって機能を実装さえすれば、自動で分散処理が行えるというもの。
みたところ、APIを使った、コマンドラインツールや、GUIの"AWS Management Console"から、簡単に利用できるみたいで、Amazon S3上に配置したデータを使って、APIやGUIから、MapReduce操作(Job操作)が可能、かつモニタリングもできるみたいです。
Amazon S3がHDFS(Hadoop Distributed File System)となるわけですね。
料金は、Amazon EC2やAmazon S3の利用料に加えて、1インスタンスあたりに$0.015/hour〜が追加で必要になる、といったところですね。
ちなみに、利用の流れとしては、以下のデモムービーが参考になります!
http://s3.amazonaws.com/awsVideos/AmazonElasticMapReduce/AmazonElasticMapReduce.html
いよいよ、大規模データ処理を雲の向こう側で、といったクラウドコンピューティングをフル活用できる基盤が整ってきましたね。いよいよエンタープライズでも使いやすい、というか可能性が1つ開かれた感を受けています。
こういった動きは、これからも注目ですね。
また、近日中に触ってみて、改めて使い方を紹介したいと思います。
参考
- Amazon EMR - Amazon Web Services
- Announcing Amazon Elastic MapReduce | AWS News Blog
- アマゾン、ウィザードだけで使えるHadoopサービス開始 − @IT
まとめ

クラウドAMAZON EC2/S3のすべて (ITpro BOOKs)
- 作者: 並河祐貴,安達輝雄,ITpro/日経SYSTEMS
- 出版社/メーカー: 日経BP社
- 発売日: 2009/11/05
- メディア: 単行本
- 購入: 4人 クリック: 372回
- この商品を含むブログ (18件) を見る

Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)
- 作者: 西田圭介
- 出版社/メーカー: 技術評論社
- 発売日: 2008/03/28
- メディア: 単行本(ソフトカバー)
- 購入: 47人 クリック: 1,166回
- この商品を含むブログ (374件) を見る