クラウド基盤での大規模データ処理の基礎とプログラミング実践講座
Hadoopなどクラウドを用いたストリーム処理を、実際にプログラミングして体験し、理解を深めよう!
クラウド基盤での大規模データ処理の基礎とプログラミング実践講座
〜1人1台PC実習付〜 ※PCは主催者にて用意いたします。
共催:R&D支援センター
日時:2011年10月31日(月)10:30〜17:30
[講師の言葉]
近年、センサー技術やネットワーク技術の発展に伴ってデータ量が年々爆発的に増加しています。これらは総称して「情報爆発」と呼ばれていますが、金融、製造業・通信事業、ネット企業などあらゆる業種においてこのような「情報爆発」が問題となっています。一方、企業においてはより迅速な企業戦略の立案、競合企業との差別化サービスの立案、顧客行動の把握等が求められていますが、それらを支える客観的なデータが不可欠であり、自身の企業や外部の大規模データを用いた高速なデータ解析処理が必須となります。
本講義では大規模データの処理をオンデマンドな計算資源の確保を可能にするクラウド基盤を用い、どのようなソフトウェアや開発手法を用いてこのような大規模なデータを高速に処理できるかを解説します。その上で代表的な2つのデータ処理手法、MapReduce とストリームコンピューティングの解説を行い、それらを具現化するオープンソースのソフトウェアHadoop と Yahoo S4 を用いて演習を行います。
[プログラム]
Ⅰ. 大規模データ処理技術の解説
1. 大規模データ処理が必要となる背景説明
2. 大規模データ処理の応用範囲
3. クラウドコンピューティングの解説
4. 大規模データ処理開発実行基盤 Hadoop と MapReduce の解説
5. リアルタイムデータ処理「ストリームコンピューティング」と Yahoo S4 の解説
Ⅱ. 大規模データ処理に関する演習
1. オープンソースソフトウェアHadoop を用いた MapReduce のプログラミング
2. オープンソースソフトウェアYahoo S4 を用いたストリームコンピューティングのプログラミング