並列分散処理(Hadoop)
Hadoopの活用により、
効果的な分散処理システムを提供致します。
世界中のWebページの情報を収集、解析しているGoogleでは、大規模データを数千台に及ぶサーバで効率よく分散処理するために下記基盤ソフトウェアとして開発、運用しています。
GFS(Google File System[分散ファイルシステム])
Big Table(Key-Vauleデータベース)
MapReduce(並列分散処理フレームワーク)
そのアーキテクチャーに基づき、Apache Software Foundationにてオープンソースで開発、公開されているソフトウェアが「Hadoop」です。
Hadoopの導入により、非常に高価で高スペックなサーバでしかさばききれないような大規模データ処理を安価な複数台(数台から数千台)のサーバに処理を分散させることにより、圧倒的な速度で処理を行うことが可能となります。
Hadoopのディストリビュータである米国Cloudera社が認定する
「Cloudera Certified Hadoop Administrator」を有する技術者がHadoop導入をご支援致します。

