InfoSphere BigInsightsの表計算分析機能「BigSheets」の画面
InfoSphere BigInsightsの表計算分析機能「BigSheets」の画面
[画像のクリックで拡大表示]

 日本IBMは2011年8月31日、大量データを分析するシステムをHadoopを用いて構築・運用するミドルウエアの新版「InfoSphere BigInsights Enterprise Edition V1.2」を発表した。新版では、表計算ソフトのようにHadoopデータを分析できる「BigSheets」機能を追加した(写真)。2011年9月2日に出荷する。

 InfoSphere BigInsightsは、大量データ分析用の分散処理ソフト「Apache Hadoop」の、IBM版のディストリビューションである。Hadoopシステムを構築・運用するためのツール群を、企業向けにパッケージ化している。Hadoop独自の情報処理プロセス(MapReduce処理)を扱いやすくする上位言語(Jaql、Pig、Hive、その他)、インストーラ、統合開発環境、ジョブスケジューラ、ワークフローエンジンなどを一式提供する。

 新版では、Hadoopのデータを表計算ソフトのように分析できる機能「BigSheets」を追加した。Webブラウザから表計算のGUIを操作するだけで、分析ジョブを定義、実行、視覚化できる。これにより、Java言語で直接MapReduce処理を実装したり、Apache HiveやApache Pigなどの上位言語ツールを使って分析プログラムを開発したりすることなくHadoopデータを分析できる。なお、BigSheetsは、バックエンドではApache Pigを利用しており、Pigの上位に位置するGUIソフトとなる。

 InfoSphere BigInsightsの稼働OSは、Red Hat Enterprise Linux、SUSE Linux Enterprise Server。価格は、処理データ量1Tバイトあたり285万円(税別)から。