1.  検索ログの解析で問題となるのは処理に要する時間である。なにしろ、クックパッドは毎月900万人近いユーザーが利用するサービスだ。「たべみる」のサービスが対象とするのは、1年分の検索ログであり、そのデータ量は膨大になる。

    7000時間を30時間にまで短縮

     同社では、社内のデータベースサーバを利用して、この処理を実施した場合、7000時間はかかると見積もった。しかし、米AmazonのIaaS型のクラウドサービスであるEC2を活用し、50台のインスタンス(仮想マシン)を同時に立ち上げ、分散処理のフレームワークである「Hadoop」を利用したところ、わずか30時間で完了した。

    クックパッドのデータ処理、たった5万円:日経ビジネスオンライン

    14 years ago  /  37 notes  /  Source: business.nikkeibp.co.jp

    1. tk1024 reblogged this from gkojay
    2. koolmiura reblogged this from extratextra
    3. pfmusique reblogged this from gkojax
    4. pamgau-blog reblogged this from gkojax
    5. hiromitsu-white reblogged this from gkojax
    6. oonishin reblogged this from mononofu
    7. shinsen reblogged this from gkojax
    8. yoosee reblogged this from nseki
    9. hayase reblogged this from nseki
    10. dominion525 reblogged this from u-ichi
    11. shungoarai reblogged this from nseki
    12. u-ichi reblogged this from nseki
    13. nseki posted this
Kalalalani Theme
by Chris Kalani