ログイン
|
メンバー登録
ポイント照会
中文
English
Français
Deutsch
Italiano
日本語
한국어
Português
Русский
Español
ホーム
ブログ
ストレージ
セキュリティ
ソフトウェア
ネットワーク
ハードウェア
ビジネス
検索
製品
通信
エンターテイメント :
おもちゃ/ホビー
都市
yahoo!検索の大規模なApache Hadoopの使用
Yahoo! Hadoopの
ブログ
で、Yahoo!検索のウェブマップチームがどのようにApache Hadoopの分散型コンピューティングフレームワークを使っているかがわかる。地図を構築するために1万個以上のCPUコアを使い、大量のデータを
処理
している。結局
ディスク
ストレージ
のうち5PB以上を使い、最終的には1回の検索に対して、
圧縮
データの300TB以上を出力している。
ある投稿メッセージの一端で、ウェブマップの歴史やどうして所有基盤からHadopへの使用に移行したのか、SameerとArnabにインタビューをすることになった。
インタビューで僕が強調したかったことのひとつは、Hadoopにとってこれは大きな画期的出来事であるということ。Yahoo!がとても大きな規模(さらに大きくなっている)生産配備の中でHadoopを使っているということ。これはただの実験や研究プロジェクトでもない。実際にお金が動いている。(実際の大金の額の話をしている時に、撮影ビデオに技術的ミスがあったのは、失敗だったな。)
投稿メッセージでエリックはこう言っている。
ウェブマップの立ち上げで、実際に
インター
ネット
サイズの問題を解決したり、大規模な生産設定でも確実に
機能
できるというHadoopの力が明らかになった。毎月、何十億という問い合わせがあるというヤフーウェブ検索への回答は、Hadoop集団が生産するデータにかなり依存しているのだ。
2008年と2009年は、Hadoopプロジェクトにとって、Yahoo!でだけじゃなく、他でも大きな飛躍の年になりそうな予感がする。
引き続き注目だね。。。
コメント:
匿名