gentak.info

ALS患者高野元の日常と思考と回想

googleはなぜライバルが現れなかったのか?

      2015/04/22

※以前qixilに投稿した内容を、手直ししたものです。

リンク解析を用いた検索エンジン

スタンフォード大学の研究プロジェクトに過ぎなかったGoogleが世に出始めたのは、1998年の春頃からだと記憶しています。リンク解析を用いるというアイデアは斬新なものでした。

あまり知られていないかもしれませんが、99年頃にTEOMAというリンク解析を用いた検索エンジンがありました。すでに消滅していますが、当時は業界では話題になりました。VCも付いたと記憶しています。

また、Wisenutという検索エンジンもリンク解析を用いていました。こちらはディレクトリ検索を提供するLooksmartという会社に買収されましたが、Looksmart自体が2006年頃に事業を終えています。

2000年に入るとGoogleの認知は急速に上がっていき、機能に差がないというかGoogleと同等以下のTEOMAやWisenutは、ブランド的にも追いつくのが難しくなりました。

Googleの技術的な優位点

Google出現当時のユーザー体験上の優位点は、

  • 検索の応答が圧倒的に早いこと
  • 検索結果の上位に、たいてい目的のページが現れること
  • 検索できるページ数が多いこと

だったと言えます。

当時の他の検索エンジンは、応答は遅いし検索スパムも多かったため、ディレクトリ型のほうが普及していたのです。

もう少し技術面を深堀りしてみると、3つの優位点を築いたと言えます。

(1)PageRankの開発

Page&Brinの初期の論文ですと、PageRankはシンプルな行列計算アルゴリズムであることがわかります。社会学の分野では1970年頃に、すでに論文参照問題として知られていた手法ですが、現実のWeb空間に適用して実用的に運用できるシステムを構築したのは、Googleが初めてでした。

それまでは、文章中のキーワードの出現頻度を計算して重要度を決める方法が主流だったのです。

また、この論文の段階で、インデックスの分散配置や、コンテンツ圧縮によるディスクIOの軽減などの工夫がされていることがわかります。

このPageRankの運用では、数多くのチューニング・パラメータが実装されて改良が続いていることは多くの方がご存知のとおりです。

(2) スケーラブル・アーキテクチャの開発

PageRank計算は、膨大なWebのリンク構造を表す大規模行列の固有値計算を行ないます。Web構造は疎行列になるので、いくつかの前処理を行うことで並列化ができます。また、検索に使う検索インデックスの作成も並列化ができます。

こういった用途に使われる、大規模データ処理のアルゴリズムがMapReduceで、そのための分散ファイルシステムがGFS(Google File System)です。これらの思想が論文として発表されたことで、HadoopやHBaseといったオープンソース・ソフトウェアが生まれています。

90年代は、大規模データ処理はサーバの性能を向上させる「スケール・アップ」が常識で、そのサーバの性能限界が扱えるデータ量の限界でした。しかしGoogleは、上記のような方式を開発したことで、サーバを並べれば並べるほどデータ規模を拡大できる「スケール・アウト」を可能にしたのです。

(3) 汎用品で安価にシステム・インフラを構築

増え続けるWebサイト・Webページを検索対象とするためには、スケール・アウトに必要なサーバを潤沢に供給する必要があります。

大量のアクセスを裁くインターネット・サービスでは、一台のサーバの性能をできるだけ引き上げるのが常識でした。

しかし、Googleは、一世代前の汎用品で安価にサーバを作って大量に導入し、これを容易に管理できる運用の仕組みを作っていきました。

安価なサーバとは、大量発注を背景にして無駄(音源チップなど)を省いたマザーボードを特注し、ピザボックス(1Uケース)に2枚のマザーボードを配置したというものです。壊れたボードはまるごと交換していったというのは有名な話です。また、IntelやWesternDigitalと包括契約していたと記憶しています。

3つの技術的優位性がビジネス上の優位性を産んだ

ASPサービスをビジネスとしてやっていくためには、直感的にはユーザが増えるスピードよりもサービス運用コストの上昇スピードを抑えられるかが極めて大切です。PageRankは、機能面での競争優位を作り出しましたが、ソフトウェアとハードウェアでは運用コスト(おもに人件費)と材料調達コストという価格面での圧倒的な競争優位を作り出しました。

3つの技術的な工夫によって、ビジネス上も競争優位を3つ作り出したというのが、Googleが圧倒的な検索エンジンとなった理由だと考えています。

AdWordsの競争優位点

売上についてはAdWordsが始まるまでは瀕死だったと聞きました。巨額の投資を受けていたといっても、どこかで稼いで回収しなければなりません。

Overtureの前身となったgoto.comのビジネスを研究して、ここでも広告業界の常識を壊して競争優位を築きました。広告業界の常識とは、広告は代理店の営業マンが営業してクリエイティブを確認して掲載するもの、というものです。

AdWordsは、広告入札機能を完全自動化して営業を介さず、クリエイティブの確認も事後というものでした。クリック単価が高ければ上位掲載する Overtureとは異なり、クリックされない広告は掲載順位を下げてしまうことで、クリエイティブの品質を維持すると考えたのです。

業界の常識を壊す仕組みだったので、日本での参入時にはGoogleの担当者は相当苦労されただろうと推察します。しかし、半年もしたら風向きが変わり、買い付けが面倒なユーザを広告代理店がサポートするという形態に落ち着いていきました。

すべてがスケールできるビジネスモデル

さて冒頭で述べたディレクトリ検索は2000年代前半までは利用頻度が高く、Yahooの利用者も、キーワード検索のGoogleの利用者より多い時期が続きました。

しかし、あるタイミングで利用頻度が逆転しています。検索結果への即時性のニーズが高まってくると、ディレクトリの顧客満足度が下がっていったからです。

ディレクトリの即時性を高めるには、サーチャーと呼ばれる人員を増やさないとなりませんが、これが人件費の拡大につながりました。またYahooは、検索エンジン機能には、利用料を払ってGoogleのエンジンを使用していました。

Yahooは、独自検索エンジンを持たないと運営費が変動費化して利益率を上げられないと気づき、買収したfastsearchを元にしたYSTに切り替えることになりました。

一方、広告売上を担うOvertureは、広告代理店とがっちり組み、広告テキストのレビューを引き受けるビジネスモデルでした。こちらも、広告掲載が増えれば増えるほど人件費が増えていくことになります。

爆発的にユーザーが増えるインターネットの世界において、以前のYahooはGoogleと違ってスケールしにくいビジネスモデルで運営していたのです。

これが利益率で圧倒的にGoogleが勝つことにつながり、その利益がサービスの多角化やM&Aの原動力になっているのはご存知のとおりです。

おわりに

昔話にお付き合いいただいてありがとうございます。

検索エンジン・ビジネスは、「技術の進歩による競争優位の獲得が、ビジネスモデル上の圧倒的な競争優位を産んだ」代表的な事例です。

単純に技術革新に目を奪われることなく、そこからビジネスの優位性につなげた手腕にも学ぶこと多いですね。

世界を席巻するイノベーションも、現場レベルのさまざまな改良・革新を生み出し続ける企業風土あってこそというのは、これまで散々語られてきたことです。時代は次の流れに移り始めていますが、ひと世代前のできごとを振り返ってみてもいいのではないでしょうか。

 

photo credit: Erik Pitti via photopin cc

 - サービス・技術・ガジェット