cassandra azure を活用し、屋外に特化した画期的な検索エン ス...
TRANSCRIPT
Cassandra と Azure を活用し、屋外に特化した画期的な検索エンジンを開発および提供スタートアップ企業向けの無償クラウド支援枠を活用し、検索エンジンに必要な大規模インフラを実現
外出先で、すぐ近くにある「電源を使えるカフェを見つけたい」と思って、検索エンジンやマップを使って検索しても、なかなかピッタリの情報が見つからず困ったことはありませんか?そんな問題を解決するために、株式会社トライトゥルー (以下、トライトゥルー ) は空間検索エンジン Pathee (パシー ) を開発しました。Pathee の検索ウィンドウに「電源」「カフェ」というキーワードを入力すると、徒歩 5 分以内で電源の使えるカフェの場所がマップ上に表示されます。ブログや Q & A サイトなどの不要な情報は一切表示されません。この屋外検索に特化した画期的な検索エンジンは、ブラウザーやアプリで無償提供されていますが、企業の広告出稿も受け付けています。現在は、日本語による国内でのサービス提供に集中していますが、今後は世界で使える Pathee をめざしています。この Pathee について、株式会社トライトゥルー 代表の寺田 真介 氏にお話を伺いました。
ビジネス面でのニーズ私は、東京大学大学院博士課程を修了後、日立製作所システム開発研究所でスマート グリッドを最適化するアルゴリズム設計をしていたのですが、「外出先での検索体験を変えたい」という思いから 2012 年に株式会社トライトゥルーを起業しました。創業当時、アイデア実現のための知識や技術はあったのですが、膨大なウェブ情報の収集と解析をするためのインフラ構築資金が絶対的に不足していました。なぜなら、一般的な B2C サービスを提供するベンチャー企業と異なり、検索エンジン サービスは多くのデータを集めて処理する必要があるので「小さく始めてスケールさせる」戦略がとれず、初めから大規模なシステムが必要になるためです。また、複数の論文を参考にしてシステム設計をしていたのですが、キーとなる
Apache Cassandra のような分散システムは、その特性上どうしても複数のインスタンスが必要になり、インフラ構築のための費用は大きな問題でした。また、世界中のデータを収集、解析してサービスを提供するためには、今後さらに処理を高速化する必要があります。そのため、CPU 上で動作するソフトウェアと比較して、数百倍の処理能力のある専用ハードウェアを、自前のデータセンターで構築したいと考えていました。そのため、クラウドにロックインされず、オンプレミスとの連携が容易にできることが大きな条件でもありました。
なぜマイクロソフトと協業したのかこのようなニーズを基にさまざまなクラウド ベンダーを比較した結果、マイクロソフトと協業することに決定しました。マイクロソフトとの協業には以下 4 つのメリットがあったからです。
1. スタートアップ向けのプレミアム プログラム BizSpark
Plus により、年間最大約 1,200 万円のクラウド使用料が無償になり、検索エンジンに必須となる大規模インフラを構築できたこと
2. Apache Cassandra や、それをマネージするツール
OpsCenter などのオープン ソース ソフトウェアを快適に活用できたこと
ソリューション概要
○プロファイル株式会社 tritrue (トライトゥルー ) は、2012 年に設立。独自の「空間検索エンジン」を開発し、歩いて 5 分以内の全ての場所を検索できるスマートフォン向けの検索サービス「Pathee (パシー )」を提供しています。検索エンジン開発の中で培った言語解析、位置推定などの技術を活かして、クライアントに応じた最適な IT ソリューションを提供しています。特に、場所に関する情報分野でのマーケティング、データ分析において、豊富な実績とノウハウで新しい提案をしています。
○導入製品とサービス• Microsoft® Azure™ - Azure Virtual Machines - Azure Redis Cache
○導入メリット• スタートアップ向けのプレミアム プログラム
BizSpark® Plus により、年間最大約 1,200 万円のクラウド使用料が無償になり、検索エンジンに必須となる大規模インフラを構築できた• Apache Cassandra や、それをマネージする
OpsCenter などのオープンソース ソフトウェアを快適に活用できた• Microsoft® Azure™ は自前のデータセンターとの連携ビジョンが明確であり、自社の将来の計画と合致していた• マイクロソフトの担当者による、親身なアドバイスがあった
○ユーザー コメント「マイクロソフトは Windows® のイメージが強かったのですが、Linux ベースの構成が普通に使え、Cassandra の導入もとても簡単でした。開発当時は実践的に使用できるインフラ構成自動化技術が少なかったため、ベース イメージを複製してインスタンスを複数作れる Azure の機能は、大規模な Cassandra クラスターをミスなく構成するうえで、たいへん助けになりました」
株式会社トライトゥルー代表寺田 真介 氏
株式会社トライトゥルー
Pathee の検索画面
株式会社トライトゥルー
導入についてのお問い合わせ本ケース スタディは、インターネット上でも参照できます。http://www.microsoft.com/ja-jp/casestudies/本ケース スタディに記載された情報は制作当時 (2016 年 2 月 ) のものであり、閲覧される時点では、変更されている可能性があることをご了承ください。本ケース スタディは情報提供のみを目的としています。Microsoft は、明示的または暗示的を問わず、本書にいかなる保証も与えるものではありません。製品に関するお問い合わせは次のインフォメーションをご利用ください。■インターネット ホームページ http://www.microsoft.com/ja-jp/■マイクロソフト カスタマー インフォメーションセンター 0120-41-6755(9:00 ~ 17:30 土日祝日、弊社指定休業日を除く )※電話番号のおかけ間違いにご注意ください。*Microsoft、Azure、BizSpark、および Windows は、米国 Microsoft Corporation の、米国およびその他の国における登録商標または商標です。*その他記載されている、会社名、製品名、ロゴ等は、各社の登録商標または商標です。*製品の仕様は、予告なく変更することがあります。予めご了承ください。
〒108-0075 東京都港区港南 2-16-3 品川グランドセントラルタワー
3. Microsoft Azure は自前のデータ センターとの連携ビジョンが明確であり、自社の将来の計画と合致していたこと
4. マイクロソフト の担当者による親身なアドバイスがあったこと
当社は、マイクロソフトの提供する BizSpark Plus を活用し、インフラ構築に必要な費用を削減しました。このプログラムに採用されたことで、検索エンジンを支える大規模なインフラを構築することができました。また、インフラ構築に費用がかからなかった分、検索システムを開発できる優秀な開発者を 1 人雇えました。現在では、月に約 1 億ページの情報を集めて分析しているのですが、増員できていなかったら開発が遅れ、今の 10 分の 1 以下の解析しかできていなかっただろうと思います。次に Cassandra や、状態監視に利用していた DataStax の OpsCenter
が、Azure で快適に使えたのも大きな利点でした。マイクロソフトは
Windows® のイメージが強かったのですが、Linux ベースの構成も普通に使え、Cassandra の導入もとても簡単でした。開発当時は実践的に使用できるインフラ構成自動化技術が少なかったため、ベース イメージを複製して、インスタンスを複数作れる Azure の機能は、大規模な
Cassandra クラスターをミスなく構成するうえで、たいへん助けになりました。それに加えて、Azure 導入時にはマイクロソフトのエバンジェリストから Azure の連携ビジョンや具体的な利用方法をていねいにアドバイスしてもらっていたこともあり、最終的に協業を決断しました。
今後のビジネス展開現在は、日本語による国内向け検索エンジン サービスに集中していますが、今後は多くの日本人が旅行や居住したりする国や地域を対象に拡大することを計画中です。さらに、都市構造やウェブ内の情報形態が比較的似ているヨーロッパを皮切りに、外国人向けのサービス展開も計画しています。そのためには、解析用の CPU インスタンスを今の倍に増やしたいですね。また、私は前職で HTML を専用ハードウェアで解析した経験があるのですが、この経験を活かしたいと考えています。FPGA を用いた構文解析は、ソフトウェアによる解析に比べて 100 倍以上のスピードで処理が可能なため、ゆくゆくは自前のデータ センターを設け、世界中のデータを解析できる基盤を鵜構築していきたいですね。
今後のマイクロソフトとの協業マイクロソフトは Azure に限らず、本当に多くのパーツを提供してくれていますので、より多くのユーザーがアクセスした場合に自動的にスケーリングしてくれる Web サーバー、PaaS システムである Azure
Web Apps や、広告出稿システムのダッシュ ボードとして活用できそうな Power BI などのサービスを活用していきたいと思っています。また、Data Lake のような分析サービスにも注目しているので、またエバンジェリストに紹介してもらいたいですね。ビジネス面でも共同マーケティングや共同セールスにも力が入ってきていることを感じているので、今後もマイクロソフトとはうまくお付き合いしながら、一緒にビジネスを拡大できればと思います。
5966-SE1
システム構成図 トライトゥルーのメンバー廣瀬 誠 氏 (前列左 ) 、牧村 真吾 氏 (前列右 ) 、渡邉 剛志 氏 (後列左 )、寺田 真介 氏 (中央 ) 、名村 徹真 氏 (後列右 )