Prezi が Amazon CloudSearch を導入したよっていう話

今朝、いつものように、フトンの中でTwitterを眺めてたら、↓のようなツイートがありました。

//platform.twitter.com/widgets.js
 
へーって思って↓を読んでたら、面白かったので、ちょこっと内容を紹介したいと思います。
『PREZI: SEEKING CLOUD-BASED SEARCH THAT “JUST WORKS”』
 

During the course of our research on search in the cloud, we’ve been collecting some case studies on uses of SaaS-delivered search.
クラウド上の検索サービスについて調査するにあたって、SaaS-deliveredな検索のユースケースを集めてきました。
 
Two of the major reasons that companies give us for moving their search to a cloud-based model are that
彼らが言う、cloud-based modelなサービスへの移行に関するメジャーな理由は2つです。
 
first, they need a scalable, flexible model that can vary with the demands of the business,
1つ目は、scalableでflexibleなモデルで、ビジネスのディマンドの変化に対応可能であることで、
 
and second, that search is not their core business so they prefer to rely on outside experts who can deliver a solid reliable foundation on which they can build specialized applications.
2つ目は、検索そのものはビジネスのコアではないわけなので、外部の(検索に)特化した専門家が作ったsolidでreliableな基盤を活用する方が好ましいということです。
 
 
Businesses that are dynamic information exchanges require this kind of scalable reliability.
dynamicな情報交換を行うビジネスにおいて、scalableでreliableな基盤は必須です。
 
They need to make their information available quickly, and cater to the dynamics of their users. Search is critical to their business.
情報を瞬時に利用可能にし、ユーザーにダイナミクスを提供する必要があって、検索は彼らのビジネスにとってクリティカルです。
 
Prezi (prezi.com) is a good example of this kind of use.
Preziのユースケースは上記にぴったり当てはまります。
 
This cloud-based software company enables its customers to brainstorm and collaborate, create unusual presentations, and share the results, no matter their location or device.
このcloud-basedなsoftware companyは、ブレインストーミングとコラボレーション、unusual(Preziならではのユニーク)なプレゼンテーションの作成、そしていかなる場所やデバイスにも成果物をシェアすること、を可能にします。
 
Their search needs at this stage are basic—good matching of queries to documents and quick updating of their index.
彼らの検索のニーズは、basic-goodにドキュメントを検索出来ることと、クイックに検索インデックスを更新出来ることでした。
 
They started with about 200 million documents, but the volume to grow to 1 terabyte, doubling annually.
彼らは2億ドキュメントからはじめたが、データのボリュームは年間で倍になるペースで1テラバイトになります。
 
Prezi did not want to hire or develop the expertise to build search from scratch, and they needed flexible, scalable search to match their growing business.
Preziは検索サービスをスクラッチで構築したくなかったし、その為の人員のハイヤリングもしたくありませんでした。
彼らに必要だったのは、彼らのビジネスの成長に見合ったflexibleでscalableな検索サービスだったからです。
 
Their customers need to find materials both they and others have developed, and they want to find images by topic without the time consuming delays of creating and standardizing tags.
Preziのカスタマーは、自分もしくは他のユーザーによって作られたmaterialsを探し当てる必要があり、
彼らは、スライドの作成やタグのstandardizingに伴うtime consumingな遅延なくトピック毎のイメージを探したいと思っています。
 
 
To make its materials searchable quickly and easily, Prezi developed a database of images that are associated with the text in the same slide.
materialsをquickに、そして簡単にsearchableに検索可能にするため、Preziは画像データベースを作成して、同じスライドの中のテキストと関連付けをしました。
(つまりPrezi上では1つ1つのスライドは画像になってて、テキスト情報とは別に保存されているって事ですかねー)
 
The contents change constantly, however, and they need to upload those images and make them searchable automatically using the related text.
コンテンツはコンスタントに変更されるが、その都度、画像をアップロードして自動的に関連語句を検索可能にする必要があります。
 
Furthermore, they anticipate adding and indexing new sources.
更に、新しいデータソースを追加およびindexingに対しても事前に対処をしておく必要があります。
 
For this purpose, they envisioned using search as “a materialized view over multiple sources.” In other words, a single gateway to all their information.
その為に、検索サービスを複数のデータソースのマテリアライズドなビューという位置づけで捉えました。
別の言い方をすると、彼らの全ての情報に対するsingle gateway。
 
 
To accomplish this, they needed stable, reliable and expandable search.
これを達成するため、stableでreliableでexpandableな検索サービスが必要でした。
 
The materials had to be accessible to its users no matter their device or location.
そして、どんなデバイスや場所からでもアクセス可能でなければなりませんでした。
 
Peter Neumark, a Prezi software engineer told us that they were looking for search that they could “pay for, use and forget about.”
Preziのsoftware engineerのPeter Neumarkさんは、”pay for, use and forget about”な検索サービスを探してたと我々に語りました。
 
 
 
Selecting a Search Infrastructure
 
Prezi’s previous search solution was slow, and didn’t function well enough as a key-value store.
Preziの以前の検索ソリューションは遅くて、key-valueストアとしてあまり機能的ではありませんでした。
 
They also required a solution that allowed them to relate an image to its neighboring text easily.
画像をneighboringなテキストに簡単に関連付けるソリューションが必要でした。
(ステミングとかシノニムとかって感じですかね〜?)
 
They decided to look at Amazon’s CloudSearch to solve these problems and deliver relevant material to searchers quickly and reliably.
彼らは、これらの問題を解決するため、そして、quickでreliableにrelevantなmaterialをデリバーするためにAmazonのCloudSearchを導入することにしました。
 
In other words, they were looking for search that “just worked”.
他の言葉で言えば、彼らは“just worked”な検索サービスを探していました。
 
They didn’t want to maintain it themselves, and, because they were familiar with them, they wanted to continue to use the AWS API’s, which they like.
彼らは自身で保守運用は行いたくないと思っていて、そして、彼らに馴染みがあり、彼らが好んで使っていたAWSのAPIを使い続けたかったということです。
 
When they did head-to-head testing, they found that CloudSearch was cheaper, faster, more reliable and expandable, and easier to synch with their Amazon DynamoDB database.
head-to-head testingを行った結果、CloudSearchはcheaperでfasterでreliableでexpandableでAmazon DynamoDBと簡単に同期が取れることが分かりました。
 
They liked its auto-scaling features that would grow with their data and their business.
(CloudSearchの)auto-scaling機能は彼らのデータやビジネスの成長にとって好ましいものでした。
 
 
 
Rolling out CloudSearch and Future Plans
 
Prezi are “happy campers”.
Preziは”happy campers”です。(辞書引くと、幸せものです的なのが出てきますが、そんな感じですかね〜?)
 
They deployed CloudSearch in 3 weeks, and are seeing lower cost, lower latencies, and virtually no need to pay attention to their basic search foundation.
彼らはわずか3週間でCloudSearchを導入しました。lower costでlower latencyで、実質的にbasicなsearch foundationに注意を払わなくてよくなりました。
 
Their next step will be to roll out additional domains and sources.
彼らの次のステップはadditionalなドメインとデータソースを導入することです。
 
They like the idea of adding domains rather than changing the initial schema.
彼らはドメインのスキーマを変更することよりもドメインを追加することを好みます。
 
They will also make the search function more visible on their site, now that they no longer need to worry about its reliability and speed.
彼らは検索機能をサイト上でもっとvisibleにしようとしています。彼らはもう検索のreliabilityとspeedを心配する必要はありません。
 

 
Amazon CloudSearchについては以前Solr勉強会(#SolrJP)で発表した資料とかもあるので、よろしかったらご覧ください↓
[slideshare id=97rbbpuRfazakf&w=425&h=355&fb=0&mw=0&mh=0&style=border:1px solid #CCC; border-width:1px; margin-bottom:5px; max-width: 100%;&sc=no]

 

Preziで始めるズーミングプレゼンテーション 第2版
筏井 哲治 高橋 佳佑
日経BP社
売り上げランキング: 103,420

コメント

タイトルとURLをコピーしました