CloudSearchが多言語対応してTokyoリージョンに!Suggesterを試してみる

本日、↓のアナウンスがございましたが、CloudSearchの大きなローンチがありました。
【AWS発表】Amazon CloudSearch 大幅アップデート – 1ヶ月100ドル以下でより良い検索が可能に!日本語にも対応!
 
日本語に対応したマネージドな検索エンジンが東京リージョンで使えるということで、早速試してみたいと思います。
お題は、先日書いた、SolrのSuggesterを試してみる | shinodogg.comのCloudSearch版ということで。
 
■ ドメインを作る
 
ManagementConsoleからDomainをCreateします。

 
ドメインの名前は取り敢えず、、、。
で、インスタンスタイプとレプリケーションの数が選べます。

 
ドメインのスキーマ定義はCSVファイルから。

 
CSVファイルの名前は山手線の名前で。

 
今回のローンチでAnalysis Schemeのところで”Japanese”が選べるようになりました!

 
IP制限の設定などして、ドメイン構築が終わるのを待ちます。

 
 
■ Suggesterの設定
 
続いて、新機能のSuggesterを追加します。
ユルく当てたり、Solr記法でソートの順番が変えられたりします。

 
Suggester用のインデクシングが必要な旨、表示されます。

 
ドメインのダッシュボード画面に戻ると”Run Indexing”が表示されます。

 
インデクシングを走らせてしばし待ちます。

 
 
■ データを投入します
 
肝心のデータを入れてませんでした…w
こちらも先ほどの山手線のCSVファイルをアップロードします。

 
29ドキュメントありますよー、と。

 
実際にはSDFというCloudSearch用の形式でデータは投入されるのですが、
CSVから変換されたSDFをダウンロードすることが出来ます。
中身みると↓こんな感じ。

 
29ドキュメントのaddがSuccessだったよ、と。

 
 
■ クエリを試してみる
 
Run a Test Search で Suggester を先ほど上記で設定した yamanote にします。

 
平仮名で入力しても漢字の駅名が表示されます。

 
“しん”で新橋が出てこないなぁって思ったら、

 
なるほど、そういう事なのね、、と。日本語奥深いです。。

 
こちら、いろいろと重宝しそうかなと思っていますヽ(´▽`)ノ
 
 
■ Developer Guide
 
↓ボリュームのあるドキュメントがあるので、今度も特徴のある機能などをピックアップして紹介したいと思います。
http://docs.aws.amazon.com/cloudsearch/latest/developerguide/what-is-cloudsearch.html
http://awsdocs.s3.amazonaws.com/cloudsearch/latest/cloudsearch-dg.pdf
 
 
■ 掃除
 
上記のスクリーンショットでエンドポイントとか晒してしまったので、ドメインを削除しておきます〜

 
 

Amazon Web Services クラウドデザインパターン実装ガイド
大澤 文孝
日経BP社
売り上げランキング: 4,972
Amazon Web Servicesクラウドデザインパターン設計ガイド
日経BP社 (2014-01-29)
売り上げランキング: 9,187

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google フォト

Google アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中