SolrのSuggesterを試してみる

以前、Solrの勉強会で大須賀さんがデモしていた↓がナイスだったので自分も試してみました。

アルファベットだったら、レーベンシュタイン距離で近いのでホゲホゲ、でOKだけど、
日本語の場合は、ひらがな/かたかな/漢字ってことで、単純に距離では図れませんがな、と。
 
さっそくhttps://github.com/mosuka/solr-suggester-demo-uiをcloneしてくると、
その名の通り、UIのとこだけですねん、と。当たり前ですが、コレでは何も動きません…。

$ ls
README.md	css		index.html	js

 
中身をみていくと、大きく2つに分かれています。
1. TermsComponentでAutoComplete & SpellCheckComponentで、Did you mean?
2. SuggesterでAutoComplete & Suggesterで、Did you mean?
 
jsディレクトリはjQueryが入ってるだけなのでイジる必要はなさそです。cssもそんな感じ。
ってことで、サーバーの構築をしていきます。
 
 
■ Solrのインストール
 
最新版のSolrを落としてきて解凍して、

$ curl -O http://mirrors.gigenet.com/apache/lucene/solr/4.7.0/solr-4.7.0.tgz
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  144M  100  144M    0     0   576k      0  0:04:17  0:04:17 --:--:--  385k

 
exampleのディレクトリ行って、jar叩くだけです。

cd solr-4.7.0/example
java -jar start.jar

 
localhost:8983にいくと↓のようなリンクが出てきて、

 
↓叩くとソレっぽい画面が出てくるかな、と。

 
左側のメニューでCoreをcollection1に選ぶと今回のヤツになります。
 
 
■ Solrの設定ファイルの配置
 
http://www.rondhuit.com/download.htmlに、”[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン”というリンクがあって、
 
そちらをダウンロードしてくると solrbook-2.zip というファイルが保存されます。
sampledata/suggesterの中に以下の3つのファイルがありますが。
1. conf/schema.xml
2. conf/solrconfig.xml
3. samplesuggester.xml
 
1.と2.に関しては、そのまま上記でダウンロード&インストールしたSolrの↓に突っ込んで上げて、

solr-4.7.0/example/solr/collection1/conf/

 
3.は、(何かイケてないですが)Solrの管理画面から直接突っ込みました。

 
 
■ Githubから落としてきた静的コンテンツの配置
 
わざわざこのためにApacheとかも何だかなと思ったけど、warファイルの中にホゲホゲとかもアレだし、、
といってググってみたらQiitaでナイスなの見つけました↓
jetty で静的コンテンツを有効にして起動するまで(http://qiita.com/amay077/items/546b85cb74e9b2f1f928)
 
こちらを、そのまま拝借させていただいて↓のディレクトリ作ってファイルを置いてやります。

solr-4.7.0/example/htdocs/suggester

 
 
■ Suggesterの動作確認
 
Termコンポーネントだと”新”って漢字で入れないとアレですが、
Suggester使えば平仮名やカタカナでも出てきますよ、と。

 

 
 
■ その他
 
現在、出張でシアトルに来てるのですが、オフィスに犬連れてきてるヤツがいてナイスな感じだったりします(´▽`)

座席も広々してるしなー
 

[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus)
大谷 純 阿部 慎一朗 大須賀 稔 北野 太郎 鈴木 教嗣 平賀 一昭
技術評論社
売り上げランキング: 11,651

SolrのSuggesterを試してみる」への1件のフィードバック

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google フォト

Google アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中