Facet
最後のセッションは Facet に参加.聴講人数は 30人ぐらい.発表は以下の三つ.
- Facetedpedia: Dynamic Generation of Query-Dependent Faceted Interfaces for Wikipedia
- Ad-Hoc Object Retrieval in the Web of Data
- Towards Rich Query Interpretation: Back and Forth on Query Template Mining
一つ目の発表は,Wikipedia に facet 検索用のインタフェースを作ったという話.タスクは分かりやすいのだけど,手法の説明が細かいところまで説明しようとし過ぎていて,直感的に分かりにくかったのでややスルー気味.citeseer など他のデータセットで使えるか?という質問があった(難しいだろう,とのこと).
二つ目の発表は,semantic search の一つとして,ad-hoc object retrieval をタスクとして形式的に定義・提案するという話.ad-hoc document retrieval と対比してクエリタイプ,抽出単位や,評価基準などを議論しているのだが,こういう研究はどう解釈(評価)すればいいのかよく分からないなぁ(関連研究が,TREC のタスクとかだし).普通はタスクの提案と手法の提案はセットだしね.この発表もインターン系 (Yahoo) の発表かな?
三つ目の発表は,クエリログからクエリのテンプレートを学習する話(google で,空港名を二つ入れるとフライトを検索するような,クエリテンプレートに特化した検索を拡張することを意図).手法としては,クエリログと domain schema (entity の汎化辞書のようなもの) を入力として,Site-Query-Template (QST) グラフを作って,各 Template の確率的な Precision と Recall を foward/backward random walk で求める.domain schema をどう作るか,というところも問題だと思うのだが,このセッションの発表中では唯一楽しく聞けた.これで最後の発表だけど,この業界の研究はグラフを作って random walk というパターンが多くて技術的には退屈だ.
なんとなく,畑違いのセッションに出てしまった気がした.Browser 2 にでも出て,キャッシュや表示の高速化の発表(Smart Caching for Web Browsers, Fast and Parallel Webpage Layout)でも聞いていればよかったかな.