学会出張@東欧二日目: 注釈付けに関する研究が興味深い

学会の一日は招待講演で始まる.初日と三日目は認知言語学や大脳生理学など周辺分野の研究者による学術的な講演なのに対し,この日はサービス寄り話で顔本のグラフ検索の話.まああんまり聞いててワクワクする話ではなかった.自分は研究室内でこの手の産業寄りの話ばかり聞いているので,個人的に(この会議には)その手の話は期待していないというのがあるのかも.多分普通の聴講者はワクワクするのだと思うけど.
続いて,Best Paper Award, Best Student Paper Award の発表.ちなみに,Best Student Paper Award は

  • A corpus-based evaluation method for Distributional Semantic Models (from Student Research Workshop)

だった.
初日は起きる時間が現地時間にピッタリ合って一日集中して聞けたが,二日目は疲れもあり,夜明け前に目が覚めてしまってやや寝不足気味で,聴講を聞き続けるのがしんどかった.ランチは軽い気持ちで本格的な現地料理の店に行ったら,料理のサーブがやたらと遅くて午後の最初のセッションの最初が聞けなかったりして,がっくり.自分も残念だけど,一緒に行った方々にも申し訳なく.
二日目の発表で記憶に残ったのは,

  • Reconstructing an Indo-European Family Tree from Non-native English Texts: 内容はタイトルそのまま.知的好奇心をくすぐる問題設定で興味深かったのだけど,後半の分析が事例分析の段階に留まっていて,やや物足りない.もう一段階抽象化して何らかの仮説をたてるところまで行って欲しいなと感じた.その辺りはジャーナル版で期待したい.
  • Crowdsourcing interaction logs to understand text reuse from the Web: Web 上のテキストを再利用して書かれたコーパスの構築に関する話.こういう論文が通るのが面白い.TREC の Web トラックから選んだトピックに関する文書の作成を crowdsourcing し,その作業ログを可能な限り*1記録して,そのログをもとにユーザが文書を書く際にどのようにテキストを再利用するのかを分析している.件のテキスト再利用については,引用型 (build-up) の再利用と,推敲型 (boil-down) の再利用が半々ぐらいだったのこと.
  • Outsourcing FrameNet to the Crowd: FrameNet に基づく注釈付けを crowdsourcing することを念頭に,注釈付けの手順を従来の二段階(フレーム選択→意味役割付与)から,直接,意味役割付与を行う方法に簡略化することで,注釈の精度,時間,注釈付けコストがどう変わるか調査した研究.実際に worker に支払った金額でコストを評価しているのが非常に妥当で現実的.結論は論文をどうぞ.個人的にはこういう研究,とても重要だと思う.

今日は懇親会がある日だったが,最近の学会参加では懇親会は基本参加しないことにしているので,講演終了後は今回の発表の共著者の卒業生と市内を歩いてまわって,夕飯を軽く食べて帰った.学生の頃のように観光気分で学会に来ることは無くなった(というか,発表の内容がよく分かるようになったので,発表を聞いている方が楽しくなった)けど,やっぱりずっと頭を使いっぱなしだとクラクラしてくるので,空いた時間には街を歩いたりしてリフレッシュするようにしている.

*1:作業者ごとにウェブの閲覧履歴や編集履歴を記録し,どのようにウェブ上から情報源となる文書を見つけて,どのような形でテキストを再利用したかを記録している.