可視化系の国際会議に共著論文が通った

第二著者としてかなりコミットしていたビジュアル(可視化)系の共著論文が,採択率 1/3 ぐらいの国際会議に採録された.11月の湯治中に最初の採否の通知が来たのだけど,国際会議にも関わらず条件付き採録という結果だった.結果が来るのは知っていたものの(まさか国際会議で条件付き採録とは予想できず)湯治中だったので迷惑をかけてしまったが,第一著者を中心にせっせと直して(自分も途中から参加して)先月末に再投稿した.それから一週間,改めて採否の結果が来て,ようやく採録となった.今回の研究はそもそもネタを持ち込んだのが自分なので,無事通ってくれてほっとした.採録されたのは可視化系の国際会議なので,自分の専門分野の研究者にはほとんど知られることは無いかも知れない.折角なので,少しこの研究のことなどを書いてみる.
今回の研究は,大規模データ(個人的な感覚では中規模ぐらい)を,文ではなく構文解析した結果の可視化という形で要約し,情報を俯瞰・支配することを可能にするという内容.この研究は,分野横断的な側面があるため,論文での主張を何にするかが難しく,国際会議になかなか通らなかった.今回の査読では,一人の査読者が上記の点を評価して強く推してくれて,そこでなんとか突破できたようだ.既に某全国大会で発表賞をもらっていたが,やはりちゃんとした国際学会に通るといっちょ前の研究という自信が湧いてくる.あとは論文誌に採録されれば,一段落だ.
今回の共同研究は色々な意味で勉強になった.専門分野の中だけにいると,全てのタスクで解析精度の目標は 100% であると考えてしまいがちなのだけど*1,実際にはそんなことは全くなく,用途によって実用性を担保するために要求される精度は大きく異なる.特に大規模なデータを分析対象とすると,全てを正確に解析しなくても価値が生み出せるので*2,解析精度よりも解析速度が問題となる場合もある.実用的な速度で解析ができないため,実データを実際に解析することに億劫になってしまい,実データでは何が本当に問題となるのか,すなわち問題の量・質感を把握することもなく(新聞記事での解析精度だけみて)使えないと思い込んでしまってはいないだろうか.
また,言語的な情報を提示するタスクでも,必ずしも自然言語文の出力に拘る必要はないということも感じた*3.より分かりやすく伝達する手段が他にあるのであれば(それを示すのはなかなか厄介だけど)その手段と言語を組み合わせる方法もある.今後は専門分野の境を超えて役割分担して,自分の分野でしか解けない問題に集中したいと思う.この辺り,実データを解析する機会が少ない専門分野の研究者とは,あまり価値観が共有できないかも知れないが,一方で異分野からの歩み寄りは期待できるかも知れない.例えば,五十嵐先生の以下の発表には共感できる.

可視化に限らず,もう少し外の世界を見て,何が本当に自分の専門分野で解かなければいけない(解くべき価値がある)問題なのか,よく考えてみたい.

*1:専門分野に閉じて言えば,タスクが一旦(解く価値があるとして)定義されたら,個々の応用に依存しない数値目標を掲げるというのももちろん良いし,自然な価値観だと思う.自分はどちらかというと,言語学研究者的な魂を心のどこかに持っているので,応用と独立して,現象を正しく説明する数理モデルを考えるという事自体にも意義を感じる.

*2:最初に解析結果を可視化してもらった際「今まで言語処理は役に立たないものだと思っていたが,これなら十分使える」というようなことを可視化の研究者に言われたことが強く印象に残っている.

*3:逆にそこに拘るのもまた分野研究者の性とも言えるが.