もっと訓練データを公開してくれないものか

7月2日の締め切りに向けて,カメラレディ論文を直しているのだけど,ふと大規模な訓練データを用いた実験を行いたいと思った.機械学習だと,LIBSVM Dataから適当に引っ張ってくれば済むんだろうけど,自分の分野の分類問題の性質を意識した学習手法なので,できれば自分の分野の訓練データを使いたい.しかし,自分の分野では,訓練データを公開するという風習が無く,大体の場合,訓練データの元(注釈付きデータ)しか公開されていないので,今は自分で作った訓練データとオープンソースのソフトウェアにたまたま含まれていた訓練データを使っている.学習手法の有効性を示すためだけに,新しいタスクの訓練データを作るのは,何となく割に合わない気がするのだけど,無いのだからしょうがない.
自分の分野でも,もっとみんな訓練データを公開してくれないものか.トップ会議に通った研究の実験データで,1000万例ぐらいあると,いいんだけどな.今公開してくれていたら,実験に入れられるのに.残念だ.