ソフトウェアの更新も一人旅になってきた

最近研究のことを全然書いていないけれど,先月末にオープンソースで公開している線形分類器(分類専用のライブラリと学習器)と構文解析器の実装をこっそり更新しておいた.分類器は MacPorts に登録して頂いているのだけど,まだ対応していないかなと思って,分類専用のライブラリを(公開時点の版よりさらに速くするアイデアを思いついたので実装して)差し替えようとしたら,分類器も学習器も公開した翌日に Portfile が更新されていて驚いた.
今回の更新では分類専用のライブラリがアルゴリズム的な工夫で最大2倍程度速くなった*1.その恩恵で構文解析器も速くなった.一番最初に公開した頃は競合する構文解析器と違いが出るように(速度)差をさらに広げようと頑張っていたのだけど,今となっては解析速度だけでなく解析精度も一人旅になりつつある.解析速度については既存実装の十倍以上速く,解析精度も(最高精度のモデルについては)数字上はどの論文の報告よりも高くなっている(はず).実装したい機能も大体実装し終わったし,自分の中で枯れたというか,やり尽くした感が出てしまった(もちろん,その他の機能など,色々目をつぶっているところも多少あるけれど,そこは目指すところではない).
研究もソフトウェアの性能も突き詰めると一人旅というところは同じか.しかし,速くするためにやることはやり尽くしたと思った実装もまだ2倍も速くする余地が残っていたのだから,まだまだ楽しめるのかもしれない*2
[追記; 9/16] こちらも早々に対応していただけたようだ.多謝.

*1:研究としては既にジャーナルにしてしまっているのでこの程度の改善では発表に値しないが,ジャーナルの分類器からの差分だと3-4倍程度速くなっている.

*2:スクリプト言語によるコーパスの変換のほうが数十秒で終わる解析モデルの学習より時間がかかっていたりする.