TinySegmenterのつかいみち

 TinySegmenterというJavaScriptで書かれた日本語分かち書き用のソフトウェアがある。全部合わせて25KBという小ささ。だけど、精度的な面ではやはりMecabとかに負ける。サイズがサイズなので精度は仕方がないけど。そんな感じなので、オフィシャルサイトにも「キラーアプリを考える (なさそう...)」とか書かれてしまっている。
 今日、spam filterを作りたいなぁと考えててふと気づいたんだけど、spam filterは単語に区切ってからSVMなりなんなりに投げた方が精度が高くなると思うので、そういう用途で使うというのはどうだろうか。最近はmecabなら多くのDistributionに入ってる(と思う)ので、mecabを使って形態素解析しちゃってもいいとは思うんだけど。判定精度に影響が出ないのであれば、依存関係が少ない方が嬉しい。
 キラーアプリというには弱いけど、それなりにポジティブな何かは得られるのではないでしょうか。未知語に強いという点も良さそうだし。