WEB+DB PRESS vol.64に日本語入力の記事を書いたよ

 WEB+DB PRESS Vol.64に日本語入力についての記事を書かせていただきました。特集3の「作って学ぶ日本語入力」という奴です。
 日本語入力の歴史とかについて簡単に触れた後、かな漢字変換を実際に作ってみる、という構成になっています。ビタビアルゴリズムやダブル配列、構造化パーセプトロン、構造化SVMなどのテクニックを紹介しています。この特集だけ読めば、今年の3月の言語処理学会に私が出した論文(?)と同じものがたぶん作れます。日本語入力だけに限らず、教師あり機械学習を実装するときの最低限の知識、みたいなところも身につくと思いますので、WEBやDBに興味のある人だけでなく、自然言語処理に興味のある大学生の人々にもぜひ読んで欲しいと思います。データを入れ替えれば形態素解析なんかもほぼそのままで作れます。
 構成的には、確率の概念について一切触れていないところが一つのポイントになっています。統計・機械学習の技術を使う場合、HMMやCRFといった確率モデルがメジャーですが、雑誌記事の分量で確率の概念を説明してしまうとそこにページをだいぶ食ってしまうし、読者としてもおいしいところに行く前に確率で心が折れる可能性が無視できないと考え、このような構成にしました。この試みが成功していることを祈っています。
 諸般の事情により、スケジュールが死ぬほどタイトで本当に辛い執筆でした(ある事情によるものなので、普通の人が記事を書く際には安心して良いです)が、結構いい記事になったのではないかと一人で自画自賛しています。魂を削って書きましたので、NLP畑の人もWEB畑の人も、楽しんでいただけましたら幸いです。

WEB+DB PRESS Vol.64
WEB+DB PRESS Vol.64
posted with amazlet at 11.08.14

技術評論社
売り上げランキング: 4040
 ちなみに、発売日は8/24だそうです。明日書店に行ってもたぶんまだ売ってないので、買いに行くなら明後日です。