2010-04-01から1ヶ月間の記事一覧
Sequelのvalidation_helpersの使い方がよくわからなくて、試行錯誤したのでメモしておく。 class Documents < Sequel::Model plugin :validation_helpers def validate validates_min_length 1, :title validates_min_length 1, :body end unless table_exis…
論文を読んでいると、どうにも発音の仕方が分からない単語がしばしば出てくる。固有名詞、特に人名がからむものに、発音がわからない単語が多いようだ。 例えば、Nonparametric Bayes Modelを勉強すると、ほぼ確実にYee Whye Tehという人にたどり着くのだが…
KyTea(京都テキスト解析ツールキット)は京大のGraham Neubigさんが中心となって開発している単語分割&発音推定ツールである。 私はかな漢字変換用の学習データを作るのにこれまではmecabを使っていたのだが、mecab-ipadicのデータには、そもそも読み推定に力…