2010-04-01から1ヶ月間の記事一覧

Sequelのvalidation_helpersの使い方

Sequelのvalidation_helpersの使い方がよくわからなくて、試行錯誤したのでメモしておく。 class Documents < Sequel::Model plugin :validation_helpers def validate validates_min_length 1, :title validates_min_length 1, :body end unless table_exis…

Kneser-Neyの発音が判明した

論文を読んでいると、どうにも発音の仕方が分からない単語がしばしば出てくる。固有名詞、特に人名がからむものに、発音がわからない単語が多いようだ。 例えば、Nonparametric Bayes Modelを勉強すると、ほぼ確実にYee Whye Tehという人にたどり着くのだが…

京都テキスト解析ツールキットを使ってみた

KyTea(京都テキスト解析ツールキット)は京大のGraham Neubigさんが中心となって開発している単語分割&発音推定ツールである。 私はかな漢字変換用の学習データを作るのにこれまではmecabを使っていたのだが、mecab-ipadicのデータには、そもそも読み推定に力…