2008-12-01から1ヶ月間の記事一覧

Confidence Weighted Linear Classificationを読んだ

ICML2008で発表されたDredzeらのConfidence Weighted Linear Classificationを読んだ。これは線形分類器を学習する新しいオンライン学習型アルゴリズムの提案である。すぐに使える実装としてはOLLというオープンソースのライブラリがあり、実際に良い実験結…

ファイル名の末尾に改行がついていたら警告してくれたらうれしいけどね

Rubyで久々に書き捨てスクリプトを書いてたんだけど、標準入力から一行一行ファイル名を読み込んでファイルを処理する、という簡単なプログラムを書いていて、ファイルが開けずに困った。いろいろ悩んだ挙句、結局は標準入力から読み込んだファイル名に改行…

しかしSVMも最近は速いらしい

Complement Naive BayesがSVMより速いよーと主張していたので、SVMもなんか最近は速くなってるらしいよ、という事を紹介してみたい。近年はSVMなどの学習を高速に行うという提案が行われており、実装が公開されているものもある。その中の一つにliblinearと…

新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ

新はてブ正式リリース記念ということで。もうリリースから何週間も経っちゃったけど。 新はてなブックマークではブックマークエントリをカテゴリへと自動で分類しているが、このカテゴリ分類に使われているアルゴリズムはComplement Naive Bayesらしい。今日…

Boostingの並列化

パターン認識と学習の統計学のp.153に「バギングは並列化が可能であるので、並列計算機を用いることによって計算時間を大幅に短縮できるが、ブースティングは逐次的にしか計算できないので、計算時間は生成する弱仮説の数に比例して長くなることになる」と書…