2007-01-01から1年間の記事一覧

dary 0.3.0 released

daryの0.3.0をリリースした。11月から公開しようしようと思ってずっといじってたんだけど、なかなかバグが取れなかったりでこんな時期になってしまった。でも、バグ修正の副作用でインデックス構築が倍以上速くなったりしたのでよしとしておきたい。 まだ改…

An introduction to Conditional Random Fields for Relational Learning

Charles SuttonとAndrew McCallumによるAn Introduction to Conditional Random Fields for Relational Learning(PDF)は、まだ読んでないけど、良さそうに見える。後で読む……つもり。 知りたいことの前に「An introduction to」とつけたら、なんでも見つかる…

CommonPrefixSearch

Daryの新バージョンを公開するためにいじっていて、DartsのcommonPrefixSearchとGaucheのutil.trieでは同じような名前でも、機能が違うことに気づいた。DartsのcommonPrefixSearchでは検索キーよりも短いものが取れる。util.trieのcommon-prefixでは、検索キ…

An Introduction to Graphical Models

なにかで検索してるときに見つけたんだけど、Kevin P MurphyのAn Introduction to Graphical Models(PDF)がGraphical Modelに関して結構よい文書なのではないかと思う。19ページなのでこれでGraphical Modelがわかるわけではないんだけど、とっかかりとして。…

pulseaudio

気づいたらpulseaudioで音が鳴らせなくなっていた。libasound2-pluginsが必要であるようだ。インストールしたら普通に音が出るようになった。

probability one

probability oneという言葉がよく分からないので調べてみた。Almost surelyという概念と関係が深いようだ。調べてるうちによくわからなくなってきたので、とりあえずメモだけ。

pkg-configとlibtoolは悪である

udrepper: The Evils of pkgconfig and libtoolによると、これらのツールを使って作られた共有ライブラリには使われない共有ライブラリへのdependencyが無駄に含まれている。この問題はリンク時に-Wl,--as-neededとオプションをつけることで、一つの例外的な…

client-side sender verification

自分の使っているメールサーバがDKIMやDomainKeysに対応してない場合、MUA側で確認したいこともあると思うのだが、そのような機能を備えたクライアントはThunderbirdしか見つけられなかった。(Thunderbirdも標準では対応しておらず、拡張をインストールする…

Why doesn't EM find good HMM POS-taggers?

Why doesn't EM find good HMM POS-taggers? (Mark Johnson, 2007)を読んだ。EMNLP-CoNLL2007の論文。もう学生じゃないし、仕事とはあんま関係ないから論文読んでも仕方ないんだけど、なんか読んでしまう……。 Unsupervised HMMの学習に関し、EMとGibbs Sampl…

Fail-Safe C

Fail-Safe Cが公開されている。Fail-Safe Cは、完全な ANSI-C 規格への準拠を実現しながら、実行状態の破壊や乗っ取りに繋がる全ての危険な操作を検出し防止するC言語の処理系だそうだ。ライセンスはQPL。 そういえば、やや話はずれるが、pccはOpenBSDのツリ…

iogrind

http://live.gnome.org/iogrind。ディスクアクセス(というか、IO)のプロファイラ。valgrindから呼ばれる形で使うっぽい。

害のないrace conditionなんてない

There are no harmless race conditionsでOwen TaylorがMugshotのWindows版クライアントのアップグレード用に存在したrace conditionをデバッグしたときの事が書いてある。"combined with uninstalling and installing things about 200 times, I was able t…

FreeBSDで困ること

プロファイラが見付からない。gprof以外の選択肢が見つけられないんですが、FreeBSDだと何でプロファイル取るのが普通なんでしょうか。user spaceのプロファイルさえ取れればいいんだけど、gprofはいちいち-pgつけてコンパイルしなおさないといけないのがめ…

A tour of git: the basics

A tour of git: the basicsはBryan O’SullivanのDistributed revision control with Mercurialの2章をCarl Worthがgit向けに書き直したもの。

Compressed Permuterm Index

hillbigさんに紹介してもらったCompressed Permuterm Indexをちょっと前に読んだ。Compressed Permuterm Index以前にそもそもbackward search自体が理解できなくて、refferされてる別の論文読んだりしてたらだいぶ時間がかかってしまった。 この論文に書かれ…

πという数列の持つ情報量

前回のエントリでは前提となる問題設定がきちんとできてなかったので混乱していたのだと思う。そこで、なにか数列を渡されたときに、その情報量はどうなるのか、という問題設定で考えてみたい。簡単のために、渡される数列は円周率で1桁目から始まるものとす…

πの情報量

πの持つ情報量というのは多いのか。少ないのか。 πの値を数列とみなしたとき、そのランダム性はかなり高いらしい。つまり、次になにが来るかを予想することは難しい。しかし、それがπの値を計算したものだという事がわかっているならば、かなりの確率で次の…

iPods Hash Puzzle Unlocked

新しいiPodは曲名データベースにSHA1っぽいハッシュが入ってて、それが一致しないとなにも再生してくれないという話を昨日書いたけど、そのハッシュの生成方法はもう判明したらしい。仕事早いな。 もっとも、Appleがそのような意思を見せたということは、こ…

pcc supports C99

70年代の終わり頃にベル研で開発されたpccを改造してC99対応させようとしている人がいる。"The big benefit of it is that it is fast, 5-10 times faster than gcc"らしい。 CよりもC++のコンパイラが欲しい。C++のコンパイルがgccより5倍とか10倍とか早い…

新しいiPodはiTunesでないと曲が転送できない

曲リストのデータベースにSHA1ぽいチェックサムが入るようになって、それをチェックしているらしい。The new firmware will now refuse to play any songs that you legally own unless you use Apple's iTunes.

H-IIA13号機打ち上げ

SSB分離 → SSB jettison かぐや分離 → Payload separation jettisonという単語は単に分離というよりは捨てるという意味があるようだ。かぐやは捨てる訳ではないのでjettisonではなくseparation。

physical-line-mode emacs22対応(中途半端)

Emacs22になってから、physical-line-modeのC-a, C-eの動きがおかしくなってしまっていて困っていた。特にC-eがC-nと一緒の動作をしてしまうというのが地味に厳しく、悲しかった。 こういうのが困るのは論文を書いたりするときなんだけど、さすがに修論を書…

新手法の考案

自分が思いついた手法が10年前には既にメジャーで、しかも現代的な手法よりも劣る事を知ってしまった時の絶望。まぁ、期待して実験して駄目だった、という時の絶望感に比べればまだマシか…。

Meet Jeff

Meet Jeffによると、"Jeff is an incredibly smart guy."とか書いてある。ただ、後ろを読んで行くと、どうもこれは皮肉であるように感じられる。英語が得意でないので、皮肉であるのかどうか、はっきりとはわからないんだけど。

Smaller footprint for images in Firefox

Firefoxで画像を圧縮した状態で保持するパッチ。現状ではFirefoxは全ての画像をいったんメモリ上で展開してしまうが、それをせずに、必要な時のみ展開するように変更する。

Language-Independent Set Expansion of Named Entities using the Web

Language-Independent Set Expansion of Named Entities using the Web (R. C. Wang and W. W. Cohen, 2007)を読んだ。例のSEAL(Google SetsとかBayesian Setsに似た奴)のアルゴリズムについて書いた論文だ。ちゃんと固有表現抽出までやってるとしか思えない…

Unsupervised CRF is an open problem?

このPDF資料にはOpen Problemって書いてあるんだけど、こっちではwe propose an unsupervised conditional random fieldsって書いてある。時期的に後者の方が後っぽいから、おかしくはないんだけど。 そもそも本当にOpen Problemなの? 解法が提案されたのに…

絶望した!ポーリングでCPUを喰らい尽くすX Window Systemに絶望した!

参考リンク1と参考リンク2。 実際のところ、Gtk+ではビジーループを回しているのだろうか。我々はCO2の排出量削減のためにやけに暑いオフィスで仕事をさせられたりしているというのに、そんな富豪的な電力の使い方をしているのだろうか。本当であるとしたら…

XCBではどうなってるのか

XCBではイベント回りの事情はどうなってるのか、気になったのでついでに調べてみた。xcb_wait_for_eventというイベントが到着するまでブロックする関数と、xcb_poll_for_eventというイベントがなかったらNULLが返ってくる(ブロックしない)関数が用意されて…

rhtml

全部自分で書くなら、つまり、デザイナーと協業とかする必要がないなら、rhtmlってあんまりいい選択肢じゃないよなー、とかrailsを使いながら思った。タグ閉じるのめんどくさいし。