2007-01-01から1年間の記事一覧
daryの0.3.0をリリースした。11月から公開しようしようと思ってずっといじってたんだけど、なかなかバグが取れなかったりでこんな時期になってしまった。でも、バグ修正の副作用でインデックス構築が倍以上速くなったりしたのでよしとしておきたい。 まだ改…
Charles SuttonとAndrew McCallumによるAn Introduction to Conditional Random Fields for Relational Learning(PDF)は、まだ読んでないけど、良さそうに見える。後で読む……つもり。 知りたいことの前に「An introduction to」とつけたら、なんでも見つかる…
Daryの新バージョンを公開するためにいじっていて、DartsのcommonPrefixSearchとGaucheのutil.trieでは同じような名前でも、機能が違うことに気づいた。DartsのcommonPrefixSearchでは検索キーよりも短いものが取れる。util.trieのcommon-prefixでは、検索キ…
なにかで検索してるときに見つけたんだけど、Kevin P MurphyのAn Introduction to Graphical Models(PDF)がGraphical Modelに関して結構よい文書なのではないかと思う。19ページなのでこれでGraphical Modelがわかるわけではないんだけど、とっかかりとして。…
気づいたらpulseaudioで音が鳴らせなくなっていた。libasound2-pluginsが必要であるようだ。インストールしたら普通に音が出るようになった。
probability oneという言葉がよく分からないので調べてみた。Almost surelyという概念と関係が深いようだ。調べてるうちによくわからなくなってきたので、とりあえずメモだけ。
udrepper: The Evils of pkgconfig and libtoolによると、これらのツールを使って作られた共有ライブラリには使われない共有ライブラリへのdependencyが無駄に含まれている。この問題はリンク時に-Wl,--as-neededとオプションをつけることで、一つの例外的な…
自分の使っているメールサーバがDKIMやDomainKeysに対応してない場合、MUA側で確認したいこともあると思うのだが、そのような機能を備えたクライアントはThunderbirdしか見つけられなかった。(Thunderbirdも標準では対応しておらず、拡張をインストールする…
Why doesn't EM find good HMM POS-taggers? (Mark Johnson, 2007)を読んだ。EMNLP-CoNLL2007の論文。もう学生じゃないし、仕事とはあんま関係ないから論文読んでも仕方ないんだけど、なんか読んでしまう……。 Unsupervised HMMの学習に関し、EMとGibbs Sampl…
Fail-Safe Cが公開されている。Fail-Safe Cは、完全な ANSI-C 規格への準拠を実現しながら、実行状態の破壊や乗っ取りに繋がる全ての危険な操作を検出し防止するC言語の処理系だそうだ。ライセンスはQPL。 そういえば、やや話はずれるが、pccはOpenBSDのツリ…
http://live.gnome.org/iogrind。ディスクアクセス(というか、IO)のプロファイラ。valgrindから呼ばれる形で使うっぽい。
There are no harmless race conditionsでOwen TaylorがMugshotのWindows版クライアントのアップグレード用に存在したrace conditionをデバッグしたときの事が書いてある。"combined with uninstalling and installing things about 200 times, I was able t…
プロファイラが見付からない。gprof以外の選択肢が見つけられないんですが、FreeBSDだと何でプロファイル取るのが普通なんでしょうか。user spaceのプロファイルさえ取れればいいんだけど、gprofはいちいち-pgつけてコンパイルしなおさないといけないのがめ…
A tour of git: the basicsはBryan O’SullivanのDistributed revision control with Mercurialの2章をCarl Worthがgit向けに書き直したもの。
hillbigさんに紹介してもらったCompressed Permuterm Indexをちょっと前に読んだ。Compressed Permuterm Index以前にそもそもbackward search自体が理解できなくて、refferされてる別の論文読んだりしてたらだいぶ時間がかかってしまった。 この論文に書かれ…
前回のエントリでは前提となる問題設定がきちんとできてなかったので混乱していたのだと思う。そこで、なにか数列を渡されたときに、その情報量はどうなるのか、という問題設定で考えてみたい。簡単のために、渡される数列は円周率で1桁目から始まるものとす…
πの持つ情報量というのは多いのか。少ないのか。 πの値を数列とみなしたとき、そのランダム性はかなり高いらしい。つまり、次になにが来るかを予想することは難しい。しかし、それがπの値を計算したものだという事がわかっているならば、かなりの確率で次の…
新しいiPodは曲名データベースにSHA1っぽいハッシュが入ってて、それが一致しないとなにも再生してくれないという話を昨日書いたけど、そのハッシュの生成方法はもう判明したらしい。仕事早いな。 もっとも、Appleがそのような意思を見せたということは、こ…
70年代の終わり頃にベル研で開発されたpccを改造してC99対応させようとしている人がいる。"The big benefit of it is that it is fast, 5-10 times faster than gcc"らしい。 CよりもC++のコンパイラが欲しい。C++のコンパイルがgccより5倍とか10倍とか早い…
曲リストのデータベースにSHA1ぽいチェックサムが入るようになって、それをチェックしているらしい。The new firmware will now refuse to play any songs that you legally own unless you use Apple's iTunes.
SSB分離 → SSB jettison かぐや分離 → Payload separation jettisonという単語は単に分離というよりは捨てるという意味があるようだ。かぐやは捨てる訳ではないのでjettisonではなくseparation。
Emacs22になってから、physical-line-modeのC-a, C-eの動きがおかしくなってしまっていて困っていた。特にC-eがC-nと一緒の動作をしてしまうというのが地味に厳しく、悲しかった。 こういうのが困るのは論文を書いたりするときなんだけど、さすがに修論を書…
自分が思いついた手法が10年前には既にメジャーで、しかも現代的な手法よりも劣る事を知ってしまった時の絶望。まぁ、期待して実験して駄目だった、という時の絶望感に比べればまだマシか…。
Meet Jeffによると、"Jeff is an incredibly smart guy."とか書いてある。ただ、後ろを読んで行くと、どうもこれは皮肉であるように感じられる。英語が得意でないので、皮肉であるのかどうか、はっきりとはわからないんだけど。
Firefoxで画像を圧縮した状態で保持するパッチ。現状ではFirefoxは全ての画像をいったんメモリ上で展開してしまうが、それをせずに、必要な時のみ展開するように変更する。
Language-Independent Set Expansion of Named Entities using the Web (R. C. Wang and W. W. Cohen, 2007)を読んだ。例のSEAL(Google SetsとかBayesian Setsに似た奴)のアルゴリズムについて書いた論文だ。ちゃんと固有表現抽出までやってるとしか思えない…
このPDF資料にはOpen Problemって書いてあるんだけど、こっちではwe propose an unsupervised conditional random fieldsって書いてある。時期的に後者の方が後っぽいから、おかしくはないんだけど。 そもそも本当にOpen Problemなの? 解法が提案されたのに…
参考リンク1と参考リンク2。 実際のところ、Gtk+ではビジーループを回しているのだろうか。我々はCO2の排出量削減のためにやけに暑いオフィスで仕事をさせられたりしているというのに、そんな富豪的な電力の使い方をしているのだろうか。本当であるとしたら…
XCBではイベント回りの事情はどうなってるのか、気になったのでついでに調べてみた。xcb_wait_for_eventというイベントが到着するまでブロックする関数と、xcb_poll_for_eventというイベントがなかったらNULLが返ってくる(ブロックしない)関数が用意されて…
全部自分で書くなら、つまり、デザイナーと協業とかする必要がないなら、rhtmlってあんまりいい選択肢じゃないよなー、とかrailsを使いながら思った。タグ閉じるのめんどくさいし。