2007-02-01から1ヶ月間の記事一覧

geditにインクリメンタルサーチがついてる

C-kに割り当てられているようだ。 ちょっと試してみたが、入力用テキストエントリの表示される位置がなんだか微妙な気がする。

Emacsのインクリメンタルサーチの挙動

打ち間違えたときの挙動とかがあまり直感的ではないように感じているのだが、具体的にどう直感的ではないのかは説明が出来ない。というか、よく考えてみると、どういう動作が直感的なのかすらよくわからない。

renice効いた

renice -5 -p pidで、実験結果の出力速度が150KB/hour程度から240KB/hour程度にまでアップした。すごく効いてる。それとも、単に評価データの関係なのだろうか?

進捗

対照実験のやりなおしに、予想以上に時間を取られた。全体の7割ぐらいまで進んだところでプログラムが暴走した模様。もう一度最初から走らせて同じところで暴走されると泣ける(暴走した時点までの実行に丸一日以上の時間がかかっている)ので、途中から実験…

コントローラ名

コントローラの名前というのは、単純にモデル名をそのまま使うべきでは無い(と思う)。 デフォルトのscaffoldが生成してくれるコードは、モデルに対して標準的な操作を行うための物であるけれども、これは「モデルに対する」コントローラであるので、それ以…

Lisper

Lispで有名なT教授の研究室には、今ではLispを使う学生は一人しかいないらしい。これだけ聞くとLisperは絶滅危惧種なので保護しなければならないのでは、といった考えが浮かぶが、一方I研究室ではロボットの制御ソフトウェアがLispで書かれているので、90%以…

メール

狩野さんからのメールがSPAMフィルタにひっかかってるのを発見。申し訳ございません、あとで返信します…。

継続とは

継続、を説明できるかどうか試してみる しかし、全部のデータを保存することは現実的ではありません。例えば、インターネットからHTTPでファイルを取得して、それを解析するとしますと、厳密にはそのインターネット上のファイルや、それどころか、インターネ…

テンプレート内に条件分岐を記述する

読みにくくなるのでテンプレート内に条件分岐はできるだけ書きたくないのだけど、方法が思いつかないので結局大量に条件分岐を書いてしまっている。書けば書くほど使いやすくなるけれどメンテナンスしにくくなる二律背反。

3/1

ここにメモしておくのが一番検索しやすいので。3/1の10:00から健康診断。それが終わったら14:30から別のところで検査。

どこで間違っているのかもわからない

今更いちいち書くようなことでは無いような気もするが、データベース設計は難しい。今は、以下のような問題設定の元で悩んでいる。 ユーザはレポートを書く(レポートはユーザに所属する) レポートにはどの問題に対するレポートであるのかという属性がある …

Wikipediaのデータを自然言語処理の実験に使うのはやめておけ(2)

前にWikipediaのデータを自然言語処理の実験に使うのはやめておけという日記を書いたが、バグを潰して実際に実験で信頼性の高い結果を得られるようになってきて、また似たような事(でもちょっと違う事)を感じたので書いておく。 当たり前ではあるが、Wikip…

名前を付けるのが苦痛だ

プログラムを書くという作業の半分は変数の名前を考える事だと言っても過言ではないと思うのだけど、適切な名前を考えるのは簡単な事ではない。例えば、ある条件を満たすファイルをリストアップしてきて、さらにその中から条件を満たすファイルだけをリネー…

Rによる確率分布からのサンプリング

実験コードが不可思議な挙動を示すので、小さなデータセットを作って意図通りの挙動を示すかどうか確認してみることになった。なぜ修論提出後にこんな事をしているのかというと、実装が間に合わなかったからである。これについてはまたいつか。 LDAに従った…

不可思議

適当に作ったデータで実験した所、予想通りの結果が出た。しかし、実際の自然言語のデータで試すとうまくいかない。どうも、成果はノイズに紛れ込んでしまっているような気がする…。

Emacsが…

ファイルを保存しようとすると2分ほど無言になる。しかもgdbでも止められない。straceで追いかけてみた所、fsyncにすごく時間がかかっているようだ。システムコールを呼んでいる間はgdbでも制御を奪えないっぽいね。 どうしたもんかと悩んだ挙句、カーネルの…

メモリの大量使用とGC

研究で使っているソフトウェアの動作を眺めていると、割と頻繁に停止する。どうも、GCに時間がかかっているらしい。メモリを数百MB使っているので宜なるかな、というところではあるが、これはちょっと厳しい。実行時間の2〜3割ぐらいはGCが占めているような…

依存性のないループから依存性のあるループへの書き直し

リストの各要素への繰り返しはまぁ、mapで書ける。それが読みやすいかどうかは別問題として。 しかし、前から順に要素を見ていって、ある条件が真になったらそこでループ打ち切り、みたいなコードに書き換えたくなったらどうしたらいいか? 再帰を使う fold…

近況

祝!修論再提出決定 バグは取れたがまだ不可思議な挙動を示す Perplexityは下がるのだが予測性能は上がらない… そもそもUnigramに負けるってどういうことよ そろそろ旅に出たくなってきました。探さないでください