2008-01-01から1年間の記事一覧
PulseAudioと相性が悪いらしい。チャットしか使わないのでそもそも音が鳴る必要はない。というわけで、サウンドデバイスの設定を変更してデバイスをデフォルトに戻すと、CPUを使いすぎることはなくなった。
最近Skypeを使う用事ができたのだけれど、Skypeを起動してしばらく経つと、CPU使用率が100%に張り付いてしまう。使ってるCPUはCore2Duoなので、1CPUを使いきっても重くはならないけど、ファンがぶんぶん回るのでかなり不愉快。reniceしてもCPUが空いている以…
いろいろあって最近はPythonを使っている。昔はブロックをインデントで表現するとかキモスと思ってたはずなんだけど、今となってはそこは割とどうでもいい。インデントはどうせ必要だしね。 Perlと比べると、文法はこっちの方が好み。個人的な所なんだけど、…
Easy Git pyrite yyhelp vng これらは全部Gitに対するラッパである。pyriteだけは、GUIつけるとか書いてるのでちょっと毛色が違うけど。最近はMercurialを使っているのでよくわからないけど、Gitはそれほどラッパをかぶせたくなるものなんだろうか。
メールを書いてる途中なので、日記を更新してる場合ではないのだけれど、現実逃避で少しだけ。 確率的言語モデル(北, 1999)を見直したら、P.72に「さて、クラスが与えられたとき、各単語のクラスへの割り当てに関してはいろいろな場合が考えられる。各単語は…
Class N-gramモデルというのは、各単語はあるクラスに所属するものとし、クラスの連なりによって次の単語の確率分布を予測する言語モデルである。各単語がどのクラスに所属するかは、コーパスの対数尤度を最大化するように決定される。 このモデルはHMMと非…
t/o
アクセスログを見てると、tkngで検索してこの日記に複数回来てる人がいたりしてちょっと怖い。回数が多すぎるので、たぶんFirefoxの先読み機能なんじゃないかと思うけど、検索されてるという事実が。そんな検索キーワードではなにも情報は見つからないっすよ…
タイトルがよく分からないことになってしまっているが、順を追って説明させて欲しい。 最近、GmailのCAPTCHAが破られている事が話題になっている。どのような手法が用いられているのか分からない(人力かもしれないよね)が、ともかくCAPTCHAが破られている。…
TinySegmenterというJavaScriptで書かれた日本語分かち書き用のソフトウェアがある。全部合わせて25KBという小ささ。だけど、精度的な面ではやはりMecabとかに負ける。サイズがサイズなので精度は仕方がないけど。そんな感じなので、オフィシャルサイトにも…
Deep Belief Netが面白そう Restricted Boltzmann Machineというのを勉強しないといけなさそう? Restricted Boltzmann Machineの前に普通のBoltzmann Machineの勉強が必要そう Boltzmann MachineはHopfield Networkにsimulated annealingを導入したものらし…
AKB48というアイドルグループが、CD付属のポスターを全員分集めると参加資格が得らられるリリース記念イベント「春の祭典」を開催するそうだ。2chとかでも反応がすごいみたい。1枚1250円のCDで、ポスターはランダムに付属、人数は44人という、直感的にはどれ…
お前んとこのサーバSPAM送ってんぞと注意が来て、確認してみると確かにSPAM送ってました。orz とりあえずSMTPサーバを止めたので、対策が完了するまで、数日メールが読めなくなります。御用の方は 姓.名@gmail.com (姓.名の部分はローマ字)まで送って下さい…
Mercurialでは複数のファイルを変更した際に、一部のファイルのみをコミットする事が出来る。この機能は割とよく使うのだけど、ちょっとした落とし穴がある。共有リポジトリに他の誰かが既に変更をコミットしていた場合に、マージするのがちょっと面倒くさく…
学習データの中にノイズが混じっているということをexplicitに仮定しているような学習モデルってないのかなー。汎化性能のためにMax Marginを求めるモデルだとか正則化項を入れるモデルだとかは知ってるけれど、もっと丁寧にノイズを取り除く方法って誰か考…
プログラムというのは機械的に読めて、機械語に翻訳できたりそのまま実行できたりする。だけど、正しくないプログラムというのは正しくないので、それを正しいプログラムを扱うための処理系に処理させても、うまく処理できない。 正しくないプログラムを正し…
midoriというweb browserがある。midoriのレンダリングエンジンはWebKitだけで、Geckoはサポートしてない。それはともかく、midoriのウェブページを久々にチェックしてみると、featureに"Extensible via Lua scripts"なんていう項目があった。前に見たときは…
Wikipediaのプログラム意味論のページによると、プログラムに関する意味論は公理的意味論 (axiomatic semantics)、操作的意味論 (operational semantics)、表示的意味論 (denotaional semantics) の3つに大別されるそうだ。 しかし、説明を読んでも、なにが…
学生時代、同じ専攻にいたある教官は、遺伝的アルゴリズムを利用した研究を嫌っていた。別に理由のないことではなく、遺伝的アルゴリズムはどんな問題でもだいたいそこそこうまくこなすが、出た結果をそこからさらに改善する方法がなく、オリジナリティを発…
エラーメッセージから重要キーワードを抽出して、Google Code Searchで検索する。 一行で終わるのも何なので、実例を挙げる。例えば、先日はgtk-doc-toolsをインストールしていないとautoreconfをする際に"gtk-doc.make:7: GTK_DOC_USE_LIBTOOL does not app…
かな漢字変換でUnsupervised HMMを使ったらどうかなとか考えてたんだけど、コーパスを増やしたら品詞の割り当てが変わってしまうようでは、(ユーザの)入力結果の学習が非常にやりにくい。品詞体系を決めて学習コーパスを作ってしまえば何の問題もないこと…
"A major step backwards"は"重大な退化"とでも訳せばいいのかな?"MapReduce: A major step backwards"という記事が話題になっているようだ。続編も出ている。書いた人の1人はIngresやPostgresのmain architectだったらしい。 データベースコミュニティにと…
こないだ書いた話の続き。ボタンの赤い部分よりもちょっと上を押すと、クリックが出来ることに気づいた。どうもセンサの設置位置がずれてるとか、そういう問題っぽい。 分解してセンサ位置をずらせば何とかなりそうなので、ドライバーで分解して見てみたんだ…
会社に入るまでは、15%とかあらかじめ人数だけ決めてレイオフするなんて道理に合わないと思ってたんだけど、会社に入ってからは考えがちょっと変わった。つまり、放っておくとダメ社員はどんどん溜まって行くので、数年もあればダメ社員の割合は15%以上にな…
Pooさんといっても、くまのプーさんではない。 A Scary Letter from Poo Lab@UC Berkeley via potasiumchの日記。UC BerkeleyのPoo教授が研究室のメンバーに向けて出したメール。うちの研究室ではこれぐらいはやらないといけないよ、というような事が書いて…
年末年始になんか妙に値段が安くなってた(普段一万円以上するのが6000円ちょっとぐらいだった)ので、ThinkPlus USBトラベルキーボードを買った。さっそく今はそれを使って打っているんだけど、どうもキーの感触が安っぽい気がする。キーの感触は初めて買っ…
最近というか、今年に入ったぐらいで気づいたんだけど、最近のGoogleの異表記対策はかなり踏み込んだところまでやってる。「TrackPoint」で検索すると検索結果のsnippetで「トラックポイント」も強調表示される。実際に検索結果にまで影響を与えているのかど…
LatencyTOPというツールのバージョン0.1がリリースされたそうだ。Linux用のパフォーマンス測定ツールで、各処理(プロセスのフォークだとかファイルの読み取りだとか)にかかった平均時間と最大時間が計測できる。応答性の高いプログラムを書くためには非常…
MRIにおいて、なぜ「the lucky stiff(幸運な死体)」が同じことをするように、Sandbox Hackを提供するのだろうか? たしかに、"why the lucky stiff"がハンドルネームだということを知らなければ、正しく訳すのはかなり厳しそうだ。機械翻訳でこれができる…
数日前に公開された言語処理学会第14回年次大会のプログラムを見た。 こういうプログラムとか見ると、自分も新しいことしないとな、という気持ちになれて良い なんとLDAに関する発表が2件も。これは気になる。岐阜ではLDAがブーム? 他に興味があるのはC1-3 …