2008-01-01から1年間の記事一覧

SkypeがCPUを使い過ぎる原因が分かった

PulseAudioと相性が悪いらしい。チャットしか使わないのでそもそも音が鳴る必要はない。というわけで、サウンドデバイスの設定を変更してデバイスをデフォルトに戻すと、CPUを使いすぎることはなくなった。

SkypeがCPUを使い過ぎる

最近Skypeを使う用事ができたのだけれど、Skypeを起動してしばらく経つと、CPU使用率が100%に張り付いてしまう。使ってるCPUはCore2Duoなので、1CPUを使いきっても重くはならないけど、ファンがぶんぶん回るのでかなり不愉快。reniceしてもCPUが空いている以…

Python使ってみた

いろいろあって最近はPythonを使っている。昔はブロックをインデントで表現するとかキモスと思ってたはずなんだけど、今となってはそこは割とどうでもいい。インデントはどうせ必要だしね。 Perlと比べると、文法はこっちの方が好み。個人的な所なんだけど、…

Easy Gitとか

Easy Git pyrite yyhelp vng これらは全部Gitに対するラッパである。pyriteだけは、GUIつけるとか書いてるのでちょっと毛色が違うけど。最近はMercurialを使っているのでよくわからないけど、Gitはそれほどラッパをかぶせたくなるものなんだろうか。

Class N-gramの続きをちょっとだけ

メールを書いてる途中なので、日記を更新してる場合ではないのだけれど、現実逃避で少しだけ。 確率的言語モデル(北, 1999)を見直したら、P.72に「さて、クラスが与えられたとき、各単語のクラスへの割り当てに関してはいろいろな場合が考えられる。各単語は…

Class N-gramモデルとHMM、もしくはどこが隠れてるねん

Class N-gramモデルというのは、各単語はあるクラスに所属するものとし、クラスの連なりによって次の単語の確率分布を予測する言語モデルである。各単語がどのクラスに所属するかは、コーパスの対数尤度を最大化するように決定される。 このモデルはHMMと非…

はてなダイアリーはその場編集もいいが下書き機能が欲しいね

t/o

名前で検索

アクセスログを見てると、tkngで検索してこの日記に複数回来てる人がいたりしてちょっと怖い。回数が多すぎるので、たぶんFirefoxの先読み機能なんじゃないかと思うけど、検索されてるという事実が。そんな検索キーワードではなにも情報は見つからないっすよ…

真のCAPTCHAとはspam filterであり、Googleはspam filterを無料でバラ撒くようになるだろう

タイトルがよく分からないことになってしまっているが、順を追って説明させて欲しい。 最近、GmailのCAPTCHAが破られている事が話題になっている。どのような手法が用いられているのか分からない(人力かもしれないよね)が、ともかくCAPTCHAが破られている。…

TinySegmenterのつかいみち

TinySegmenterというJavaScriptで書かれた日本語分かち書き用のソフトウェアがある。全部合わせて25KBという小ささ。だけど、精度的な面ではやはりMecabとかに負ける。サイズがサイズなので精度は仕方がないけど。そんな感じなので、オフィシャルサイトにも…

Restricted Boltzmann Machineが勉強したいよ

Deep Belief Netが面白そう Restricted Boltzmann Machineというのを勉強しないといけなさそう? Restricted Boltzmann Machineの前に普通のBoltzmann Machineの勉強が必要そう Boltzmann MachineはHopfield Networkにsimulated annealingを導入したものらし…

AKB48の44枚問題とTeao分布

AKB48というアイドルグループが、CD付属のポスターを全員分集めると参加資格が得らられるリリース記念イベント「春の祭典」を開催するそうだ。2chとかでも反応がすごいみたい。1枚1250円のCDで、ポスターはランダムに付属、人数は44人という、直感的にはどれ…

しばらくメールが届きません

お前んとこのサーバSPAM送ってんぞと注意が来て、確認してみると確かにSPAM送ってました。orz とりあえずSMTPサーバを止めたので、対策が完了するまで、数日メールが読めなくなります。御用の方は 姓.名@gmail.com (姓.名の部分はローマ字)まで送って下さい…

Mercurialでのコンフリクトの解消方法

Mercurialでは複数のファイルを変更した際に、一部のファイルのみをコミットする事が出来る。この機能は割とよく使うのだけど、ちょっとした落とし穴がある。共有リポジトリに他の誰かが既に変更をコミットしていた場合に、マージするのがちょっと面倒くさく…

Noise Tolerant Learning

学習データの中にノイズが混じっているということをexplicitに仮定しているような学習モデルってないのかなー。汎化性能のためにMax Marginを求めるモデルだとか正則化項を入れるモデルだとかは知ってるけれど、もっと丁寧にノイズを取り除く方法って誰か考…

プログラムの誤り箇所訂正のための自然言語処理技術の応用について

プログラムというのは機械的に読めて、機械語に翻訳できたりそのまま実行できたりする。だけど、正しくないプログラムというのは正しくないので、それを正しいプログラムを扱うための処理系に処理させても、うまく処理できない。 正しくないプログラムを正し…

WebKit based browser midori

midoriというweb browserがある。midoriのレンダリングエンジンはWebKitだけで、Geckoはサポートしてない。それはともかく、midoriのウェブページを久々にチェックしてみると、featureに"Extensible via Lua scripts"なんていう項目があった。前に見たときは…

プログラムの3つの意味論のまとめ

Wikipediaのプログラム意味論のページによると、プログラムに関する意味論は公理的意味論 (axiomatic semantics)、操作的意味論 (operational semantics)、表示的意味論 (denotaional semantics) の3つに大別されるそうだ。 しかし、説明を読んでも、なにが…

遺伝的アルゴリズムの使用は敗北である

学生時代、同じ専攻にいたある教官は、遺伝的アルゴリズムを利用した研究を嫌っていた。別に理由のないことではなく、遺伝的アルゴリズムはどんな問題でもだいたいそこそこうまくこなすが、出た結果をそこからさらに改善する方法がなく、オリジナリティを発…

automakeやautoconfで困ったときに簡単に解決するためのtips

エラーメッセージから重要キーワードを抽出して、Google Code Searchで検索する。 一行で終わるのも何なので、実例を挙げる。例えば、先日はgtk-doc-toolsをインストールしていないとautoreconfをする際に"gtk-doc.make:7: GTK_DOC_USE_LIBTOOL does not app…

品詞を決める意義

かな漢字変換でUnsupervised HMMを使ったらどうかなとか考えてたんだけど、コーパスを増やしたら品詞の割り当てが変わってしまうようでは、(ユーザの)入力結果の学習が非常にやりにくい。品詞体系を決めて学習コーパスを作ってしまえば何の問題もないこと…

MapReduce: A major step backwards

"A major step backwards"は"重大な退化"とでも訳せばいいのかな?"MapReduce: A major step backwards"という記事が話題になっているようだ。続編も出ている。書いた人の1人はIngresやPostgresのmain architectだったらしい。 データベースコミュニティにと…

ThinkPlus USBトラベルキーボードの左クリックボタンが効かなかった件

こないだ書いた話の続き。ボタンの赤い部分よりもちょっと上を押すと、クリックが出来ることに気づいた。どうもセンサの設置位置がずれてるとか、そういう問題っぽい。 分解してセンサ位置をずらせば何とかなりそうなので、ドライバーで分解して見てみたんだ…

レイオフ

会社に入るまでは、15%とかあらかじめ人数だけ決めてレイオフするなんて道理に合わないと思ってたんだけど、会社に入ってからは考えがちょっと変わった。つまり、放っておくとダメ社員はどんどん溜まって行くので、数年もあればダメ社員の割合は15%以上にな…

Pooさんからの手紙

Pooさんといっても、くまのプーさんではない。 A Scary Letter from Poo Lab@UC Berkeley via potasiumchの日記。UC BerkeleyのPoo教授が研究室のメンバーに向けて出したメール。うちの研究室ではこれぐらいはやらないといけないよ、というような事が書いて…

ThinkPlus USBトラベルキーボードを買った

年末年始になんか妙に値段が安くなってた(普段一万円以上するのが6000円ちょっとぐらいだった)ので、ThinkPlus USBトラベルキーボードを買った。さっそく今はそれを使って打っているんだけど、どうもキーの感触が安っぽい気がする。キーの感触は初めて買っ…

Googleの異表記対策

最近というか、今年に入ったぐらいで気づいたんだけど、最近のGoogleの異表記対策はかなり踏み込んだところまでやってる。「TrackPoint」で検索すると検索結果のsnippetで「トラックポイント」も強調表示される。実際に検索結果にまで影響を与えているのかど…

latencytop 0.1

LatencyTOPというツールのバージョン0.1がリリースされたそうだ。Linux用のパフォーマンス測定ツールで、各処理(プロセスのフォークだとかファイルの読み取りだとか)にかかった平均時間と最大時間が計測できる。応答性の高いプログラムを書くためには非常…

幸運な死体

MRIにおいて、なぜ「the lucky stiff(幸運な死体)」が同じことをするように、Sandbox Hackを提供するのだろうか? たしかに、"why the lucky stiff"がハンドルネームだということを知らなければ、正しく訳すのはかなり厳しそうだ。機械翻訳でこれができる…

岐阜大でLDAが流行ってる?

数日前に公開された言語処理学会第14回年次大会のプログラムを見た。 こういうプログラムとか見ると、自分も新しいことしないとな、という気持ちになれて良い なんとLDAに関する発表が2件も。これは気になる。岐阜ではLDAがブーム? 他に興味があるのはC1-3 …