2010-01-01から1年間の記事一覧

2010年面白かった漫画

最近、ブログを書くという点に関しては会社ブログで手一杯なので、こちらにはあまり大したことは書けそうにない。 このままだと12月は1回も書けそうにないので、2010年に読んだ漫画で面白かったやつを紹介してみる。順位とか付けるほどたくさん読んでないの…

rm twitterでウザいあいつのツイートを非表示にする

twitter、便利ですよね。実は私も、今の会社に転職したきっかけはtwitterでした。(もちろん、それだけで転職したわけではありませんが…。)それぐらい便利なサービスですので、みなさんもガンガン使っておられることと思います。 しかし、twitterを使ってい…

Firefox 4 betaを入れてみた

Firefox4 beta7から、コンパートメントという機構が導入されるらしい。これは、GCするメモリ空間をタブ単位に分ける仕組みで、これによってGCが効率化される。以前から、Firefoxはタブを大量に開いたときにパフォーマンスの低下が著しく、その一因にGCがある…

識別モデルと識別学習

"Discriminative models, not discriminative training", Tom Minka, 2005 (pdf) を久々に読み返してみた。完全に理解したとは言えないけど、それほど難しい内容でもなかった…ような気がする。 この論文(?)の主張は2つある。まず、あるモデルに対する最尤解…

emacs初心者の設定いろいろ

emacsを使い始めて早7年、初心者を名乗るのもなんだかなぁという感じではあるが、積極的に勉強せずにここまできてしまったので、未だに初心者レベルのことしかできない。しかし、初心者なりにいろいろと.emacsには便利な設定がたまってきたので、ここではそ…

google-glogに潜むトリックを解明する

google-glogは非常に有名なロギングライブラリであり、その名前からわかる通りgoogleの人々によって開発されている。使い方は簡単で、 LOG(INFO) << "this is not a drill"; みたいな感じで、LOG()が返すオブジェクトoperator なぜLOG()はマクロなのか まず…

はてブの非表示機能は結構すごい

最近気づいたのだが、はてなブックマークの非表示機能は結構すごい。 非表示機能というのはなにかというと、「この人のブックマークやコメントは見えなくする」という機能である。 ソーシャルブックマークというのは他の人がブックマーク時に残したコメント…

計算機シミュレーションのための確率分布乱数生成法を買った

Dirichlet分布からのサンプリングを実装するときに使おうと思って、echizen_tmさんのところで大プッシュされていた計算機シミュレーションのための確率分布乱数生成法を買った。 結局、Diriclet分布からのサンプリングについてはガンマ分布からのサンプリン…

Re: Re: Sinatra 1.1 出た

yharaさんから反応を頂いたので、もう少し詳しく書いてみます。 お客さんの環境はいろいろで、大抵はRHEL, CentOS, Ubuntuのどれか データ規模は数万件なんだけど、トランザクションが欲しいのでRDBMSを使いたい→手軽なSQLiteが一番良い データベース本体は…

Sinatra 1.1 出た

1.0がでた時はエントリを書きそこねたので、忘れないうちに書いておく。 リリースノート http://www.ruby-forum.com/topic/304901 リリースノートの日本語訳 http://d.hatena.ne.jp/tagomoris/20101026/1288073194 変更点の中で自分が嬉しいのは before/afte…

semi markov chainの資料

質問があったので。 http://www.worldscibooks.com/etextbook/5979/5979_chap1.pdf 私が見つけて勉強することをあきらめたsemi markov chainの資料は上記のURLのものです。もっかい見直したけど、ボレル測度の時点でもう無理っす。情けないわ。もっと勉強せ…

条件付き確率場のマルコフ性とか準マルコフ連鎖とか

実装する上ではどうでもいい、言葉の定義の問題のところに足を突っ込みつつあるような気もするけれど、CRFについて調べていたらどんどん混乱してきたので、現在のところの理解をまとめてみる。たぶん、突っ込みどころはいっぱいありますので、突っ込んで頂け…

rxを読んだメモ

rxはGoogle日本語入力(Mozc)でも使われているTrieのライブラリである。LOUDSというツリーを表す簡潔データ構造を使ってTrieを実現している。第2回自然言語処理勉強会@東京に行ってきて、そういえばrxは読んでなかったなと思ったので、ちょっとだけ読んでみ…

アットホームのこだわりアカデミーが面白かった

カッコウについて調べていて偶然発見したのだけれど、アットホームのこだわりアカデミーというサイトが面白かった。面白かった記事をいくつか紹介する。 カッコウとオナガの闘い−托卵に見る進化 カッコウが托卵を行うことは有名であるが、江戸時代と今では托…

なぜJSONPだとクロスドメイン制約を超えられるのか?

なぜ通常のXMLHttpRequestにはクロスドメイン制約があるのに、JSONPではクロスドメインでリクエストを送信できるのか?不思議に感じたので、ちょっと調べてみた。 クロスドメイン制約は「ブラウザ上で実行されるJavaScriptは同じドメインにしかリクエストの…

ThinkPad X201sに乗り換えた

これまでThinkPad X200sを使ってきたのだけれど、バッテリがヘタってきたとか、Lenovo直販premium clubのクーポンが半年に一度のレベルの割引率になっているとか、そうやって自分に言い訳をしながらX201sを購入した。購入が9/5で到着が9/15と、来るまでには…

聞くと楽しくなる音

人にはそれぞれ、好きな音、嫌いな音があって、その多くは人々の間で共有できるような気がする。例えば、チョークで黒板をこする音がきらい、なんていうのは多くの人の間で共有できるだろう。 嫌いな音の話を書いても仕方ないので、好きな音の話を書く。飛行…

C++で例外を使ったプログラムをうまく書くにはどうすればいいのか(2)

こないだの記事はアクセス数の割に意外とたくさんコメントや反応を頂いたのだけれど、いろいろ考え始めると、なかなかコメントが返せなかった。 で、私はtry-catchを書くとそのブロックが呼び出される際に微妙にオーバーヘッドがかかるものだとばかり思って…

C++で例外を使ったプログラムをうまく書くにはどうすればいいのか

C++とはできるだけ離れた人生を送りたいと願ってきた。しかし、なかなかそうもいかず、最近はだんだんとC++の知識を学びつつある。今更C++を勉強するなんてちょっと出遅れすぎてるんじゃないかという気もするが、もうすぐ新規格であるC++0xもリリースされる…

強烈に便利なzshrcの設定 3種盛り

タイトルはやや釣りぎみのような気もするが、この設定がないサーバで長時間作業したくない、と思う程度には便利なので、個人的には釣りではないと言える。 ctrl + 矢印で単語単位のカーソル移動 コマンドの真ん中あたりに間違いがあった場合、修正するために…

言語処理のための機械学習入門を読んだ

言語処理のための機械学習入門という本が出版される、という話はtwitterで知っていたのだが、8月ぐらいに出るのだろうとばかり思っていたら、なんかもう発売されているらしい。Amazonでは早速売り切れていたので、某大学生協の書籍部まで行って購入してきた…

UnicornでSinatraアプリをデプロイしてみた

最近は仕事でSinatraアプリを書いたりしているので、Sinatraアプリを動かすためにはどのHTTPサーバを使うのがベストなのかが気になっている。(先に結論を書いておくけれど、どれがベスト、という唯一の選択肢は今のところありません。適材適所です。) Sina…

Preferred Infrastructureは今年も夏期インターンを募集していますよ

あまり話題になっていませんが、私の勤務先のPreferred Infrastructure(略称PFI)では、今年も夏期インターンを募集しております。この夏は何をしようかなと悩んでいる大学3年生の方や大学院1年生の方などはぜひご検討ください。→ http://preferred.jp/intern…

単語分割器Micterを公開しました

しばらく日記書いてなかったら、また文体忘れて敬体で書いちゃったよ…。でも常体に書き換えるのもめんどくさいのでこのままうpします。 単語分割器を作ったので、githubで公開しました。→http://github.com/tkng/micter 名前は単純にMIC segmenTERでmicterに…

iPadの良いところと悪いところと悪いところ

5/11の夕方、その時会社にいた7人の同僚のうち5人が既にiPadの予約をしていた、という異常な熱に浮かされて、iPadを予約してしまった。当然の帰結として、5/28にiPadが自宅に配送され、そして来月のクレジットカードで4万8千円ほど銀行口座から引き落とされ…

TSFはin-process serverである

MSDNのドキュメントにも書いてあるのだが、TSFにおいて、テキストサービスはin process serverであり、アプリケーションと同一のプロセス空間で動作する。Google Techtalk Tokyoで工藤さんの話を聞いた方には、ATOKはほぼ全部がアプリと同一プロセスで動作し…

ジムに行っていろいろ失敗したメモ

痩せようと、去年の9月ぐらいからジムに行き始めたのだが、いろいろ失敗したのでその結果をまとめておく。 色々失敗したので効率が悪く、8ヶ月ぐらいジムに行っていながら、まだ500gぐらいしか痩せてない。というか、一時期、ジムに行きながら1ヶ月で1kgぐら…

Mozc(Google 日本語入力)のコードを読んだメモ(2)

TSFのメモとMozcのコード読みメモを比較すると、書くのにかかった時間は4,5倍は違う(TSFの方が大変だった)のに、ブックマーク数は逆転どころか桁が2桁違う事になりそうだなぁ、と、あらためてGoogleの人気のすごさを体感した。小町さんは こんなに日本語入…

Mozc(Google日本語入力)のコードを読んだメモ

Google日本語入力がOSS化されたということで、気になっていたところをいくつか確認してみた。 変換アルゴリズムはどんな感じか? twitterの工藤さんの発言にも「わりと古典的な最小コスト法」とあるけれど、まさにそんな感じ。人名の処理とかでちょっと特別…

Text Service Frameworkに関するメモ

諸事情でWindowsの文字入力について調べたのだが、専門用語が多くて理解に時間がかかったので、数ヶ月後の自分のためにメモしておく。 Text Service Framework(以下TSF)は汎用的な文字入力フレームワークで、キーボードだけではなく、音声認識や手書き入力な…