TIMEDOMAIN lightのノイズを2000円で除去した

 数カ月前にTIMEDOMAIN lightを買ったのだが、ケーブルのシールドが甘く、PCの近くで使うとノイズがひどく、結構イライラさせられていた。
 できればケーブルを全部取り替えたかったのだが、残念なことにこのスピーカーのケーブルは直付けされており、自分で交換するためにははんだごてやニッパーが必要になる。実家ならいざ知らず、ここには工具と呼べるようなものはドライバーしかない。工具を揃えるとお金がかかる。
 そこで、次善の策としてケーブルをアルミホイルで巻いてみた。見た目はかなり悲惨なことになるが、なかなかの効果があった。うまいこと電磁波が強いところを避けて設置すればノイズはかなり低減される。ただ、アルミホイルでは耐久性が低く、ケーブルの設置難易度は日を追って上昇するばかりであった。
 しばらくは対策が浮かばず悩むばかりだったのだが、ふと金属テープをケーブルに巻けばシールドできるのではないか、ということに思い至り、Amazon銅箔粘着テープ 25mm×20m No.831Sを注文してみた。
 届いた粘着テープをケーブルに巻きつけてみたところ、めでたくノイズは激減した。スピーカーの近くに耳を寄せてもノイズはほとんど聞こえなくなった。めでたしめでたし。
 2万円しないスピーカーのノイズ対策に2000円弱も使うのはどうなのよとか、注文する前はちょっとそんなことも考えてしまったが、ノイズがないというのは精神衛生上大変よろしい。結果としては買って良かった。

日本語入力に関する本を書いています

 WEB+DB PRESS vol.64の発売日ということで、雑誌記事の中身がオープンになるので、こちらでも情報をオープンします。
 今、日本語入力に関する本を書いています。出版社は技術評論社で、今秋発売に向けて鋭意執筆中です。
 本のコンセプトとしては、手を動かして実際に作れるようにしたいというスタンスで、話題は思いっきり実装よりに振っています。7割ぐらいはデータ構造と機械学習の話だと言っても過言ではありません。
 カッコウハッシュ、ダブル配列、LOUDS、構造化パーセプトロン、構造化SVMなど、これまでの日本語の書籍にはあまり載っておらず、知りたければ大学のそれっぽい研究室に行くか、自分で論文かブログ記事を探して読むかでもしないと手に入らなかった知識を丁寧に説明してあるところが特徴です。自分が学生時代に知りたかったトピックを詰め込みました。
 また、系列ラベリングに関してこれだけ力を入れた本は、私の知る限り日本語の成書では他にないとおもいます。基礎的なところに力を入れていることもあり、学部生や自然言語処理を専門としない大学院生、社会人の方など、自然言語処理に興味をもっているけれど気軽に読める教科書ないかなー、と探している人にもピッタリの本になる予定です。お楽しみに!

WEB+DB PRESS vol.64に日本語入力の記事を書いたよ

 WEB+DB PRESS Vol.64に日本語入力についての記事を書かせていただきました。特集3の「作って学ぶ日本語入力」という奴です。
 日本語入力の歴史とかについて簡単に触れた後、かな漢字変換を実際に作ってみる、という構成になっています。ビタビアルゴリズムやダブル配列、構造化パーセプトロン、構造化SVMなどのテクニックを紹介しています。この特集だけ読めば、今年の3月の言語処理学会に私が出した論文(?)と同じものがたぶん作れます。日本語入力だけに限らず、教師あり機械学習を実装するときの最低限の知識、みたいなところも身につくと思いますので、WEBやDBに興味のある人だけでなく、自然言語処理に興味のある大学生の人々にもぜひ読んで欲しいと思います。データを入れ替えれば形態素解析なんかもほぼそのままで作れます。
 構成的には、確率の概念について一切触れていないところが一つのポイントになっています。統計・機械学習の技術を使う場合、HMMやCRFといった確率モデルがメジャーですが、雑誌記事の分量で確率の概念を説明してしまうとそこにページをだいぶ食ってしまうし、読者としてもおいしいところに行く前に確率で心が折れる可能性が無視できないと考え、このような構成にしました。この試みが成功していることを祈っています。
 諸般の事情により、スケジュールが死ぬほどタイトで本当に辛い執筆でした(ある事情によるものなので、普通の人が記事を書く際には安心して良いです)が、結構いい記事になったのではないかと一人で自画自賛しています。魂を削って書きましたので、NLP畑の人もWEB畑の人も、楽しんでいただけましたら幸いです。

WEB+DB PRESS Vol.64
WEB+DB PRESS Vol.64
posted with amazlet at 11.08.14

技術評論社
売り上げランキング: 4040
 ちなみに、発売日は8/24だそうです。明日書店に行ってもたぶんまだ売ってないので、買いに行くなら明後日です。

射撃しつつ前進

 知らない人がいるようなので。このブログのタイトルには射撃しつつ前進という元ネタがある。2,3分で読める短いコラムなので、まだ読んだことのない人はぜひ一度読んでみて欲しい。
 要は毎日少しずつでいいから進めという話なのだが、それだけじゃなくてJ2EEというのは援護射撃なんだというような話なんかも入っており、その説得的な文章に感銘を受けたので、その気持ちを忘れないよう、このブログのタイトルにはそれをもじって射撃しつつ前転とつけた。

PA301Wを買っちゃった

 Amazonで値段が2万円ほど安くなっていたので、NECのPA301Wを衝動買いしてしまった。解像度が横2560で縦1600というのは、体験してみると笑っちゃうほど広い。画面が広すぎて、手持ちのPCだと1台しかフル解像度で表示できなかった。
 PDFを見開きで表示して、なおかつemacsも同じ画面に表示できるぐらいに広いので、作業環境としてはかなり快適である。ノートPCだと二画面出力ができないことが多いが、これだけ画面が広ければ一画面でもいいかもなと思う。
 ちょっとというか、だいぶ高かったけど、広い画面はやはり快適だ。そうそう買い換えるものでもないので、買って良かった。多分このディスプレイを10年ぐらいは使うことになるのだろう。
 会社ではDELLの27インチのディスプレイを使っているのだが、こちらは白を表示したときに虹色が見えるのが辛いなと感じていた。それと比べるとマシだが、PA301Wも白を表示すると虹色がかって見える。もう今の液晶では、虹色は我慢するしかないのかも知れない。そこだけはちょっと残念なところである。
 kakaku.comを見てもAmazonの価格がぶっちぎりで安く、追従してる店はあまり無いみたいなので、Amazonの値段は破格なのだろう。

  • PA301W-BK
    • 黒はまだ一つだけ在庫がある
  • PA301W
    • 白は在庫切れなのか、安いのは届くまでちょっと時間がかかる

 追記:ThinkPadのドッキングステーションでつないでるのだが、ノートPCとドッキングステーションの間の接触が悪いとフル解像度が出せないみたいで、display portで接続しているのに"OUT OF RANGE"というエラーがでる。結構気を使って使わないといけないようだ。

大学院受験の思い出、あるいは食中毒には気をつけろ

 もうそろそろ、大学院の院試シーズンが近づいてきている。
 受験生の人々には、試験が終わるまでは体調、特に食べるものに気をつけろ、というアドバイスを送りたい。
 私は大学院の受験の際、初日になにか悪いものを食べたらしくお腹を壊してしまい、一晩中ホテルでずっとトイレにこもっていた思い出がある。もう何も出るものはないのだがとにかく腹が痛すぎて眠れない、という人生ではじめての経験で本当に辛かった。翌日には治ったので良かったが、治らなければ二日目の科目を受験することも叶わなかっただろう。
 タイミング的に、たぶんあの不調の原因は夕食に食べたオムライスだったのだと推測している。(受験の半年後、大学院に通い始めた頃にはそのオムライス屋は潰れていた…。)
 そういう訳で、ここは日本だと油断せず、安心できる食事を取ることは大事である。多少高くても、安心できそうなお店で食事を取るべきだ。

文書アップロード&コメントサービスのcrocodocが便利過ぎる


 crocodocというWebサービスを見つけたのだが、とても便利なのでおすすめしたい。
 crocodocで出来ることは以下の二つだけである。

  • ワードやPDFなどの文書ファイルをアップロードする
  • アップロードしたファイルにウェブ上でコメントをつける

 イメージとしては、学生が書いた論文をメールで先生に送って添削してもらう代わりにcrocodocにアップロードしてウェブインターフェースで添削してもらう、というような感じである。メールでやっても何も変わらなさそうに思えるが、crocodocを使うと、

  • 複数人で同時にコメントをつけられる。誰かがコメントを付けると、数秒後には他のブラウザでも反映される。
  • docxやpdfなどの再現性がかなり高い。Microsoft OfficeとかAcrobatを持ってない人にも気軽にコメントを付けてもらえる。

 というメリットがある。複数人で、というところは結構大きくて、二人に論文を見てもらう際など、効率が大きくアップする。同じ指摘をする必要がなくなるのでコメントする側も楽になる。これまでもGoogle Docsを使えば似たようなことができなくもなかったが、コメントが本文から機能的に完全に分離している(Crocodocでは本文は一切改変できない)ことによって、コメント一覧が見れて簡単にコメントをたどっていけるというメリットが生まれた。
 また、コメントをつけることに機能を絞ってあるので、普通にコメントが付けやすい。普通にテキストを書きこむだけじゃなくて「どこ」に対するコメントなのかを設定できる。ある点に対するコメントなのか、あるエリアに対するコメントなのかを設定でき、しかもコメント欄は自動的に欄外に生成される。
 これだけの事をブラウザ上でしておきながら動作が軽い点も良い。メモリはさすがにそこそこ使うみたいだけれど、動作速度という意味では現状で既に問題を感じない。
 ワードなんかのファイルであればそのまま日本語が通るし、pdfでもフォントが埋めこんであれば日本語が表示される。コメントにも問題なく日本語が使える。数式の再現性もご覧の通り問題ない。というか、数式はかなり綺麗で、ここもポイントが高い。
 という訳で、日本語も(ほぼ問題なく)通るし、最近のウェブサービスらしくフリーのアカウントで使える(というか、ちょっと試す分にはユーザー登録の必要すらない)ので、興味のある人はぜひ一度試してみると良いと思う。ワードとかPDFを複数人で扱う、というちょっと特殊な状況でしか便利ではないが、この特殊な状況に当てはまる人は実は日本全国に100万人ぐらいはいると思われるので、その中の数万人ぐらいはこのサービスを使っていてもよいはずである。既にそれぐらい便利なサービスである。