論文読み2

A new compression method of double array for compact dictionariesという論文を読んだ。要するに、BASEやCHECKの要素には通常32bit intを使うけど、double arrayの元になるTRIE木を分割して大きな数字がでてこないようにすれば、16bit intで十分なんじゃないか、という話。もちろん、分割に関する情報をどこかに保持しておかなければならないわけだけれど、それでも分割した方がサイズ的には有利(だいたい半分になる。32bit→16bitなので当たり前か。)だし、スピード的にも有利(10〜30%ぐらいの改善)になるそうだ。
これだけのメリットがあるとなると、実装する価値のあるアイデアであるとは思うんだけど、実装のややこしさを考えるとちょっとウゲーとなるアイデアだなぁ。