HTreeを試してみた

 scrAPIの処理速度に不満があったので、HTreeを試してみた。
 正しく使えているかどうか自信がないのだが、ht=HTree.parse(str)でstrをパースしてツリーを作り、あとはtraverse_elementやeach_attributeを使ってトラバースしていく、という感じみたいだ。
 scrAPIと同じ処理をさせてみると、68秒ぐらいかかった。まぁ、一端parseしてからtraverseしてるから、こんなもんですかね。/proc/pid/statusによると、VmPeakは273708kB。つまり273MB。これはさすがに辛い。
 ところで、scrAPIでの処理は機能は2秒ぐらいだったと思ったのだが、今日もう一度測りなおすと40秒ぐらいかかる上に、VmPeakも88900kBまで増えている。明らかになにかおかしいんだけど、どこがおかしいのかわからない。困った。