2006-06-27から1日間の記事一覧

予備実験3

クラスタリング結果を可視化してみた。可視化にはgraphvizを使った。当初はPNG形式での出力を試してみたのだが、10分以上経っても終わらないのであきらめた。ラスタ画像形式が良くないのかも、と淡い期待を抱いてSVG形式での出力を試してしてみると、なんと1…

予備実験2

類似度計算で、最も類似度の近い文書対を返すべきところで最も遠い文書対を返していた事に気づいた。修正してクラスタリングをやり直してみると、大きな一つのクラスタができあがった…。orz

予備実験

予備実験として文書のクラスタリングをしているのだが、どうにもうまくいってないような感じがする。やはり単語の重みづけぐらいはしないとダメか…。