クラスタリング結果を可視化してみた。可視化にはgraphvizを使った。当初はPNG形式での出力を試してみたのだが、10分以上経っても終わらないのであきらめた。ラスタ画像形式が良くないのかも、と淡い期待を抱いてSVG形式での出力を試してしてみると、なんと1…
類似度計算で、最も類似度の近い文書対を返すべきところで最も遠い文書対を返していた事に気づいた。修正してクラスタリングをやり直してみると、大きな一つのクラスタができあがった…。orz
予備実験として文書のクラスタリングをしているのだが、どうにもうまくいってないような感じがする。やはり単語の重みづけぐらいはしないとダメか…。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。