品詞を決める意義

 かな漢字変換でUnsupervised HMMを使ったらどうかなとか考えてたんだけど、コーパスを増やしたら品詞の割り当てが変わってしまうようでは、(ユーザの)入力結果の学習が非常にやりにくい。品詞体系を決めて学習コーパスを作ってしまえば何の問題もないことなんだけど。
 本当にやりにくいのか、なんかうまい手があるんじゃないか、と考えてたんだけど、どうも思いつかない。