生成モデルと識別モデル

 調べた限りでは生成モデルはjoint distribution、識別モデルはconditional distributionとなっているのに、pLSIはなぜjoint distributionなのに「pLSI is not a well-defined generative model」とか書かれてるのかなぁ、と思ったら、ちゃんとLDAの論文に理由が書いてあった。p(z | d)がopen dataに対して自然に定義できないので、well-definedではない、と書かれている。しかし、まだ理解しきれているかどうかはかなり怪しい。というか、pLSIがよく理解できない。研究で実際に使っている訳では無いので、あまり真剣に頑張る気にもなれない。でもちょっと気になる。そんな感じ。