なぜNetflixはNetflix Prizeで優勝したアルゴリズムを実用化していないのか?

ダヌシカさんのツイート経由で、以下のURLから。

 超簡単に要約しておく。詳しく知りたい人は上記のリンク先を読んで下さい。

  • Netflix Prizeの優勝アルゴリズムでは多くのアルゴリズムが混合されていた。そのうちSVDとRBMは今でも使ってる。
    • 100万件のデータに使えるものであっても、1億件で利用可能なようにスケールさせるのは大変だった。
    • スケールさせるのが大変なので、Grand Prizeで用いられた数百のアルゴリズムの混合は、Netflixでは使ってない。
  • Netflix Prizeの成果を使ってない理由としては、技術の進化によってビジネスのスタイルが変換したため、という点もある。
    • 要するに、DVDをレンタルするモデルから、ビデオをインターネット経由でストリーミングするモデルに切り替わってきている。このため、問題が単なる行列穴埋めではなくなってきている。
    • わかりやすい違いとして、ユーザの反応がすぐにわかる、とか。(ちょっと大胆なレコメンドをしても大丈夫?)

 後半は力尽きてほとんど読んでないが、どんな軸でどんなオススメをするかとか、多様性(カバー率)が重要だよ、みたいな話が書いてあるような気がする。
 Netflix Tech Blogは他にもIntroducing Exhibitor - A Supervisor System for Apache ZooKeeperとか、面白げな記事が散見されるのでチェックしておくと良さそう。