πという数列の持つ情報量

 前回のエントリでは前提となる問題設定がきちんとできてなかったので混乱していたのだと思う。そこで、なにか数列を渡されたときに、その情報量はどうなるのか、という問題設定で考えてみたい。簡単のために、渡される数列は円周率で1桁目から始まるものとする。
 事前に「数列が渡される」ということしかわかっていない場合には、n桁目までの情報で次の桁を当てることは非常に難しい。
 まぁ、πぐらいならこれまでの数列からたぶんπだろう、とか当てることもできなくはないだろうけど、数列がπ+eだったらどうだ、とか考え出すと、全ての場合を網羅するのはやっぱ無理だろう。
 というわけで、この問題設定の元では、πの持つ情報量はランダムな数列とほぼ同等であるといえるだろう。
 πとランダムな数列の情報量が同じだなんておかしいじゃないか、もっとなんとかなるんじゃないか、とかいうので出てきたのがコルモゴロフ複雑性なんじゃなかろうか。コルモゴロフ複雑性では、その数列を出力するプログラムの長さを尺度とするので、πの持つ複雑性はランダムな数列より低くなる。
 情報量とコルモゴロフ複雑性の両方に共通するのは、その値を計算する事の難しさだと思う。情報量は持っている事前知識によって容易に左右されるし、コルモゴロフ複雑性は上限は簡単に計算できる(追記:そもそも上限という概念がないよね……)けれど、下限を知ることはとても難しい。(でなければコードゴルフが流行ったりはしないだろう。)
 個人的には、コルモゴロフ複雑性の方が好ましく感じる。というか、確率を的確に計算しようとすると、数列の事前分布を考慮しないといけない(人が出題する以上、πとかeとかみたいな超越数の方が単なるランダムな数列よりも出現確率が大幅に高いだろう、とか)よな、とか考え出して、どこまで考えれば良いのかよくわからなくなってしまう。