NAMs出版プロジェクト: サンクトペテルブルクのパラドックス：ベルヌーイ

　　　　　　　　　　　　　　　　（経済学、リンク::::::::::）
NAMs出版プロジェクト: 行動経済学：メモ
http://nam-students.blogspot.jp/2016/02/blog-post_36.html

モーリス・アレ：世代重複モデル（QLG:overlapping generations model）再考

http://nam-students.blogspot.jp/2016/03/qlgoverlapping-generations-model.html

ハーバート・サイモン（Herbert Alexander Simon）

http://nam-students.blogspot.jp/2016/03/herbert-alexander-simon.html

NAMs出版プロジェクト: プロスペクト理論：追記

http://nam-students.blogspot.jp/2016/03/blog-post_19.html

NAMs出版プロジェクト: サンクトペテルブルクのパラドックス -ベルヌーイ

http://nam-students.blogspot.jp/2017/04/blog-post_44.html@

NAMs出版プロジェクト: 『ミクロ経済学の力』神取道宏著（2014年）：書評＆目次
http://nam-students.blogspot.jp/2015/02/blog-post_82.html

ラムゼー…F.R.Ramsey…：メモ

http://nam-students.blogspot.jp/2016/03/1928frramseya-mathematical-theory-of.html

（"Truth and Probability" (1926) ,(「真理と確率」)
　https://core.ac.uk/download/files/153/7048428.pdf 邦訳『ラムジー哲学論文集』所収）

　ラムジーの主観的確率論はコルモゴロフが確立した公理主義的確率論を基礎においている。

　ただし、アンドレイ・コルモゴロフ -『確率論の基礎概念』坂本實訳、筑摩書房〈ちくま学芸文庫 2010年〉の原著は1933年刊行だから、ラムジーが先行している。

期待値＝200×1/2＋400×1/4＋800×1/8＋…＋100×2ⁿ×(1/2)ⁿ＋…
　　　＝100(2×1/2＋4×1/4＋8×1/8＋…＋2ⁿ×(1/2)ⁿ＋…)
　　　＝100(1+1+1+1+…)＝∞　　　・・・(1)

期待効用は、

　ＥＵ＝(Ｕ₁×1/2＋Ｕ₂×1/4＋Ｕ₃×1/8＋…＋Ｕ_n×(1/2)ⁿ＋…)
　　　　 ∞
　　　＝Σ（１／２）^ｉ×[ｋ・log（Ｗ－ｇ＋２ⁱ）＋Ｃ]
　　　　ｉ=1
　∑（１／２）^ｉＣ＝Ｃ　だから、
　　　　　 ∞
　ＥＵ＝ｋΣ[（１／２）^ｉ×log（Ｗ－ｇ＋２ⁱ）]＋Ｃ　　・・・(3)
　　　　　ｉ=1

…

★

サンクト・ペテルブルクの逆説

　歪みのないコインをはじく。１回目に表が出れば２円、２回目も表なら４円、３回目なら８円、４回目なら16円というふうに、n回目に表が出たときに2n円の賞金がもらえるとする。表が出つづける限り、ゲームを続け、より高い賞金に挑戦してもよい。ただし、裏が出れば今までの賞金はすべて没収される。さて、このゲームに、いくらまでなら支払ってもよいか。　

　あなたならこの賭けにいくらまで払うだろうか。10円、１００円、それとも１０００円？　答えをいうと、このゲームの数学的に期待される賞金の額（期待値）はなんと無限大となる。なぜならば、賞金の期待値は、１回目について１円（確率２分の１×２円）、２回目も１円（同４分の１×４円）、３回目も１円（同８分の１×８円）となり、ずっと１円を足しつづけることになるからだ。数式的展開はＢＯＸ３‐１で詳しく論じている。

《　数式でそうなりますといわれても、はいそうですかと全財産を差し出す人はいないだろう。いったいなにがおかしいのだろうか。ベルヌーイはこの逆説を説明するために、賞金が大きくなるほど、１円あたりの満足が小さくなること（限界効用逓減の法則と呼ばれる）を仮説として提示した。財布にお金がないときに、道ばたで１００円拾えば嬉しいが、財布に１万円札が何枚もあれば、１００円には目もくれないだろう。

　要点は賞金の額面の価値と主観的な効用が異なり、両者は比例しないということである。先ほどの問題でいえば、賞金がn乗になっても、効用はそれほど大きくならない。そこで、ベルヌーイは賞金が乗数倍（２のn乗）で大きくなっても、効用は比例的（n倍）にしか増えないと考えた。

　たとえば、賞金が８倍（２の３乗）になっても効用は３倍というわけである。数学的にいえば、効用を対数関数logで表せるとき、この問題の効用の期待値（期待効用と呼ばれる）は、消費者から見て４円になり、無限の価値を持たないことが分かる。数式的展開はやはりＢＯＸ３‐１で詳しく論じている。

　こうしたアイデアは、２つの意味で歴史的にも重要である。第一に、経済学で限界効用逓減の法則が定式化されるよりも１００年以上前に、ベルヌーイは実質的に同じ結論に到達していた。

　第二に、リスクと効用を効用の期待値として表現した。２００年後にフォン・ノイマンとモルゲンシュテルンが発明する期待効用理論（expected utility theory）というアイデアの先取りとなったのである。》

コインを弾いて表か裏を見る。コインに歪みがなければ、表の出る確率は２分の１、裏の確率も２分の１となる。こうしたリスクと効用を総合したのが期待効用理論である。

…限界効用逓減とリスク回避的態度は同じことなのである。限界効用逓減の度合いが強まれば、リスクを嫌う度合いも強まる。

　リスクプレミアム　

　図３‐７を用いて説明しよう。右のくじを買ってもよいと思う金額が30万円だとしよう。確率２分の１で賞金１００万円というくじの値段が確実な30万円なので、30万円を確実性等価（certainty equivalent）と呼ぶ。このくじの期待値がもともと50万円であったことを考えると、くじの期待値と確実性等価の差額は20万円である。この20万円をリスクプレミアム（risk premium）と呼ぶ。リスクを嫌う度合いが強まれば、リスクプレミアムも大きくなる。

　限界効用逓減の法則とリスクを回避する態度が同値であると述べたが、裏返してみれば、限界効用が逓増する場合も、リスクを好む態度と同値である。

（1944年　オスカー・モルゲンシュテルン、フォン・ノイマンと共著の“Theory of Games and Economic Behavior”（『ゲームの理論と経済行動』）を出版）

興味深いのは、同一の人間が、一方で少額のギャンブルをしながら、他方で高額の保険に加入することである。自由主義経済学者として有名なミルトン・フリードマンは、こうした一見矛盾した行動を、金額の小さい領域では限界効用逓増（危険愛好的）、金額の大きい領域では限界効用逓減（危険回避的）として説明した。

　期待効用理論の要点をまとめておこう。

　　期待効用理論　　

　　　客観的確率ｐで金額Ｘ、確率1－pで金額Ｙのくじを（X, p; Y, 1－p）とおこう。その期待効用は効用の確率による数学的期待値EU（X, p; Y, 1－p）＝pU（X）＋（1－p）U（Y）と書くことができる。EU（X, p; Y, 1－p）＝pU（X）＋（1－p）U（Y）と書くことができる。EU（X, p; Y, 1－p）＝U（Z）となる金額Ｚを確実性等価と呼び、くじの数学的期待値pX＋（1－p）Yと確実性等価Ｚの差額をリスクプレミアと呼ぶ。

確率論というよりも近代経済学の肝である限界効用理論自体が行動経済学の文脈で読める…

以下転載、

ヴァリアン『入門ミクロ』#31や奥野『ミクロ』#6:8だけでは行動経済学(behavioral economics)は
わからない。

　　　　計量経済学←　統計学
　　　／　　　　　　　　　　　＼
ミクロ　　　　　　　　　　　　　マクロ
　　　＼　　　　　　　　　　　／
　　　　ゲーム理論→行動経済学

計量経済学などはマクロの統計学が出自だが、ミクロに接近し今ではそこを根拠にしている。
行動経済学をそれと並行して読むのが精神衛生上望ましい。

ちなみに、アダム・スミスは『国富論』（1776年）の中で、リスクや不確実性が人間の経済行動に
及ぼす影響に言及しており、「だれもが利得の機会を多少とも過大評価し、またたいてい
の人は損失の機会を多少とも過小評価する」（1:10:1岩波書店版 190頁）という合理性に反する
心理的要因の重要性をすでに指摘していた。

光文社新書、中公新書の同名の入門書はそれぞれ優れている(共に電子書籍版あり)。
『行動経済学経済は「感情」で動いている』光文社新書友野典男 2006
『行動経済学 : 感情に揺れる経済心理』中央公論新社　依田高典 2010★ (選ぶとしたらこちらがオススメ)
（『図解使えるマクロ経済学』もマクロ入門ではあるが触れられている。）

参考：
行動経済学は、トンデモ学問で終わるのか！？：
依田高典・京都大学経済学研究科教授に聞く　1/6 要ログイン　2014年4月21日
http://business.nikkeibp.co.jp/article/interview/20140401/262120/
竹原均 2013年ノーベル経済学賞寸評：
http://business.nikkeibp.co.jp/article/person/20131016/254676/
カーネマン、プロスペクト理論原著論文(未邦訳)。主要な図は全て以下にある。：
Kahneman, Daniel, and Amos Tversky (1979) "Prospect Theory: An Analysis of Decision under Risk", (1979),
http://www.princeton.edu/~kahneman/docs/Publications/prospect_theory.pdf
個人的には以下が重要だと思う。

Truth and Probability" (1926) ,(「真理と確率」)

https://core.ac.uk/download/files/153/7048428.pdf（邦訳：「ラムジー哲学論文集』1996所収）

ベルヌーイの逆説=サンクトペテルブルクのパラドックス

http://sky.geocities.jp/bunryu1011/sentpeteruburg.html

同- Wikipedia

https://ja.wikipedia.org/wiki/サンクトペテルブルクのパラドックス

以下本題、

サンクトペテルブルクのパラドックス

http://sky.geocities.jp/bunryu1011/sentpeteruburg.html

T：ベルヌーイは、次のようなコイン投げゲームを考案した。

『ある人が、公平なコインを、オモテが出るまで投げ続けるとする。オモテが出たらゲームは終わる。オモテが出たのが第１回目ならば２００円、第２回目ならば４００円、第３回目ならば８００円、…ｎ回目ならは１００×２ⁿ円、というように、賞金額が倍々に増大する。さて、この賭けの参加料として、いくらまで支払ったらよいか。』

S：金額の増え方は、さっきと一緒だな。
S：参加料として１０００円ぐらいなら出してもいいかな。
S：１回やるだけでしょ。せいぜい２・３回で表が出るよ。５００円ぐらいだ。
S：じゃあ、ゲームから得られる利得の期待値を計算してみよう。
　200円をもらえる確率は、1/2
　400円をもらえる確率は、1/4
　800円をもらえる確率は、1/8
　・・・　
S：金額が高くなるにしたがって確率も下がるわけだ。
T：では、期待値を出してみよう。

期待値＝200×1/2＋400×1/4＋800×1/8＋…＋100×2ⁿ×(1/2)ⁿ＋…
　　　＝100(2×1/2＋4×1/4＋8×1/8＋…＋2ⁿ×(1/2)ⁿ＋…)
　　　＝100(1+1+1+1+…)＝∞　　　・・・(1)

S：えっ、無限大！。どうして？
T：そうなんだ。期待利得の大きさから判断すれば、「どれだけ参加料を払ってもゲームに参加すべし」となる。
S：おかしいよ。例えば１万円払って２００円しかもらえないという事があるよ。
S：いや、１０回目に表が出れば、１０万２４００円。２０回だと１億４８５万７６００円だよ。これすごくない。
S：でも、９回も裏が出続けることはないよ。
S：いや、（1/2)⁹≒0.002＝0.2％ほどあるよ。
S：でも、無限大はないんじゃない？
S：この期待値がおかしいんだ。
S：期待値が無限大ということは、何回もやっていれば必ず１万円以上の儲けがあるということなの？
S：1万円どころか何億円以上だよ。
S：でもさ、賭ける度に１万円必要なんだろ。掛け金も増えていくよ。無限に儲かるとは思えないよ。

T：この問題はあまりに変なので「サンクトペテルブルクのパラドックス」と呼ばれている。ロシアの都市の名前なんだけど、そこでベルヌーイがこの問題を発表したからだ。
S：期待値が無限大なのに参加料をどれだけにするのかと聞くと、無限大にできないというところがパラドックスなんですね。
S：私ならどう考えても６００円以上は出せないな。

…

ベルヌーイの解法

サンクトペテルブルクのパラドックス

http://zakii.la.coocan.jp/enumeration/61_petersburg.htm

サンクトペテルブルクのパラドックス - Wikipedia

https://ja.wikipedia.org/wiki/サンクトペテルブルクのパラドックス

サンクトペテルブルクのパラドックス (St. Petersburg paradox) は、意思決定理論におけるパラドックスのひとつである。極めて少ない確率で極めて大きな利益が得られるような事例では、期待値が発散する場合があるが、このようなときに生まれる逆説である。サンクトペテルブルクの賭け、サンクトペテルブルクの問題などとも呼ばれる。「サンクトペテルブルク」の部分は表記に揺れがある。

1738年、サンクトペテルブルクに住んでいたダニエル・ベルヌーイが、学術雑誌『ペテルブルク帝国アカデミー論集』の論文「リスクの測定に関する新しい理論」で発表した。その目的は、期待値による古典的な「公平さ」が現実には必ずしも適用できないことを示し、「効用」（ラテン語: emolumentum）についての新しい理論を展開することであった。

パラドックスの内容編集

偏りのないコイン^{[注釈 1]}を表が出るまで投げ続け、表が出たときに、賞金をもらえるゲームがあるとする。もらえる賞金は、1回目に表が出たら1円^{[注釈 2]}、1回目は裏が出て2回目に表が出たら倍の2円、2回目まで裏が出ていて3回目に初めて表が出たらそのまた倍の4円、3回目まで裏が出ていて4回目に初めて表が出たらそのまた倍の8円、というふうに倍々で増える賞金がもらえるというゲームである。

つまり表が初めて出るまでに投げた回数を n とすると、2^(n-1)円もらえるのである。10回目に初めて表が出れば512円、20回目に初めて表が出れば52万4288円、30回目に初めて表が出れば5億3687万0912円がもらえる。ここで、このゲームには参加費（＝賭け金）が必要であるとしたら、参加費の金額が何円までなら払っても損ではないと言えるだろうか。^{[注釈 3]}

数学的には、この種の問題では、賞金の期待値を算出し、参加費がその期待値以下であれば参加者は損しないと判断する。しかし、この問題における賞金の期待値を計算してみると、その数値は無限大に発散してしまうのである。すなわち期待値を W とすると、

W = \sum_{k = 1}^{\infty} (\frac{1}{2^{k}} \cdot 2^{k - 1}) = \frac{1}{2} + \frac{1}{2} + \frac{1}{2} + \frac{1}{2} + \dots = \infty

となる。したがって、期待値によって判断するならば、参加費（＝賭け金）がいくら大金であっても参加すべきであると結論になる。

ところが実際には、このゲームでは 1/2 の確率で1円、1/4 の確率で2円、1/1024 の確率で512円の賞金が得られるに過ぎない（賞金が512円以下にとどまる確率が1023/1024）。したがって、そんなに得であるはずがないことは直観的に分かる。これが、この問題がパラドックスとされる所以である。

現実的な回答編集

現実には、賞金には上限がある。例えば、胴元の財産が1億円としよう。27回続けて裏が出ると、賞金は1億円を超えてしまうので、26回裏が出た時点でゲームは打ち切りとするべきだろう。すると、期待値は

\frac{1}{2} \cdot 1 + \frac{1}{2^{2}} \cdot 2 + \dots + \frac{1}{2^{26}} \cdot 2^{25} + \frac{1}{2^{26}} \cdot 2^{26} = 14

で14円となる。同様の計算を行えば、胴元がいくら大金持ちであっても、現実的な範囲では期待値はせいぜい数十円の範囲に収まってしまうことが分かる。

しかし、思考実験として「胴元が無限の支払い能力を持っている」と仮定することはでき、その場合にはいくらの参加費を支払うべきか、という問に答えられなければ、問題は完全には解決していない。

効用による回答編集

対数曲線。この図では底は10。

ベルヌーイは、主観的価値とでも言える「効用」を定義して、このパラドックスを回避した。誰にとっても一定の「価値」に対し、効用は、効用を評価する人の個別の事情に左右される。そして、例外はあるがほとんどの場合、金額が大きくなるほど、効用の増加具合は緩やかになる。つまり、100万円が200万円になるときの効用は、1000万円が1100万円になるときの効用より大きい。これは現在の経済学における限界効用逓減と同じ考えである。

ベルヌーイはさらに、効用は、金額の対数（底は何でもいいので、以下では単に log と書く）で得られるとした。つまり、100万円が200万円になるときの効用と、1000万円が2000万円になるときの効用とは等しい。対数関数で得られる効用を「対数関数的効用」という。このモデルは、（小さな）資産の増加による効用は資産の総量に反比例するということでもあり、これを「ベルヌーイの規則」と呼ぶ。

また、金額の期待値が金額の重み付け算術平均なのに対し、効用の期待値は、金額の重み付け幾何平均の効用となる。相加相乗の法則から、効用の期待値は、金額の期待値の効用より、ほとんどの場合小さい（例外として、賞金額が常に一定ならば等しい）。そのため一般に、効用の期待値を最大化する戦略は、金額の期待値を最大化する戦略より、リスクに対し慎重になる。

ギャンブラーの総資産を a、賭の価格を b とすると、賭終了後の総資産は

\sum_{k = 1}^{\infty} {\frac{1}{2^{k}} (a - b + 2^{k - 1})} = \infty

と発散するのは先に見たとおりだが、効用の期待値は

\sum_{k = 1}^{\infty} {\frac{1}{2^{k}} \log (a - b + 2^{k - 1})}

となり、この値は有限にとどまる。

単純なケースとして a = b（有り金全て賭ける）とすると、

\sum_{k = 1}^{\infty} (\frac{1}{2^{k}} \log 2^{k - 1}) = \log 2 \cdot \sum_{k = 1}^{\infty} \frac{k}{2^{k + 1}} = \log 2

となる。つまり、総資産2円（効用 log 2）以下なら、賭により効用は増えるので、有り金全て賭けてでも賭に参加すべきである。なお、総資産2円という状況はイメージしにくいので、賞金のスタートを1円から200万円に引き上げると、有り金全て賭けてでも賭に参加すべき資産は400万円（日本家庭の資産の中央値がこの程度である）以下となる。

しかし、総資産が2円より多いなら、2円と総資産の間のどこかに、賭けるべきか賭けぬべきかの境目となる b₀ がある。b₀ を求めるには方程式

\sum_{k = 1}^{\infty} {\frac{1}{2^{k}} \log (a - b_{0} + 2^{k - 1})} = \log a

を解けばいい。たとえば、400万円に対しては約12円となり、かなり実感に近くなる。

ただし、以上のような対数関数的効用は、パラドックスの完全な解決にはならない。カール・メンガーは、1回裏を出すごとに賞金が2倍になるのではなく、2乗になるような賭では、（賞金が資産を十分上回った後には）効用は2倍になり、期待値は発散することを指摘した。これに対しては、効用の増加具合を自然対数より緩やか（恣意的な例ではあるが、対数の対数など）にすれば対応できる。これは、100万円が200万円になる効用より100億円が200億円になる効用のほうが少ないと言うことであり、「使い切れない」ということを考えれば妥当なモデルである。しかし、効用の増加がどれだけ緩やかでも、1回裏を出すごとに「効用が2倍になる」ように賞金額を設定すれば、効用の期待値はやはり発散する。

これを完全に防ぐためには、効用には上限があると考える必要がある。つまり、ある金額を超えれば、効用は基本的にそれ以上増えない、と考えるのである。効用の上限は、金で買える全ての欲望を満たした状態を意味し、これを「至福水準」と呼ぶ。この設定により、どれだけ急激に賞金が増えても、効用の期待値は有限にとどまる。

　　反響

このパラドックスは、ダニエル・ベルヌーイの提示以降、繰り返し議論の的となっている。

ガブリエル・クラメールがニコラウス・ベルヌーイ（英語版）へ出した手紙の内容が、ダニエル・ベルヌーイの論文に紹介されている^[1]。クラメルは、金額の価値はその額面には比例しないと考え、二通りのモデルを提示した。ひとつ目は、2²⁴（約一千六百万）より大きな金額は皆等しいとするモデルであり、その場合の期待値は

\frac{1}{2} \cdot 1 + \frac{1}{2^{2}} \cdot 2 + \dots + \frac{1}{2^{25}} \cdot 2^{24} + \frac{1}{2^{26}} \cdot 2^{24} + \frac{1}{2^{27}} \cdot 2^{24} + \dots = 13

で 13 となる。もうひとつは、金額の価値はその額面の平方根に比例するとするモデルであり、その場合の「価値の」期待値は

\frac{1}{2} \cdot \sqrt{1} + \frac{1}{2^{2}} \cdot \sqrt{2} + \frac{1}{2^{3}} \cdot \sqrt{2^{2}} + \dots = \frac{1}{2 - \sqrt{2}}

となり、額面になおすとその平方で約 2.9 と計算される。ただし、これらのモデルは恣意的であって、妥当か否かの考察は全くない。

ダランベールは、期待値が無限大になるのは、ゲームを永久に続けることができるという、現実にはあり得ない仮定によるものだと指摘した^[2]。さらに、パラドックスを回避する方策のひとつとして、確率が非常に小さい場合は、その確率を 0 として扱うべきだと主張した^[3]。また、別の回避法として、n 回連続して裏が出る確率を 1/2ⁿ より若干小さいとするモデルを提示した^[4]。俗に、何回も続けて裏が出れば次に表が出る確率は 1/2 よりも大きいだろう、とする考えであり、一部の学者には受け継がれたが、現代の学者には全く受け入れられていない。

ビュフォンは子供にコインを繰り返し投げさせる実験を行った^[5]。2084回のゲームを行い、そのうち1061回で1円、494回で2円、…、合計で10057円を獲得した。この実験において、1回のゲームでの獲得金額の平均は約5円ということになる。

コンドルセは、パラドックスに関連して以下の指摘を行った^[6]。1回のゲームで A が勝つ確率が p、B が勝つ確率が q であるとすると、一般的な規則では A の賭金と B の賭金の比率は p : q とすべきである。しかし、p が非常に小さい場合、B の賭金は莫大になって破産してしまう危険性が高いため、本当の意味で公平とはいえない。これが公平であるためには、ふたりが十分な回数ゲームを繰り返すことに同意していなければならない。

標本抽出による解答編集

数学的に正しい一つの解答として、ウィリアム・フェラー（en:William Feller）による標本抽出がある。フェラーの解答を正しく理解するには確率論、統計学に関する十分な知識が必要であるが、直感的には「大人数でこのゲームを行い、その標本抽出から期待値を算出する」という手法を用いている。この手法によれば、このゲームの期待値が無限大となるのは無限回ゲームを行うことが仮定される必要があり、ゲームの回数が有限回数である場合、期待値は遥かに小さな値に収束することが示されている^[7]。

発展的話題編集

このパラドックスを理解するポイントのひとつは、ゲームを繰り返す回数である。ひとことで説明すれば、あらかじめゲームを何回繰り返すかを決めておけば、比較的公平な賭け金を設定できる、ということである。

先述のように、賞金の期待値 W は発散する。したがって、第 n 回目の獲得賞金 (n 回コインを投げるという意味ではなく、n はこのゲームに何回参加したかを表す) を X_n とすると、任意の実数 W に対して、

lim_{n \to \infty} P (| \frac{X_{1} + X_{2} + \dots + X_{n}}{n} - W | < ϵ) = 1

を満たす正数 ε は存在しない。

次に、どのように発散するかを定量的に評価することを考えてみよう。任意の正数 ε に対し、

lim_{n \to \infty} P (| \frac{X_{1} + X_{2} + \dots + X_{n}}{f (n)} - W | < ϵ) = 1

となるような関数 f は存在しないのだろうか。実は、W = 1 とすると、f(n) = n log₂ n ととることができることが知られている。つまり、(X₁ + X₂ + … + X_n)/n は log₂ n のように発散していく。

したがって、このゲームを公平に設定したければ、参加者は最初に何回このゲームに参加したいかを申告してもらい、その回数 n に応じて参加費を n log₂ n とすればよいということになる。このゲームへの参加費は、参加回数に対して非線形に増加する特殊な財である。

具体的に考えてみよう。仮に n = 1000 とする。すなわち、このゲームの販売店は、ゲーム1000回分をワンセットとして販売するのである。このときの価格は、約 9969 (≈ 1000 log₂1000) 円程度になる。

一方、ゲーム参加権はまとめ買いするよりもバラで買ったほうが得なので、消費者はバラで買おうとするだろう。すると、販売店側としてはせっかく参加費を非線形化した意味がなくなってしまい、販売店側にとっては不利である。つまり、販売店側はセットを売れば売るほど損をしてしまうし、いつかは大当たりを出されて破産してしまうと予測される。

注釈編集

^ 表が出る確率と裏が出る確率が、それぞれ正確に１／２という意味である。
^ 通貨単位は本質ではなく、どんなものでもいい。ベルヌーイの原論文ではダカット（英語版）金貨が単位となっている。これは現在の日本円に換算すると約500円相当である。
^ 言い換えれば、このゲームの主催者がトータルで損を出さない為の参加費はいくらか、という問題である。当然、その参加費より実際の参加費が高ければ結局は主催者が儲け、安ければ参加者が平均して勝って主催者は損失を被る。

脚注編集

^ トドハンター p.205
^ トドハンター p.233
^ トドハンター p.234
^ トドハンター p.242
^ トドハンター p.295
^ トドハンター p.327
^ 「確率論とその応用」- 紀伊國屋書店 (1960/01)：ISBN-13 978-4314000123

参考文献編集

アイザック・トドハンター著、安藤洋美訳『確率論史』改訂版、現代数学社、2002年 ISBN 978-4768703281
吉田裕亮「セント・ペテルスブルグの問題」（特集：パラドックスの一部）、数学セミナー、日本評論社、1993年8月
杉田洋「大数の法則」（特集：コルモゴルフの数学の一部）、数学セミナー、日本評論社、2003年11月
W.フェラー確率論とその応用（I上・I下・II上・II下）（ペテルスブルグのゲームはI下巻324ページに記載されている）　紀伊国屋書店現代経営科学全集、1969〜1983

外部リンク編集

「The St. Petersburg Paradox」 - スタンフォード哲学百科事典にある「サンクトペテルブルクのパラドックス」についての項目。（英語）
Weisstein, Eric W. "Saint Petersburg Paradox". MathWorld（英語）.

確率論史　パスカルからラプラスの時代までの数学史の一断面

版情報　　改訂版

著者名等　アイザック・トドハンター／原著　　

著者名等　安藤洋美／訳　　

出版者　　現代数学社

出版年　　２００２．１２

大きさ等　２７ｃｍ　５３１ｐ

注記　　　Ａ　ｈｉｓｔｏｒｙ　ｏｆ　ｔｈｅ　ｍａｔｈｅｍａｔｉｃａｌ　ｔｈｅｏｒｙ　ｏｆ　

ｐｒｏｂａｂｉｌｉｔｙ　ｆｒｏｍ　ｔｈｅ　ｔｉｍｅ　ｏｆ　Ｐａｓｃａｌ　ｔｏ　ｔ

ｈａｔ　ｏｆ　Ｌａｐｌａｃｅ．／の翻訳

ＮＤＣ分類 417.1

件名　　　確率論－歴史　　

目次　　　カルダン。ケプラー。ガリレオ；パスカルとフェルマー；ホイヘンス；組合せについて；

死亡率と生命保険；１６７０年から１７００年までのいろいろな研究；ヤコブ・ベルヌイ

；モンモール；ド・モワブル；１７００年から１７５０年までのいろいろな研究；ダニエ

ル・ベルヌイ；オイレル；ダランベール；ベイズ；ラグランジュ；１７５０年から１７８

０年までのいろいろな研究；コンドルセ；トランブレ；１７８０年から１８００年までの

いろいろな研究；ラプラス

ＩＳＢＮ等 4-7687-0328-3

サンクトペテルブルクのパラドックス（おかしな話）
http://sky.geocities.jp/bunryu1011/sentpeteruburg.html

サンクトペテルブルクのパラドックス（おかしな話）

―期待値から経済学へ―

１、ギャンブルで必ず勝てる方法

S：ギャンブルで必ず儲ける方法を見つけたよ。
S：ほんとぉ。どんな方法なの？

S：例えば、ルーレットで赤と黒に賭けるだろ。勝つ確率は１／２。賞金は賭けた金額の２倍。それで最初に100円賭ける。もし負けたら、次は２倍の200円を賭ける。さらに負けたら次は400円。こうやって負けたら倍々とかけていって、勝った所でやめるんだ。そうすれば、必ず100円は儲かる。

S：どうして？
S：だって、ｎ回まで負けたとすると、

合計金額＝100円＋200円＋400円＋…＋２ⁿ×100円
　　　　＝100（1＋2＋4＋…＋2ⁿ）
　　　　＝100（2⁽ⁿ⁺¹⁾－1）

でしょ。だから、その次に勝てば、２⁽ⁿ⁺¹⁾－(２⁽ⁿ⁺¹⁾－１)＝１となり、100円の儲けとなるよ。
S：100円では少ないよ。
S：だから、最初に100円の代わりに100万円にすれば、必ず100万円儲かるということになる。それに、たとえ少ない金額でも何回も繰返せば大きなお金になるよ。
S：なんか変な気がするな。勝つまでのお金が大量に必要だよ。
S：でも、確率１／２なら、何回も負け続けることはないよ。
S：実際にやってみたの？　いつ勝てるのかわからないから、お金が無くなったらアウトだよ。この方法は、金持ちでないとダメだよ。
S：３回負けたら次は８００万円だ。合計１５００万円必要だよ。

T：面白いねぇ。つい試してみたくなるような方法だね。実はこれとよく似ている賭けの問題が昔からある。考えた人はダニエル・ベルヌーイ。

２、サンクトペテルブルクのパラドックス

３、実際に実験してみよう

S：どうも不思議だ。実験してみよう。十円玉でやってみるよ。

　　回目　金額　　回数　合計金額
　　 1　　　200　　　32　　 6400
　　 2　　　400　　　20　　 8000
　　 3　　　800　　　10　　 8000
　　 4　　 1600　　　 3　　 4800
　　 5　　 3200　　　 1　　3200
　　 6　　 6400　　　 1　　6400
　　 7　　12800　　　 0　　　　0
　　 8　　25600　　　 1　　25600

合計回数　６８回で、合計金額　６２，４００円。平均９１８円

S：５００円の参加料だと、２８４００円の儲けか。
S：でも、参加料が１万円だと完全に損でしょう。
S：期待値から言えば、回数を増やしていくたびに平均金額はどんどん増えていくということなんですね。これ不思議。胴元になったら大変だ。

S：回数を指定すれば、期待値を求めることができるから問題ないのじゃない。
T：無限回やることは人間にとって不可能だよね。でも、回数を指定しないとやっぱりパラドックスは残るね。

S：ベルヌーイさんは、この問題をどう解いたのですか？

４、ベルヌーイの解法

T：ベルヌーイは、賭けに支払う料金が同じ金額でも、その人の持つ財産との関係で値うちが違うということが数学的期待値の定義では無視されたので、パラドックスが生じたものだと考えた。
S：意味がわからない。
T：例えば、同じ１万円アップといっても、所得ゼロからの１万円アップの値うちと、所得10万円からの１万円アップの値うちとは同じではないだろ。だから、賭けの期待金額は∞だけど、参加者が賞金から受ける満足の度合いは∞ではないと考えたのだ。

S：確かに、無限大にお金があっても、満足も無限大になるとは言えないもんね。
T：実際に、この賭けでいくらなら賭けますかという調査をすると、６００円という答えが一番多いらしい。期待値が無限大になることを教えても変わらないという。
S：それ心理学の問題として面白そう。

T：ベルヌーイはこの満足の度合いを、資産の高さによって変化し同じ増加金額の与える満足度は資産額に反比例して減少すると仮定した。そうすると、満足度は金額の対数をとることで表現できる。
S：なぜ対数をとるの？
T：これは、フェヒナーがウエーバーの法則を数式化するときにとった方法と全く同じなんだ。

【１０１、人間の五感は対数に変換されている】を参照

《簡単な説明（証明）》　　――――――――――――――――

資産額：Ｗ、その増分：ΔＷ、Ｗの与える満足度：Ｕ（Ｗ）、その増分：ΔＵとする。
資産の増分に対する満足度の増分は、資産額に反比例し資産の増分に比例するから、
　ΔＵ＝k・ΔＷ／Ｗ
微分で近似すると、
　ｄＵ／ｄＷ＝k／Ｗ
これを積分すると、
　Ｕ＝k・logＷ＋Ｃ　　・・・(2)
―――――――――――――――――――――――――――
S：人間の感覚は刺激が大きくなると感じ方が鈍くなってくるというのを、お金の金額にも応用したのですね。

T：そうすると、資産Ｗの人が参加料ｇを払ってこの賭けに参加した時、表がｉ回目に出れば、その資産は（Ｗ－ｇ＋２ⁱ）百円となる。（今までのゆきがかり上、百円単位になっている）
そして、
満足度Ｕ_ｉ＝ｋ・log（Ｗ－ｇ＋２ⁱ）＋Ｃ

期待満足はこの値に確率をかけてたす。（期待値と同じ）

　ＥＵ＝(Ｕ₁×1/2＋Ｕ₂×1/4＋Ｕ₃×1/8＋…＋Ｕ_n×(1/2)ⁿ＋…)
　　　　 ∞
　　　＝Σ（１／２）^ｉ×[ｋ・log（Ｗ－ｇ＋２ⁱ）＋Ｃ]
　　　　ｉ=1
　∑（１／２）^ｉＣ＝Ｃ　だから、
　　　　　 ∞
　ＥＵ＝ｋΣ[（１／２）^ｉ×log（Ｗ－ｇ＋２ⁱ）]＋Ｃ　　・・・(3)
　　　　　ｉ=1

　一方、この人が賭けに参加しない時の満足度は(2)で表わされるから、(2)の値と(3)の値が等しい時、参加料ｇの値は公平であるといえる。
そこで、(2)と(3)を等しいとおいて、kとＣを消去すると、

　logＷ＝∑(１／２)ⁱ・log(Ｗ－ｇ＋２^ｉ）　　・・・(4)

資産額Ｗ＝1000百円（＝十万円）とすると、

　log１０³＝∑(１／２)ⁱ・log(１０００－ｇ＋２^ｉ）

を解くと、ｇ＝６　　（６００円）になる。【エクセルを使うもとめ方】この式で求めたら、約１１（１１００円）になった。

S：ほとんどの人の調査結果と等しくなるね。パラドックスは消えたわけか。
S：こう考えると、(4)の値は無限にならないのですね。
T：ベルヌーイはこれを精神的期待値と呼んだ。これは、「期待効用」の最初の表現だと言われている。
S：効用って？
T：効用とは、人が財（商品や有料のサービス）を消費することから得られる満足の水準を表わす。ベルヌーイは、「資産増の金額ではなく、それがもたらす満足の増加が合理的な行為決定にとって重要だ」ということを最初に言った。ここからミクロ経済学が始まる。

S：むしろこちらの方が不思議です。期待値（の理論）がおかしいから、人間の金銭感覚を修正するということですか？
T：そうですね。期待値そのものは考慮しないで、人間の感じ方（くじをいくらで買うか）の方を修正したといっても良い。
S：この計算は、数学に人間を合わせるのではなく人間の感覚に数学を合わせたと考えられますね。
T：ある意味では「数学の人間化」ですね。でも、これはやはり数学の方に人間の感覚を合わせる「人間の理性化」の視点が強いですね。そして、この視点が経済学に導入されるきっかけだとすると、そうやって「数理化された仮説」が、数理的な合理性の中に組み込まれていくという点に「人間の理性化」が証明されているような気がします。

S：ところで、その人の持っている財産によって満足度が変わると言っても、１万円の購買力は、その人の財産に関係なく同じだよね。
S：それに、最初にいくら持っているのかで期待値（くじの参加料）が変わるなんて変だよ。
S：それから胴元と賭ける人は違うよ。やっぱり期待値そのものを無視するわけにはいけないと思う。
T：そうだよね。そこで、この期待値の方を修正する考え方をした人がいる。
　W.フェラー(1893～1990)「確率論とその応用」という人だ。

５、フェラーの解法

T：彼は、この賭けを標本抽出という確率論の文脈においた。無限に試行できない人間が賭けをするのを、標本と考えたのだ。普通は標本の大きさが増すにつれて、標本平均値は母集団平均値に近づいていく。
　この場合、期待値は母集団の平均値であり、賭けの参加者が実際に獲得する賞金額は標本値である。そうすると、標本平均値はどのようにして母集団平均値（∞）に近づいていくのか、参加料はどう変化するのかを考察できる。

　このことを例によってエクセルで調べてみよう。
試行回数を１０の累乗とし、確率を四捨五入することで分布を表わす。実際にはそうはいかないが、大数の法則で理想的な分布に近寄っていくと考える。

回　金額　　確率　参加回数10 100 1000 10000 100000 1000000 10000000
1　 200　　　0.5　　　　　 5　50　500　5000　50000　500000　5000000
2　 400　　　0.25　　　　　3　25　250　2500　25000　250000　2500000
3　 800　　　0.125　　　　 1　13　125　1250　12500　125000　1250000
4 　1600　　 0.0625　　　 1　 6　 63　 625　 6250　 62500　 625000
5 　3200　　 0.03125　　　 0　 3　 31　 313　 3125　 31250　 312500
6 　6400　　 0.015625　　　0　 2　 16 　156　 1563　 15625　 156250
7　 12800　　0.0078125　　 0　 1　　8　　78　　781　　7813　　78125
8　 25600　　0.00390625　　0　 0　　4　　39　　391　　3906　　39063
9　 51200　　0.001953125　 0　 0　　2　　20　　195　　1953　　19531
10　102400　 0.000976563　 0　 0　　1　　10　　 98　　 977　　 9766
11　204800 　0.000488281　 0　 0　　0 　　5　　 49　　 488　　 4883
12　409600　 0.000244141　 0　 0　　0 　　2　　 24　　 244　　 2441
13　819200　 0.00012207　　0　 0　　0 　　1　　 12　　 122　　 1221
14　1638400　6.10352E-05　 0　 0　　0 　　1　　　6　　　61　　　610
15　3276800　3.05176E-05　 0　 0　　0 　　0　　　3　　　31　　　305
16　6553600　1.52588E-05　 0　 0　　0 　　0　　　2　　　15　　　153
17　13107200 7.62939E-06　 0　 0　　0 　　0　　　1　　　 8　　　 76
18　26214400 3.8147E-06　　0　 0　　0 　　0　　　0　　　 4　　　 38
19　52428800 1.90735E-06　 0　 0　　0 　　0　　　0　　　 2　　　 19
20　104857600 9.53674E-07　0　 0　　0 　　0　　　0　　　 1　　　 10
21　209715200 4.76837E-07　0　 0　　0 　　0　　　0　　　 0　　　　5
22　419430400 2.38419E-07　0　 0　　0 　　0　　　0　　　 0　　　　2
23　838860800 1.19209E-07　0　 0　　0 　　0　　　0　　　 0　　　　1
24　1677721600 5.96046E-08 0　 0　　0　　 0　　　0　　　 0　　　　1
25　3355443200 2.98023E-08 0　 0　　0　　 0　　　0　　　 0　　　　0
　　　　　期待値＝平均　 460 752 1012　1435　 1756　　2019　　 2444

S：本当にこうなるの？
T：こんなにきれいに結果が出ることはないだろうけど、一つのモデルにはなると思う。

これを見ると、期待値が増加し発散することは予測できる。
では、その増え方はどうなっているのだろうか。
回数と期待値だけを取り出すと、

　回数(ｎ)　　 10　100　1000　10000　100000　1000000　10000000
　期待値　　　460　752　1012 　1435　　1756　　 2019　　　2444
　100・log₂ｎ 332　664　 997　 1329　　1661　　 1993　　　2325

回数ｎの桁数と期待値が等比的なので、期待値は回数の対数関数で表わされることが予測できる。
実際にこれを片対数グラフにするとほぼ直線になる。

NAMs出版プロジェクト

木曜日, 4月 06, 2017

サンクトペテルブルクのパラドックス：ベルヌーイ