土曜日, 3月 28, 2020

ベータ分布

 
 
桂隆俊@自宅トレーニングマニア
⁦‪@taka_katsura‬⁩
ここで言うところの「ベータ」って何ですか?と言うと、

簡単に言えば
このコロナショックでも過去最高益を叩き出せる(単なる過去最高益だと日経の下落に巻き込まれるので空前の最高益)会社を見つけられるかどうか
 
2020/03/28 22:11
 
 

https://twitter.com/taka_katsura/status/1243888454158745601?s=21


https://mathtrain.jp/betadistribution

ベータ分布の意味と平均・分散の導出

ベータ分布とは,確率密度関数が
f(x)=Cxa1(1x)b1(0x1)
であるような確率分布のことです。
ただし,
a,b
はパラメータ(正の実数)であり,
C
は規格化定数です。

ベータ分布の意味

ベータ分布は「コイン投げにおける表が出る確率の予測分布」という解釈ができます。
表が出る確率 
x
が不明であるコインを何回か投げて,表が
m
回,裏が
n
回出たとします。このとき「表が出る確率の予測値」は,パラメータが
(a,b)=(m+1,n+1)
であるベータ分布に従うと考えることができます(→注)。
いろいろなベータ分布の図
例えば,
(a,b)=(1,1)
のときは,ベータ分布は青い直線のように一様分布になります。つまり,
m=n=0
のとき(そもそもコインを投げていないとき)は「情報が全く無いので,
x
は一様分布に従う」と解釈できます。
(a,b)=(2,3)
のときは,ベータ分布は赤い曲線のようになります。つまり,
m=1,n=2
のときは「表が出る確率は
13
に近そうだけど,試行回数が少ないので,
13
からは遠い値かもしれない」と解釈できます。
(a,b)=(4,7)
のときは,ベータ分布は緑の曲線のようになります。つまり,
m=3,n=6
のときは「表が出る確率は
13
に近そうで,さきほどより試行回数が多いので,より自信を持って
13
に近いと言える」と解釈できます。
注:上記は大雑把な説明です。より正確に言うと,事前分布を一様分布とし,尤度が二項分布(コイン投げ)であるときの事後分析がベータ分布になります。

ベータ分布のパラメータ

ベータ分布は,
a,b
という2つのパラメータを持っています。
a,b
の値によって分布の形は大きく異なります。Wolfram Alphaでbetadistribution[a,b]と入力すればパラメータが
a,b
のベータ分布の確率密度関数のグラフを見ることができます。
a

b
をいろいろな値にして図示してみると楽しいです。
例えば,
a=b
の場合,確率密度関数は
x=12
に関して対称になります。

ベータ分布の規格化定数

ベータ分布の確率密度関数
f(x)=Cxa1(1x)b1

における
C
は規格化定数です。
C=101xa1(1x)b1dx

です。
ベータ関数を使うと,
C=1B(a,b)
と表すことができます。また,
a,b
が整数のとき,
C=(a+b1)!(a1)!(b1)!
となります。

ベータ分布の平均

ベータ分布の平均は 
E[X]=aa+b
です。これは綺麗なので覚えておいてもよいでしょう。

証明

平均は,
01xf(x)dx=01xa(1x)b1dx01xa1(1x)b1dx

ここで,分母分子はそれぞれベータ関数の積分公式
01xm(1x)n=m!n!(m+n+1)!
を用いて計算できるので,上式は
a!(b1)!(a+b)!(a+b1)!(a1)!(b1)!=aa+b

となる。

ベータ分布の分散

ベータ分布の分散は 
V[X]=ab(a+b)2(a+b+1)
です。これは覚える必要はありません。

証明

分散は,
E[X2]E[X]2=01xa+1(1x)b1dx01xa1(1x)b1dxa2(a+b)2

第一項はさきほどと同様にベータ関数の積分公式を用いて計算できる。上式は,
(a+1)!(b1)!(a+b+1)!(a+b1)!(a1)!(b1)!a2(a+b)2=a(a+1)(a+b)(a+b+1)a2(a+b)2=a(a+1)(a+b)a2(a+b+1)(a+b2)(a+b+1)=ab(a+b)2(a+b+1)

となる。
有名な確率分布は全て記事にしたいです!


iPhoneから送信