什么是Beta分布?
Beta分布是一种 连续型概率密度分布 ,通常使用 Beta(α,β) 表示,具有两个参数。Beta分布的定义域为 [0,1] ,一般用于估计伯努利事件中成功的概率 θ ,即 Bern(N,θ) 中的 θ。
Beta分布的相关推导
Beta分布的概率密度函数
推导过程中,使用 a 表示伯努利试验成功的次数, b 表示伯努利试验失败的次数。假定成功的概率为 θ ,则先验概率密度:
p(F∣θ)=(aa+b)θa(1−θ)b,
其中 F 表示已发生的事实。根据贝叶斯公式:
p(F∣θ)=p(θ)p(θ∣F)p(F),
可以得到后验概率密度 p(θ∣F) 满足如下关系:
p(θ∣F)∝θa(1−θ)b.
由于 θ∈[0,1] ,因此对上述概率密度函数进行归一化,得到 θ 的概率密度函数:
f(θ)=∫01ta(1−t)bdtθa(1−θ)b.
定义:α=a+1 , β=b+1 ,则上式可以改写成规范形式:
f(x;α,β)=B(α,β)xα−1(1−x)β−1,
其中: B(α,β)=∫01tα−1(1−t)β−1dt .
Beta分布的期望和方差
首先,不加证明地给出Beta函数与Gamma函数存在的如下关系:
Beta(α,β)=Γ(α+β)Γ(α)Γ(β).
因而:
E(X)=∫01xf(x;α,β)dx=∫01xB(α,β)xα−1(1−x)β−1dx=B(α,β)B(α+1,β)=α+βα.
同理可得:
E(X2)=(α+β+1)(α+β)(α+1)α,
于是:
Var(X)=(α+β+1)(α+β)2αβ.
Beta分布的意义
根据上述推导过程,可以看出,Beta分布常用于估计伯努利试验成功的概率。对于 n 次伯努利实验,成功次数为 a ,则伯努利试验的期望成功概率为 Beta(a+1,n−a+1).