卜瓦松分布
卜瓦松分布
泊松分布(;)又称Poisson分布、-{zh-cn:帕松; zh-tw:泊松; zh-hk:帕松;}-分布、布瓦松分布、布阿松分布、普阿松分布、波以松分布、卜氏分布、帕松小数法则(Poisson law of small numbers),是一种统计与概率学里常见到的离散机率分布,由法国数学家西莫恩·德尼·泊松在1838年时发表。
泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、雷射的光子数分布等等。(单位时间内发生的次数,可以看作事件发生的频率,类似物理的频率formula_1)。
泊松分布的机率质量函数为:
formula_2
泊松分布的参数formula_3是随机事件发生次数的数学期望值。
记号.
若formula_4服从参数为formula_3的泊松分布,记为formula_6,或记为formula_7.
性质.
1、服从泊松分布的随机变量,其数学期望与方差相等,同为参数formula_3 : formula_9
2、两个独立且服从泊松分布的随机变量,其和仍然服从泊松分布。更精确地说,若 formula_10且 formula_11,则formula_12。反过来若两个独立随机变量的和服从卜瓦松分布,则这两个随机变量经平移后皆服从卜瓦松分布()。
3、其动差母函数为:
formula_13
formula_14
formula_15
泊松分布的来源(泊松小数定律).
在二项分布的伯努利试验中,如果试验次数formula_16很大,二项分布的概率formula_17很小,且乘积formula_18比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散时间上的对应物。
证明如下。首先,回顾自然对数formula_19的定义:
formula_20
二项分布的定义:
formula_21。
如果令formula_22, formula_16趋于无穷时formula_24的极限:
formula_25
最大似然估计(MLE).
给定formula_16个样本值formula_27,希望得到从中推测出总体的泊松分布参数"formula_3"的估计。为计算最大似然估计值,列出对数似然函数:
formula_29
formula_30
解得"λ"从而得到一个驻点(stationary point):
formula_31
检查函数formula_32的二阶导数,发现对所有的"formula_3"与formula_27大于零的情况二阶导数都为负。因此求得的驻点是对数似然函数"formula_32"的极大值点:
formula_36
例子.
对某公共汽车站的客流做调查,统计了某天上午10:30到11:47来到候车的乘客情况。假定来到候车的乘客各批(每批可以是1人也可以是多人)是互相独立发生的。观察每20秒区间来到候车的乘客批次,共观察77分钟*3=231次,共得到230个观察记录。其中来到0批、1批、2批、3批、4批及4批以上的观察记录分别是100次、81次、34次、9次、6次。使用极大似真估计(MLE),得到formula_3的估计为formula_38。
生成泊松分布的随机变量.
一个用来生成随机泊松分布的数字(伪随机数抽样)的简单算法,已经由高德纳给出(见下文参考):
algorithm "poisson random number (Knuth)":
init:
Let L ← "e"−λ, k ← 0 and p ← 1.
do:
k ← k + 1.
Generate uniform random number u in [0,1] and let p ← p×u.
while p > L.
return k − 1.
尽管简单,但复杂度是线性的,在返回的值formula_39,平均是"formula_3"。还有许多其他算法来克服这一点。有些人由Ahrens和Dieter给出,请参阅下面的参考资料。同样,对于较大的"formula_3"值,formula_42可能导致数值稳定性问题。对于较大"formula_3"值的一种解决方案是拒绝采样,另一种是采用泊松分布的高斯近似。
对于很小的"formula_3"值,逆变换取样简单而且高效,每个样本只需要一个均匀随机数u。直到有超过formula_45的样本,才需要检查累积概率。
algorithm "Poisson generator based upon the inversion by sequential search":
init:
Let x ← 0, p ← "e"−λ, s ← p.
Generate uniform random number u in [0,1].
do:
x ← x + 1.
p ← p * λ / x.
s ← s + p.
while u > s.
return x.
参考文献.
来源.