前言

截止写这篇文章时，笔者正在学习泊松分布，由于泊松分布是对于笔者这个概统初学者而言是一个新知识，且笔者手中的教材（浙大五版）并未提供泊松分布的的来源和证明过程，又笔者认为缺少这两样的说明对于我们扩充解决实际问题的思维是非常不好的，故简单记录泊松在泊松分布中是为何要解决泊松分布的问题的以及他是如何解决这个问题的

泊松分布

设随机变量 $X$ 所有可能取的值为 $0,1,2, \cdots$ ，而取各个值的概率为
::: align-center
$P{X=k}=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots$

:::
其中 $\lambda>0$ 是常数，则称 $X$ 服从参数为 $\lambda$ 的泊松分，记为 $X\sim\pi(\lambda)$
易知, $P\{x=k\}\ge 0,k=0,1,2,\cdots$ ，且有
::: align-center
$\sum_{k=0}^{\infty}P(x=k)=\sum_{k=0}^{\infty}\frac{\lambda^ke^{-\lambda}}{k!}=e^{-\lambda} \cdot e^{\lambda}=1$ （由泰勒级数）

:::

为什么？

浙大的教材对泊松分布的介绍到此戛然而止，但是想要真正的理解泊松分布为什么被这样定义，我们需要从二项分布入手

在二项分布中，要计算某个随机变量的概率，我们需要知道n重伯努利实验的次数n以及实验成功的概率p，但是有些时候我们得到的可能是“一个时间段内实验成功的平均值”（或期望值），比如笔者的的这篇文章平均一天有5次点赞，那么这种情况下二项分布便不再适用，我们缺少必要的条件
就算我们通过历史数据和平均值找到了n和p，二项分布还有一个弱点：它只允许单位时间内包含一次事件。
- 例如我们要计算n个人看完笔者文章后给笔者点赞(虽然现在你不能点赞)的概率，设每个人会给笔者点赞的概率为p
- 这个问题，选取天为单位时间是不可能的，因为平均每天有大于1次的点赞，这不是二项分布
- 若我们选取小时为单位时间，现在我们每小时有 $\frac{5}{24}<1$ 次点赞，这意味着绝大部分时间点赞率数为0，但即使是这样我们也不能排除有一段时间有可能有大于1个点赞数，我们可能会想到继续细分单位时间，但这样做的后果就是总实验次数的爆炸性增多
- 对于入上的二进制容器问题，若我们始终将思维局限于二项分布，那么它便会永远存在，那么我们为何不一步到位，取 $n\to \infty$ 呢？

事实上，我们上面考虑问题的过程就是泊松定理背后的思维，我们不需要知道n和p，我们假设n是无穷大的，而p是无穷小的，同时假设 $np=\lambda$ ，那么此时我们将其代入二项分布的概率质量函数中并取极限，神奇的事情就会发生
::: align-left
$P(X=k)=\lim_{n\to \infty}\tbinom{n}{r}p^k(1-p)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!}$

:::
它只涉及一个待确定量 $\lambda$ ，即X的期望，在实际问题中它通常是容易获得的

前言

泊松分布

为什么？

全部评论 (0)