【转】如何通俗理解泊松分布?

通过泊松分布解决馒头店老板的烦恼

甜在心馒头店

公司楼下有家馒头店:

甜在心馒头店
甜在心馒头店

每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?

老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):

周一至周五卖出的馒头数量
周一至周五卖出的馒头数量

均值为:

\begin{aligned}\overline{X}=\frac{3+7+4+6+5}{5}=5\end{aligned}

按道理讲均值是不错的选择,但是如果每天准备 5 个馒头的话,从统计表来看,至少有 40 % 的时间(也就是两天)不够卖:

40 % 的时间不够卖
40 % 的时间不够卖

你 “ 甜在心馒头店 ” 又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

老板的思考

老板尝试把营业时间抽象为一根线段,把这段时间用 T 来表示:

把营业时间抽象为一根线段
把营业时间抽象为一根线段

然后把周一卖出去的三个馒头(甜在心馒头是有褶子的馒头)按照销售时间放在线段上:

把周一卖出去的三个馒头按照销售时间放在线段上
把周一卖出去的三个馒头按照销售时间放在线段上

T 均分为四个时间段:

把 T 均分为四个时间段
把 T 均分为四个时间段

此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:

在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出
在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出

在每个时间段,就有点像抛硬币,要不就是正面(卖出),要不就是反面(没有卖出):

抛硬币
抛硬币

T 内卖出 3 个馒头的概率,就和抛了 4 次硬币( 4 个时间段),其中 3 次正面(卖出 3 个)的概率一样了。

这样的概率通过二项分布来计算就是:

\begin{aligned}{4 \choose 3}p^3(1-p)^1\end{aligned}

但是,如果把周二的 7 个馒头放在线段上,分成四段就不够了:

如果把周二的 7 个馒头放在线段上,分成四段就不够了
如果把周二的 7 个馒头放在线段上,分成四段就不够了

如上图所示,每个时间段有卖出 3 个的、有卖出 2 个的、有卖出 1 个的,就不再是单纯的 “ 卖出、没卖出 ” 了,不能套用二项分布了。

解决这个问题也很简单,把 T 分为 20 个时间段,那么每个时间段就又变为了抛硬币:

把 T 分为 20 个时间段
把 T 分为 20 个时间段

这样,T 内卖出 7 个馒头的概率就是(相当于抛了 20 次硬币,出现 7 次正面):

\begin{aligned}{20 \choose 7}p^7(1-p)^{13}\end{aligned}

为了保证在一个时间段内只会发生 “ 卖出、没卖出 ” ,干脆把时间切成 n 份:

\begin{aligned}{n \choose 7}p^7(1-p)^{n-7}\end{aligned}

越细越好,用极限来表示:

\begin{aligned}\lim \limits_{n \to \infty}{n \choose 7}p^7(1-p)^{n-7}\end{aligned}

更抽象一点,T 时刻内卖出 k 个馒头的概率为:

\begin{aligned}\lim \limits_{n \to \infty}{n \choose k}p^k(1-p)^{n-k}\end{aligned}

p 的计算

“ 那么 ” ,老板用笔敲了敲桌子,“ 只剩下一个问题,概率 p 怎么求?”

在上面的假设下,问题已经被转为了二项分布,二项分布的期望为:

E(X)=np=\mu

那么:

\begin{aligned}p=\frac {\mu}{n}\end{aligned}

泊松分布

有了 \begin{aligned}p=\frac {\mu}{n}\end{aligned} 之后,就有:

\begin{aligned}\lim \limits_{n \to \infty}{n \choose k}p^k(1-p)^{n-k}=\lim \limits_{n \to \infty}{n \choose k}\frac {{\mu}^k}{n^k}(1-\frac {\mu}{n})^{n-k}\end{aligned}

我们来算一下这个极限:

\begin{aligned}\lim \limits_{n \to \infty}{n \choose k}\frac {{\mu}^k}{n^k}(1-\frac {\mu}{n})^{n-k}&=\lim \limits_{n \to \infty}\frac {n(n-1)(n-2)\cdots(n-k+1)}{k!}\frac {{\mu}^k}{n^k}(1-\frac {\mu}{n})^{n-k} \\ &=\lim \limits_{n \to \infty}\frac {{\mu}^k}{k!}\frac nn \cdot \frac {n-1}{n}\cdots \frac {n-k+1}{n}(1-\frac{\mu}{n})^{-k}(1-\frac{\mu}{n})^n\end{aligned}

其中:

\begin{aligned}\lim \limits_{n \to \infty}\frac nn \cdot \frac {n-1}{n}\cdots \frac {n-k+1}{n}(1-\frac{\mu}{n})^{-k}=1\end{aligned}

\begin{aligned}\lim \limits_{n \to \infty}(1-\frac{\mu}{n})^n=e^{-\mu}\end{aligned}

所以:

\begin{aligned}\lim \limits_{n \to \infty}{n \choose k}\frac {{\mu}^k}{n^k}(1-\frac {\mu}{n})^{n-k}=\frac{{\mu}^k}{k!}e^{-\mu}\end{aligned}

上面就是泊松分布的概率密度函数,也就是说,在 T 时间内卖出 k 个馒头的概率为:

\begin{aligned}P(X=k)=\frac{{\mu}^k}{k!}e^{-\mu}\end{aligned}

一般来说,我们会换一个符号,让 \mu=\lambda,所以:

\begin{aligned}P(X=k)=\frac{{\lambda}^k}{k!}e^{-\lambda}\end{aligned}

这就是教科书中的泊松分布的概率密度函数。

馒头店的问题的解决

老板依然蹙眉,不知道 \mu 啊?

没关系,刚才不是计算了样本均值:

\overline{X}=5

可以用它来近似:

\overline{X}\approx\mu

于是:

\begin{aligned}P(X=k)=\frac{5^k}{k!}e^{-5}\end{aligned}

画出概率密度函数的曲线就是:

概率密度函数的曲线
概率密度函数的曲线

可以看到,如果每天准备 8 个馒头的话,那么足够卖的概率就是把前 8 个的概率加起来:

把前 8 个的概率加起来
把前 8 个的概率加起来

这样 93 % 的情况下够卖,偶尔卖缺货也有助于提升品牌形象。

老板算出一脑门的汗,“ 那就这么定了!”

总结

这个故事告诉我们,要努力学习啊,要不以后馒头都没得卖。

生活中还有很多泊松分布,比如物理中的半衰期,我们只知道物质衰变一半的时间期望是多少,但是因为不确定性原理,我们没有办法知道具体哪个原子会在什么时候衰变,所以可以用泊松分布来计算。

还有比如交通规划等等问题。

 

转自:

  • https://www.matongxue.com/madocs/858.html
打赏 赞(0)
比特币钱包
以太坊钱包
比特币钱包二维码图片

比特币钱包扫描二维码打赏

以太坊钱包二维码图片

以太坊钱包扫描二维码打赏

Was this article helpful?

Related Articles

Leave A Comment?

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据