【参考】
WC2018冬令营课件《概率与期望及其应用》曹文
【概率的定义】
基本事件是一次实验可能出现的不可再分解的直接结果,样本空间Ω是全体基本事件的集合,随机事件是若干基本事件组成的集合。
事件的并:事件C=”事件A与事件B至少有一个发生“,则C=A∪B。
事件的交:同时发生,A∩B。
一个随机事件的概率可以认为是事件占样本空间的比例(不严格定义),概率有以下运算公式:
1.P(A)=1-P(¬A),事件A=1-事件A的补集。
顺便一提,¬(A∩B)=¬A∪¬B,¬(A∪B)=¬A∩¬B。
2.P(A∪B)=P(A)+P(B)-P(AB),事件AB的并=事件A+事件B-事件AB的交。
例:多次抽取同一样本空间,得到两个独立事件交集的概率。
1.给定3个数字,两次等概率抽取,求抽出1和2的方案数。
从排列角度很容易得到2/9。
记”取到1”为A,记“取到2“为B,所以求P(AB)。(此时处于同一样本空间了,才可以计算)
P(AB)=1-P(¬A∪¬B)=1-P(¬A)-P(¬B)+P(¬A¬B)=1-2*(2/3)^2+(1/3)^2=2/9。
2.n次从1~9种等概率取数,求乘积能被10整除的概率。P(AB)=1-(8^n+5^n-4^n)/9^n。
【全概率公式】
P(A|B)表示已经发生B的前提下A的发生概率,则P(A|B)=P(AB)/P(B)。
若A是Ω的一个随机事件,且Ω=ΣBi,那么
全概率公式:P(A)=ΣP(Bi)P(A|Bi)
例1:2黑球3白球,取两球不放回,第二次取到黑球的概率。
分别依赖于第一次取到黑和第一次取到白来计算。
例2:N个袋子,每个n黑球m白球,从第i袋摸出一球放到第i+1袋,求最后白球的概率。
对于第i袋的概率有影响的只有第i-1袋的决策,所以按顺序用条件概率计算即可。
考虑概率的时候一定要想办法避免讨论具体方案,或将少量方案分类分别的概率计算出来后使用条件概率解决。
这里提一下贝叶斯公式,用处不多,用条件概率公式和全概率公式容易推得:
$$P(B_i|A)=\frac{P(AB_i)}{P(A)}=\frac{P(B_i)P(A|B_i)}{\sum_j P(B_j)P(A|B_j)}$$
原因是ΣBi,结果是A。在已知所有原因发生的概率和所有原因发生后导致结果发生的概率的前提下。
全概率公式,求结果发生的概率。
贝叶斯公式,求结果确定发生的前提下,某个原因发生的概率。
具体学习:
【期望的定义】
随机变量X是定义在样本空间上的实值函数,即对每一个基本事件都有唯一互不相同的数值与之对应。(所以一个基本事件等价于一个随机变量)
数学期望是随机变量的加权平均值(加权指随机变量对应的概率),即E(X)=ΣE(xi)*p(xi)。(只有样本空间Ω的期望是有意义的)
期望的线性性质:
1.E(aX+bY)=aE(x)+bE(Y)
2.E(XY)=E(X)E(Y)
只有加法和乘法满足期望的线性(期望的运算结果=运算结果的期望),而异或开方等需要用拆分递推解决。
求解期望的第一种方法:定义法求期望。
例1:平均扔几次骰子可以扔出6?
设事件k为第k次才扔出6,则P(k)=1/6*(5/6)^(k-1)。
E(X)=ΣP(i) * i ,i=1~∞,用错位相减法可以得到1/6。
这里的原理是:定义样本空间Ω是扔出6,基本事件就是第k次扔出6,求E(Ω)。
这里有个规律:在样本空间Ω中,定义x为某随机事件的发生概率,则期望进行1/x次随机试验会发生该事件。
例2:(百事世界杯之旅)n个数字,期望几次抽取可以得到所有数字。
当前0个,得到1个新数的概率是1。
当前1个,得到1个新数的概率是(n-1)/n。
最终ans=Σn/i,i=1~n。(各自倒数相加)
例3:n个数,连续抽得k个1的概率是(1/n)^k,所以期望是n^k。
【全期望公式】
E(A|B)表示事件B发生的前提下事件A的期望。
(谈期望时一个事件等价于一个随机变量)
若Y是Ω的一个随机事件,且Ω=Σxi,那么
全期望公式:E(Y)=ΣP(xi)*E(Y|xi)
例1:有n片荷叶,初始青蛙位于n,某一时刻在k号荷叶上,下一时刻将等概率调到1~k号荷叶上,问到1号荷叶的期望步数。
设f(x)表示青蛙在x号荷叶跳到1号荷叶的期望步数,显然f(1)=0。
f(2)=1/2*(f(1)+1)+1/2*(f(2)+1)。
在2号荷叶下一步的2中可能构成了X,1/2的概率到1号荷叶期望就是f(1)+1,1/2的概率到2号荷叶期望就是f(2)+1。(这就是期望方程通常+1的原因)
所以f(x)=1+1/x*Σf(i),i=1~x。
求解期望的第二种方法:设E(x)表示样本空间x的期望,答案为E(n),用全期望公式得到E(x)的递推方程,然后用DP或高斯消元求解。
状态中放的是不能用期望表示的量(点、决策等),然后递推计算期望。
例2:(百事杯世界之旅加强版)n个球星,m家店,每个瓶盖有一个球星和一家店的标记,问期望收集几个可以得到所有球星和所有店的标记。
令f[i][j]表示已拥有i球星和j店的期望次数,分4种情况递推即可。
【DAG上的期望DP】
基于全期望公式的期望方程共有两类:DAG上的期望DP,有向图上的高斯消元。
例题():给定带边权DAG,保证所有点都能到达n,求1到n的期望长度。
设f[x]表示点x到终点的期望长度,f[n]=0。
期望DP一般逆推,因为我们容易知道在点x处下一步的概率和期望,然后就可以运用全期望公式得到递推式。
f[x]=Σ1/out[x]*(f[y]+w(x,y)),x-->y。
这里存一下以前推的期望DP正推方式,有点乱,现在已经不知道在讲什么了。
许多期望DP只需要对转移连有向边,都可以规约成经典的DAG上的期望DP。DAG上的期望DP例题:【BZOJ】3036: 绿豆蛙的归宿题意:给定DAG带边权连通图,保证所有点都能到达终点n,每个点等概率沿边走,求起点1到终点n的期望长度。 正推:记p[x]表示到达点x的概率,p(u,v)表示经过这条边的概率。p(u,v)=p[u]/out[u],其中out[u]是点u的出度。p[v]=∑p(u,v)。事实上,每到一个点后等概率向外走视为一个概率1/out[x],根据乘法原理,p(u,v)就是这些概率的乘积。到达点u是有概率的,而到达点v的概率就是∑p[u]/out[u]。记f[i]表示到达点i的期望长度。考虑最朴素的期望, 统计所有起点到终点的路径,f[n]=[总路径长度]/[总路径数]。进一步的,每条边对期望长度的贡献是[边权]*[经过这条边的路径数]/[总路径数],[经过这条边的路径数]/[总路径数]就是p(u,v)。所以,★每条边对期望长度的贡献是w(u,v)*p(u,v)。f[v]=∑(f[u]/out[u]+w(u,v)*p(u,v))★根据乘法原理,涉及有向边(u,v)的概率是p(u,v),所以期望是w(u,v)*p(u,v)。★但是,f[u]是到达u的期望长度,期望的本质是[概率*权],到达u的概率已经包含在期望里,只需要乘当前概率1/out[x]就可以了。这样得到的(f[u]/out[u]+w(u,v)*p(u,v))就是v从u传递来的[概率*权]。整理得:对于(u,v),f[v]+=(f[u]+w(u,v)*p[u])/out[u],p[v]+=p[u]/out[u]。一种经典的错解是:f[v]=∑(f[u]+w(u,v))/out[u],期望f[u]包含了之前的概率只需要/out[u]就可以得到期望长度,这是正确的。但是对于边权w(u,v)的概率可不是1/out[u],必须把期望f[u]中的概率乘积p[u]抽离出来/out[u]才是边权w(u,v)真正的概率。 逆推:记f[i]表示点i到达终点的期望长度。对于(u,v),f[u]=(f[v]+w(u,v))/out[v]。每条边对期望长度的贡献是w(u,v)*p(u,v),p(i,j)实际上是起点到w(i,j)途中概率的乘积,而在逆推过程中w(i,j)在之后会依次乘上这些起点出发的概率,所以不需要记录p(i,j)。从方程本身正确性的角度出发,u能且仅能到达这几个v且概率都是1/out[u],所以在这样的转移一定是正确的。★期望DP一般倒推,原因在于我们仅知道当前步到达下一步的概率,所以按概率从下一步拿信息才能准确。 写了又删,删了又写,总算把期望的正逆推原理讲了个大概。期望的正推一定要附带概率p的计算而逆推一定不需要,原因总结起来就是,★所有指向点v的点u到达的概率不等且和不为1,所有点v指向的点u一定被等概率到达且和为1。(和为1且等概率当然不需要记录p)几乎所有期望正推的错误都是因此。
写一点小总结,以后再整理到上面去。
概率期望的题目最重要的公式只有两条:
$$P(A)=\sum P(B_j)*P(A|B_j)$$
事件A发生的概率依赖于所有事件Bj,等于事件Bj发生的概率乘其发生的基础上事件A发生的概率。
例如:(1)LRU:枚举上一步的状态,上一步发生的概率乘上一步到本状态的概率。只要确定一个依赖的方向,然后所有能到达它的状态都算到就没问题了。
(2)
$$E(A)=\sum P(B_j)*E(A|B_j)$$
事件A的期望等于事件Bj发生的概率乘其发生的基础上事件A的期望。
例如:(1)为什么DAG上的期望DP不能正推:因为根据公式,正推我们需要到达上一步的概率和从上一步到这个点的概率……实际上我们没有计算上一步的概率。
逆推的话,我们知道到达下一步的概率……没了。(事件Bj发生的概率——指的其实是边,上一步就需要点乘边,下一步只需要边)。