本文最后更新于:2023年12月23日 下午
Markov过程和Markov链
1 Markov过程
1.1 定义
对于一个随机过程{ξ(t),t∈T},如果∀m+1时刻,满足
ftm+1∣t1,…,tm(xm+1∣x1,…,xm)=ftm+1∣tm(xm+1∣xm)
即随机过程下一个时刻只与现在这个时刻有关,与过去都没有关系,这样的随机过程就叫做Markov过程。
1.2 性质
(1)Markov过程的有限维PDF写作
ft1,…,tm(x1,…,xm)=ftm∣tm−1(xm∣xm−1)⋯ft2∣t1(x2∣x1)ft1(x1)
(2)对于一个Markov过程,它的反向
ftn∣tn+1,…,tn+k(xn∣xn+1,…,xn+k)=ftn∣tn+1(xn∣xn+1)
也具有Markov性。
(3)未来两个时刻的分布
ft1,t3∣t2(x1,x3∣x2)=ft1∣t2(x1∣x2)ft3∣t2(x3∣x2)
即马尔可夫性等价于条件独立性。
2 Markov链
2.1 定义
(1)对于一个离散的随机序列{X(n);n≥0},给出一系列状态i0,i1,…,in,in+1∈S,S称为状态空间,则有
P[X(n+1)=in+1∣X(0)=i0,X(1)=i1,…,X(n)=in]=P[X(n+1)=in+1∣X(n)=in]
即未来一个时刻的状态只与现态有关,那么则称{X(n);n≥0}为Markov链。
(2)对于一个Markov链{X(n);n≥0}在n时刻有
P(X(n+1)=j∣X(n)=i)=defpij(n)
这个概率称为一步转移概率。如果对于∀i,j∈S,有pij(n)=pij,即与时刻n无关,则称Markov链为齐次的Markov链。
(3)我们可以把所有的一步转移概率都写出来,即列出所有的Pij,∀i,j∈S,这样可以构成一个矩阵,
⎣⎢⎢⎡p11p21⋮p12p22⋮⋯⋯⋱p1np2n⋮⎦⎥⎥⎤
这个矩阵就叫做一步转移概率矩阵。矩阵的行代表目前处在其中一个状态i,下一步转移到了另外一个状态j的概率,列代表固定了下一个状态j,从某个状态i转移到这个状态的概率。注意固定矩阵的一行,其所有列的和为1。
j∑pij=1
(4) 对于一个齐次的Markov链,可以用状态转移图来表示
graph LR
A[1]
B[2]
C[3]
D[4]
B --1/3---> A
A --1--> A
B --1/3--> B
B --1/3---> C
C --1/3---> B
C --1/3--> C
C --1/3---> D
D --1--> C
上面的状态转移图代表的转移概率矩阵就是
⎣⎢⎢⎢⎡11/30001/31/3001/31/31001/30⎦⎥⎥⎥⎤
注意到其中状态1一旦进入之后,就会以概率1转移到自己,也就是说进入状态1之后就出不来了,这个状态被称为吸收壁。而在状态4中,一旦进入状态4,就会以概率1转移到状态3,也就是说进入状态4就会被反射出去,这个状态被称为反射壁。
(5)对于齐次Markov链,其m步转移概率为pij(m)=P[X(n+m)=j∣X(n)=i],其构成的矩阵
P(m)=(pij(m))
称为Markov链的m步转移概率矩阵。
对于0步转移的特殊情况,规定
pij(0)={1i=j0i=j
2.2 定理与性质
(1)m步转移概率矩阵是一步转移概率矩阵的m次幂。
证明:由Chapman-Kolmogrov方程
对于齐次Markov链,我们有
pij(m+r)=k∑pik(m)pkj(r)
如果将求和展开
pij(m+r)=k∑pik(m)pkj(r)=pi1(m)p1j(r)+pi2(m)p2j(r)+⋯+pin(m)pnj(r)=pi(m)Tpj(r)
发现其就是矩阵相乘时行/列向量的运算,再将pij(m+r)放入矩阵,可以得到
P(m+r)=P(m)P(r)
则可以递推地推出
P(m)=P(m−1+1)=P(m−1)P(1)=⋯=Pm
因为P(1)=P,于是得到一个重要结论,m步转移概率矩阵是一步转移概率矩阵的m次幂。
(2)初始分布与绝对分布:我们之前在计算概率的时候,都是条件概率pij,表示在现态为i,下个状态为j的概率,如果我们要知道无条件概率,那么需要知道初始状态的概率分布。
初始概率为pj=P(X0=j),这些概率组成的集合{pj}为初始分布。所有初始概率组成的向量P(0)=(p1,p2,…)T为初始概率向量。
借助于全概率公式,我们对所有可能初始状态计算条件概率,得到
pj(n)=i∑P(xn=j∣x0=i)P(x0=i)=i∑pijnpi
算出来的无条件概率称之为绝对概率pj(n)=P(Xn=j),这些概率组成的集合{pj(n)}为绝对分布。所有绝对概率组成的向量P(n)=(p1(n),p2(n),…)T为绝对概率向量。
注意到n时刻的绝对概率分布也可以由n−1时刻的绝对概率分布得到,即
pj(n)=i∑P(xn=j∣xn−1=i)P(xn−1=i)=i∑pi(n−1)pij
把求和展开之后,同样也可以写成向量相乘的形式
{PT(n)=PT(0)×P(n)向量×转移矩阵PT(n)=PT(n−1)×P向量×转移矩阵
(3)有限维概率分布
设{Xn,n∈T},其状态为i1,…,in∈S,对∀i∈S有
P{X1=i,…Xn=in}=i∑P(Xn=in∣Xn−1=in−1)⋯P(X2=i1∣X1=i)P(X0=i)=i∑P(X0=i)j=1∏nP(Xj=ij∣Xj−1=ij−1)=i∑pij=1∏n(Pij−1ij)
其中i0=i。上述式子最后的连续乘法代表着相差一个时刻(j−1和j)的转移,即一步转移概率。
一般随机过程的全部特征,可以由有限维分布表征出来,但很难求解。从上述公式看出,Markov链的有限维分布由初始概率和一步转移概率决定,比起一般的随机过程,问题得到了简化。