马尔可夫预测过程,Markov's course,音标,读音,翻译,英文例句,英语词典

您的位置：首页 -> 词典 -> 马尔可夫预测过程

1) Markov's course 点击朗读

马尔可夫预测过程

2) Grey-Markov process prediction 点击朗读

灰色-马尔科夫过程预测

3) Markov chain forecast 点击朗读

马尔可夫链预测

According to the principle and method of Markov chain forecast, this paper analyses the changeable trend of future flood at Jinqu basin.

根据马尔可夫链预测的原理和方法，分析了金衢盆地未来洪水的变化趋势。

更多例句>>

4) Markov prediction 点击朗读

马尔可夫预测

It is introduced the Markov theory into the prediction based on the Grey model in this paper, and how to build the Grey-Markov prediction combination model.

文章在灰色预测的基础上,引入马尔可夫预测,建立起灰色马尔可夫预测组合模型。

更多例句>>

5) Markov forecast 点击朗读

马尔可夫(Markov)预测

6) forecast of Markov chain 点击朗读

马尔可夫预测法

The forecast of Markov chain is a kind of way to predict event probability. 点击朗读

马尔可夫预测法是一种预测事件发生的概率的方法,是对地理、天气、市场、进行预测的基本方法。

补充资料：马尔可夫决策过程

　　基于马尔可夫过程理论的随机动态系统的最优决策过程，英文缩写 MDP。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物，故又称马尔可夫型随机动态规划，属于运筹学中数学规划的一个分支。马尔可夫决策过程是指决策者周期地或连续地观察具有马尔可夫性的随机动态系统，序贯地作出决策。即根据每个时刻观察到的状态，从可用的行动集合中选用一个行动作出决策，系统下一步（未来）的状态是随机的，并且其状态转移概率具有马尔可夫性。决策者根据新观察到的状态，再作新的决策，依此反复地进行。马尔可夫性是指一个随机过程未来发展的概率规律与观察之前的历史无关的性质。马尔可夫性又可简单叙述为状态转移概率的无后效性。状态转移概率具有马尔可夫性的随机过程即为马尔可夫过程。马尔可夫决策过程又可看作随机对策的特殊情形，在这种随机对策中对策的一方是无意志的。马尔可夫决策过程还可作为马尔可夫型随机最优控制，其决策变量就是控制变量。
　　
　　发展概况　50年代R.贝尔曼研究动态规划时和L.S.沙普利研究随机对策时已出现马尔可夫决策过程的基本思想。R.A.霍华德(1960)和D.布莱克韦尔(1962)等人的研究工作奠定了马尔可夫决策过程的理论基础。1965年，布莱克韦尔关于一般状态空间的研究和E.B.丁金关于非时齐（非时间平稳性）的研究，推动了这一理论的发展。1960年以来，马尔可夫决策过程理论得到迅速发展，应用领域不断扩大。凡是以马尔可夫过程作为数学模型的问题，只要能引入决策和效用结构，均可应用这种理论。
　　
　　数学描述　周期地进行观察的马尔可夫决策过程可用如下五元组来描述：{S，(A(i)，i∈S，q，γ，V},其中S 为系统的状态空间（见状态空间法）；A(i)为状态i(i∈S)的可用行动（措施，控制）集；q为时齐的马尔可夫转移律族，族的参数是可用的行动； γ是定义在Γ(Г呏{(i，ɑ):a∈A(i)，i∈S}上的单值实函数；若观察到的状态为i，选用行动a，则下一步转移到状态 j的概率为q(j│i，ɑ)，而且获得报酬γ(j，ɑ),它们均与系统的历史无关；V是衡量策略优劣的指标（准则）。
　　
　　策略　策略是提供给决策者在各个时刻选取行动的规则，记作 π＝(π₀，π₁，π₂，...， π_n，π_{_n＋1}...)，其中π_n是时刻 n选取行动的规则。从理论上来说，为了在大范围寻求最优策略π_n，最好根据时刻 n以前的历史，甚至是随机地选择最优策略。但为了便于应用，常采用既不依赖于历史、又不依赖于时间的策略，甚至可以采用确定性平稳策略。
　　
　　指标　衡量策略优劣的常用指标有折扣指标和平均指标。折扣指标是指长期折扣〔把 t时刻的单位收益折合成0时刻的单位收益的β^t(β<1)倍〕期望总报酬。平均指标是指单位时间的平均期望报酬。采用折扣指标的马尔可夫决策过程称为折扣模型。业已证明：若一个策略是β折扣最优的，则初始时刻的决策规则所构成的平稳策略对同一β也是折扣最优的，而且它还可以分解为若干个确定性平稳策略，它们对同一β都是最优的。现在已有计算这种策略的算法。采用平均指标的马尔可夫决策过程称为平均模型。业已证明：当状态空间S 和行动集A(i)均为有限集时，对于平均指标存在最优的确定性平稳策略；当S和（或）A(i)不是有限的情况,必须增加条件，才有最优的确定性平稳策略。计算这种策略的算法也已研制出来。
　　
　　参考书目
　　　R.A.Howard,Dynamic Programming and Markov Processes, MIT Press, Cambridge Mass., 1960.
　　

说明：补充资料仅用于学习参考，请勿用于其它任何用途。

参考词条

纯马尔可夫过程强马尔可夫过程部分可观测马尔可夫决策过程部分可观测马尔可夫决策过程(POMDP) 部分可观马尔可夫过程

马尔可夫过程半马尔可夫过程隐马尔可夫过程非马尔可夫过程

说明：双击或选中下面任意单词，将显示该词的音标、读音、翻译等；选中中文或多个词，将显示翻译。
	您的位置：首页 -> 词典 -> 马尔可夫预测过程 1) Markov's course 马尔可夫预测过程 2) Grey-Markov process prediction 灰色-马尔科夫过程预测 3) Markov chain forecast 马尔可夫链预测 1. According to the principle and method of Markov chain forecast, this paper analyses the changeable trend of future flood at Jinqu basin. 根据马尔可夫链预测的原理和方法，分析了金衢盆地未来洪水的变化趋势。更多例句>> 4) Markov prediction 马尔可夫预测 1. It is introduced the Markov theory into the prediction based on the Grey model in this paper, and how to build the Grey-Markov prediction combination model. 文章在灰色预测的基础上,引入马尔可夫预测,建立起灰色马尔可夫预测组合模型。更多例句>> 5) Markov forecast 马尔可夫(Markov)预测 6) forecast of Markov chain 马尔可夫预测法 1. The forecast of Markov chain is a kind of way to predict event probability. 马尔可夫预测法是一种预测事件发生的概率的方法,是对地理、天气、市场、进行预测的基本方法。补充资料：马尔可夫决策过程　　基于马尔可夫过程理论的随机动态系统的最优决策过程，英文缩写 MDP。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物，故又称马尔可夫型随机动态规划，属于运筹学中数学规划的一个分支。马尔可夫决策过程是指决策者周期地或连续地观察具有马尔可夫性的随机动态系统，序贯地作出决策。即根据每个时刻观察到的状态，从可用的行动集合中选用一个行动作出决策，系统下一步（未来）的状态是随机的，并且其状态转移概率具有马尔可夫性。决策者根据新观察到的状态，再作新的决策，依此反复地进行。马尔可夫性是指一个随机过程未来发展的概率规律与观察之前的历史无关的性质。马尔可夫性又可简单叙述为状态转移概率的无后效性。状态转移概率具有马尔可夫性的随机过程即为马尔可夫过程。马尔可夫决策过程又可看作随机对策的特殊情形，在这种随机对策中对策的一方是无意志的。马尔可夫决策过程还可作为马尔可夫型随机最优控制，其决策变量就是控制变量。　　　　发展概况　50年代R.贝尔曼研究动态规划时和L.S.沙普利研究随机对策时已出现马尔可夫决策过程的基本思想。R.A.霍华德(1960)和D.布莱克韦尔(1962)等人的研究工作奠定了马尔可夫决策过程的理论基础。1965年，布莱克韦尔关于一般状态空间的研究和E.B.丁金关于非时齐（非时间平稳性）的研究，推动了这一理论的发展。1960年以来，马尔可夫决策过程理论得到迅速发展，应用领域不断扩大。凡是以马尔可夫过程作为数学模型的问题，只要能引入决策和效用结构，均可应用这种理论。　　　　数学描述　周期地进行观察的马尔可夫决策过程可用如下五元组来描述：{S，(A(i)，i∈S，q，γ，V},其中S 为系统的状态空间（见状态空间法）；A(i)为状态i(i∈S)的可用行动（措施，控制）集；q为时齐的马尔可夫转移律族，族的参数是可用的行动； γ是定义在Γ(Г呏{(i，ɑ):a∈A(i)，i∈S}上的单值实函数；若观察到的状态为i，选用行动a，则下一步转移到状态 j的概率为q(j│i，ɑ)，而且获得报酬γ(j，ɑ),它们均与系统的历史无关；V是衡量策略优劣的指标（准则）。　　　　策略　策略是提供给决策者在各个时刻选取行动的规则，记作 π＝(π₀，π₁，π₂，...， π_n，π_{_n＋1}...)，其中π_n是时刻 n选取行动的规则。从理论上来说，为了在大范围寻求最优策略π_n，最好根据时刻 n以前的历史，甚至是随机地选择最优策略。但为了便于应用，常采用既不依赖于历史、又不依赖于时间的策略，甚至可以采用确定性平稳策略。　　　　指标　衡量策略优劣的常用指标有折扣指标和平均指标。折扣指标是指长期折扣〔把 t时刻的单位收益折合成0时刻的单位收益的β^t(β<1)倍〕期望总报酬。平均指标是指单位时间的平均期望报酬。采用折扣指标的马尔可夫决策过程称为折扣模型。业已证明：若一个策略是β折扣最优的，则初始时刻的决策规则所构成的平稳策略对同一β也是折扣最优的，而且它还可以分解为若干个确定性平稳策略，它们对同一β都是最优的。现在已有计算这种策略的算法。采用平均指标的马尔可夫决策过程称为平均模型。业已证明：当状态空间S 和行动集A(i)均为有限集时，对于平均指标存在最优的确定性平稳策略；当S和（或）A(i)不是有限的情况,必须增加条件，才有最优的确定性平稳策略。计算这种策略的算法也已研制出来。　　　　参考书目　　　R.A.Howard,Dynamic Programming and Markov Processes, MIT Press, Cambridge Mass., 1960. 　　说明：补充资料仅用于学习参考，请勿用于其它任何用途。参考词条纯马尔可夫过程强马尔可夫过程部分可观测马尔可夫决策过程部分可观测马尔可夫决策过程(POMDP) 部分可观马尔可夫过程

©2011 dictall.com