说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 二人零和动态对策
1)  two-person zero sum dynamic game
二人零和动态对策
1.
The N-person linear quadratic Nash dynamic game with l 2 norm bounded uncertainty is considered as a compound dynamic game, which is composed of non-cooperative non-zero sum linear quadratic dynamic game and two-person zero sum dynamic games.
在 l2 范数有界不确定性扰动影响情况下 ,把 N人线性二次纳什对策问题归结为由非合作、非零和线性二次动态对策及二人零和动态对策组成的复合对策问题 ;基于纳什均衡对策理论和 H∞ 控制理论方法 ,给出并证明了不确定环境下纳什对策问题状态反馈解存在的条件及其求解方法 ;通过一个政府债务稳定问题简例 ,说明了算法的有效性。
2)  non-zero-sum two-person game
非零和二人对策
3)  Nonzero dynamic game
非零和动态对策
4)  Zero sum two-person continuous game
二人零和连续对策
5)  two-person finite zero-sum game
二人有限零和对策
6)  (fuzzy) two-person zero-sum game
(模糊)二人零和对策
补充资料:动态对策


动态对策
dynamic game

动态对策【dy脚.血,田姆;双.,aM一,e盆a,盯pa] 位t对策(卿itio几al邵叮坦)的一种变形.它是以局中人控制状态空间X中“点的运动”为特征的。令I=王i}为局中人的集合.对于每个点x“X,对应局中人沁I在该点的一个基本策略(e肠叱血卿s加噢娜)集st(伙从而也对应在x的基本局势(e肠n幼ta卿sitUa-由ns)集s(·)一几犷,.表示盗挂该遥动规律的周期分布函数(详6月公曲苗buljonfu汉由n) F(xk Ix,,s。,),…,、一:,s仿卜,)),xi‘X,s(X,)任s(X亡,,定义在X上,它对于所有局中人而言均为已知的.如果气固定,则函数F关于所有其余变量是可测的.一个逐次状态和基本局势的序列P:x,,户),…,戈,s闪,二、是一般动态对策的一局(play).它可归纳定义如下:设局的·段(开局)x飞,s(xl),…,人_,(k)2)给定,并设每个局中人i选择他的基本策略老。“s.(夺、,,使得基本局势s(“一l)出现;那么此对策按照分布F(·}x,,s(旬,二、凡一,,s(u一,))随机地继续进人状态气.在每一局p中,局中人i的支付人哟是确定的.如果所有局的集合记为叭那么此动态对策由系统 r=(,,x,{stx)},。,,,。x,只{人(P)}。。,,,。户表征.在动态对策中,通常假设在逐次选择基本策略的时刻,局中人知悉前面的开局.在这种情形下,局中人i的一个纯策略凡是函数砰劝(x,,。闻,…,s(“一代x)的一种选择,它把结束于x的开局与基本策略护“邓相对应.对于局中人仅仅部分知道前面开局情况的动态对策(例如,具有“信息滞后”的对策)也已被研究.--一一 为了一个对策是确定的,每一个局势。={s,},必须在所有局的集合上引进一个概率测度八,并且关于该测度从的数学期望E权(P)务必存在.这一数学期望也是局中人i处于局势s中的支付. 一般地,函数权(P)是任意的,但最经常研究的动态对策是那些具有终止支付(ten川nal Pay·off)的对策(这种对策,一旦凡出现于终止集(记m亩司set)了Cx并且权(P)=权(x口时,对策即被终止,其中、为此对策中的最后局势)和那些具有累积支付(in魄同pay一off):气(P)一艺孔lh‘(xk,。‘)的衬最,.’ 动态对策可看作具有离散时间最优控制问题的对策式变形.事实上,如果局中人个数为1,那么它就归结为最优控制问题.在动态对策中,如果XCr,离散时间以连续时间替代,并且随机因素消失,那么得到的是一个微分对策(山玉记吐阁多nl治),于是微分对策可看作动态对策的一种变形. 随机对策(s tochastic邵n犯),递归对策(心ulsi记罗n祀)和生存对策(,nr ofs山劝从习)均为动态对策的特殊类.
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条