说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 平均情报量
1)  average amount of information
平均情报量
2)  prediction of mean annual discharge
年平均流量预报
3)  intelligence Platform
情报平台
4)  average reward
平均报酬
1.
Aim To investigate the model free multi step average reward reinforcement learning algorithm.
目的 讨论平均准则下控制马氏链的强化学习算法,在事先未知状态转移矩阵及报酬函数的条件下,通过试凑法寻找使得长期每阶段期望平均报酬最大的最优控制策略。
2.
On the basis of analyzing and investigating the exist algorithms,and using the linear parameter estimation theory,a new class of average reward multi-step temporal-difference learning algorithms based on linear function approximations and recursive least s.
对非周期不可约Markov链上的线性函数近似平均报酬指标即时差分学习方法进行了研究。
3.
An average reward reinforcement learning algorithm for control Markov chains is presented.
目的是寻找使得长期每阶段期望平均报酬最大的最优控制策略。
5)  average prediction
平均预报
6)  information quality
情报质量
补充资料:平均样本量(见平均抽样数)


平均样本量(见平均抽样数)
average sample size: see average sampling number; ASN

  Pingiun Yangbenliang平均样本t(ave班罗留盯甲le size)样数。见平均抽
  
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条