The extension of reinforcement learning to MDPs with large state,action space and high complexity has inevitably encountered the problem of the curse of dimensionality,which results in slow convergence and long training time.
英
美
传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时;存在收敛速度慢;训练时间长等问题.
单词 The extension of reinforcement learning to MDPs with large state,action space and high complexity has inevitably encountered the problem of the curse of dimensionality,which results in slow convergence and long training time. 的词典定义。@海词词典-最好的学习型词典
以上内容独家创作,受
著作权
保护,侵权必究
今日热词
相关词典网站:
牛津高阶第八版
美国韦氏词典
Dictionary.com
Free Dictionary
维基百科 (自由的百科全书)
目录
附录
音标说明
查词历史
海词
权威词典
翻译
英 汉
|
汉语
|
上海话
广东话
缩略语
人名