2019-01-01 美国 来源:其他 领域:信息
关键词:
据机器之心1月1日消息,加州大学伯克利分校和谷歌大脑项目研究人员开发了一种稳定的深度强化学习算法,只需要适量的试验和最小程度的参数调整,即可学习多层神经网络策略。该算法基于最大熵强化学习框架,并能对学习过程进行动态地自动调整。研究人员利用该算法,可在两小时内完成对四足机器人运动步态的学习过程。
信息来源:https://www.jiqizhixin.com/dailies/aab50c60-7581-4d9d-9559-beca45fb93f3