利用先验知识进行学习控制 之一:模仿学习与学徒学习

利用先验知识进行学习控制 之一:模仿学习与学徒学习
利用先验知识进行学习之一:模仿学习与学徒学习 Exploit Prior Knowledge to Learn Control 1. Imitation Learning and Apprenticeship Learning 刘锦涛 2012-12-28 导言:使用已有知识进行强化学习,我认为控制策略的“先验知识”可以是以下三种形式:1)失败或成功的例子(下文讨论的LfD);2)数学模型(目前研究相对成熟)3)知识符号(人工智能领域研究较为充分,但缺少实用的方法)。如何在强化学习中...
Copyright © ExBot易科机器人实验室 保留所有权利.   Theme   Robin modified by poyoten

用户登录

分享到: