模仿学习–技术综述[通俗易懂]

模仿学习–技术综述[通俗易懂]概念:局限性:2.1数据的可获得性影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;2.2模型的有效性端到端的特性:1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)2)难以在中间过程中,接收信息和指令;应用方式:1)基于规则的规划、控制模块,还是基础的功能实现方案;2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-connercase或规则无法覆盖的场景,能够有效的实现相应功能模块。论文及学习..

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

  1. 概念
    1)不同于监督学习,强化学习被用于处理复杂的决策任务,但是决策空间巨大,强化学习需要试错,样本的复杂程度较高(sample complexity),限制了强化学习的应用场景;
    2)模仿学习,直接从专家样本中进行学习;由于比较高质量的决策行为数据,模仿学习被认为是可以降低样本复杂度的手段之一。
    3)难点:决策行为的rewarding难以定义,高质量的决策示例可以确定合理的奖励设定方法。

  2. 局限性
    2.1 数据的可获得性
    影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;

    2.2 模型的有效性
    端到端的特性
    1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)
    2)难以在中间过程中,接收信息和指令;

    2.3 预测能力
    不能教Autopilot系统处理无法轻易预测的危险情景。比如,老司机看到飘在前方的塑料袋时会不转向,但自动驾驶系统会;存在识别训练数据相关性问题,它不能通过纯粹观察相关性来建构因果模型,并且无法在模拟中主动测试反事实。

  3. 应用方式
    1)基于规则的规划、控制模块,还是基础的功能实现方案;

    2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-conner case 或规则无法覆盖的场景,能够有效的实现相应功能模块。

  4. 论文及学习:
    1)https://arxiv.org/abs/1812.03079v1;
    学习:https://blog.csdn.net/Nick_cloud/article/details/109701213;https://zhuanlan.zhihu.com/p/57275593
    2)https://arxiv.org/abs/2111.08575v1

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/192705.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Oracle/SQL 修改字段类型和长度[通俗易懂]

    Oracle/SQL 修改字段类型和长度[通俗易懂]标准SQL修改字段类型和长度语句:ALTERTABLEtableNamemodifycolumncolumnName类型; 例如Mysql的修改字段类型语句:altertabletestmodifycolumnnamevarchar(255);Oracle修改字段类型和长度语句:ALTERTABLEtableNam

    2022年6月9日
    44
  • 关系数据模型——三个组成部分「建议收藏」

    关系数据模型——三个组成部分「建议收藏」关系模型的三个组成部分,是指关系数据模型的数据结构、关系数据模型的操作集合和关系数据模型的完整性约束。关系数据模型的数据结构主要描述数据的类型、内容、性质以及数据间的联系等,是目标类型的集合。目标类型是数据库的祖成成分,一般可分为两类:数据类型、数据类型之间的联系。关系数据模型的操作集合数据模型中数据操作主要描述在相应的数据结构上的操作类型和操作方式。它是操作算符的集合,包括若干操作和推理准则,用以对目标类型的有效实例所组成的数据库进行操作。关系数据模型的完整性约束数据模型中的数据约束主要描

    2022年4月19日
    63
  • 上传图片ajax返回400,七牛qiu.js 上传图片 400报错

    上传图片ajax返回400,七牛qiu.js 上传图片 400报错http提示信息RequestURL:http://upload.qiniu.com/RequestMethod:POSTStatusCode:400BadRequestRemoteAddress:115.231.182.136:80ResponseHeadersviewsourceAccess-Control-Allow-Headers:X-File-Name,X-File-…

    2022年5月2日
    49
  • Java冒泡排序实现

    Java冒泡排序实现Java冒泡排序原理:依次比较相邻的两个书,将较大的数放右边思路:依次比较相邻的两个数,将小数放在前面,大数放在后面。即在第一趟:首先比较第1个和第2个数,将小数放前,大数放后。然后比较第2个数和第3个数,将小数放前,大数放后,如此继续,直至比较最后两个数,将小数放前,大数放后。重复第一趟步骤,直至全部排序完成。冒泡排序的优点:每进行一趟排序,就会少比较一次,因为每进行一趟排序都会找出一个较大值。代码演示:…

    2022年7月8日
    22
  • pycharm2018打不开_pycharm indexing

    pycharm2018打不开_pycharm indexingpycharm2020无法打开,点击无反应,今天我碰到这现象,总结大体原因为2种第1种:C:\Users\ygw\AppData\Roaming\JetBrains(删除该目录即可,一般由于升级安装或安装两个不同版本会存在老旧文件影响导致)第2种:进行过激活成功教程,修改了pycharm64.exe.vmoptions配置,其中存在错误配置或配置中的指定jar…

    2022年8月29日
    2
  • ETL开发命名规范

    ETL开发命名规范命名规范1、模块名缩写、表面缩写2、一次性初始化的表:[库名].表名_INIT

    2022年5月18日
    37

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号