模仿学习–技术综述[通俗易懂]

模仿学习–技术综述[通俗易懂]概念:局限性:2.1数据的可获得性影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;2.2模型的有效性端到端的特性:1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)2)难以在中间过程中,接收信息和指令;应用方式:1)基于规则的规划、控制模块,还是基础的功能实现方案;2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-connercase或规则无法覆盖的场景,能够有效的实现相应功能模块。论文及学习..

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

  1. 概念
    1)不同于监督学习,强化学习被用于处理复杂的决策任务,但是决策空间巨大,强化学习需要试错,样本的复杂程度较高(sample complexity),限制了强化学习的应用场景;
    2)模仿学习,直接从专家样本中进行学习;由于比较高质量的决策行为数据,模仿学习被认为是可以降低样本复杂度的手段之一。
    3)难点:决策行为的rewarding难以定义,高质量的决策示例可以确定合理的奖励设定方法。

  2. 局限性
    2.1 数据的可获得性
    影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;

    2.2 模型的有效性
    端到端的特性
    1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)
    2)难以在中间过程中,接收信息和指令;

    2.3 预测能力
    不能教Autopilot系统处理无法轻易预测的危险情景。比如,老司机看到飘在前方的塑料袋时会不转向,但自动驾驶系统会;存在识别训练数据相关性问题,它不能通过纯粹观察相关性来建构因果模型,并且无法在模拟中主动测试反事实。

  3. 应用方式
    1)基于规则的规划、控制模块,还是基础的功能实现方案;

    2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-conner case 或规则无法覆盖的场景,能够有效的实现相应功能模块。

  4. 论文及学习:
    1)https://arxiv.org/abs/1812.03079v1;
    学习:https://blog.csdn.net/Nick_cloud/article/details/109701213;https://zhuanlan.zhihu.com/p/57275593
    2)https://arxiv.org/abs/2111.08575v1

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/192705.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 分辨率,像素,像素密度易懂

    分辨率,像素,像素密度易懂分辨率是什么?一般会说这个屏幕的分辨率是1920*1080,这就说明纵向和横向上有1920个和1080个像素点;像素点是什么?一个像素点就是一个色彩块,没有实际的物理尺寸;什么是屏幕像素密度?一英寸长的一条线上理论上会有多少个像素点;例如:一个手机长边有1920个像素点,短边有1080个像素点,屏幕大小(对角线的物理大小)是5.2英寸的,那么屏幕密度是怎么计…

    2022年5月4日
    60
  • netbeans下将全部jar包打成一个,俗称fat jar[通俗易懂]

    netbeans下将全部jar包打成一个,俗称fat jar

    2022年2月3日
    36
  • 微信公众号网页开发使用 WeUI优势

    微信公众号网页开发使用 WeUI优势WeUI是一套同微信原生视觉体验一致的基础样式库,WeUI由微信官方设计团队为微信内网页和微信小程序量身设计,令用户的使用感知更加统一。在微信网页或小程序中使用WeUI的优势1.同微信客户端一致的视觉效果,令所有微信用户都能更容易地使用你的网站和小程序2.方便用户便捷获取快速使用,降低公众号和三方开发者的开发和设计成本。3.WeUI是微信设计团队精心打造,清晰明确,简洁大方。WeUI…

    2022年5月7日
    212
  • snmptrap配置_snmp服务端ip和端口

    snmptrap配置_snmp服务端ip和端口一、trap的用途TRAP是提供从代理进程到管理站的异步报告机制。为了使管理站能够及时而又有效地对被管理设备进行监控,同时又不过分增加网络的通信负载,必须使用陷入(TRAP)制导的轮讯过程。代理进程负责在必要时向管理站报告异常事件,得到异常事件的报告后,管理站可以查询有关的代理,以便得到更具体的信息,对事件的原因做进一步的分析二、trap的工作流程1、agent端: A

    2022年8月20日
    25
  • 百度指数可以下载吗_百度指数能查一年的数据吗

    百度指数可以下载吗_百度指数能查一年的数据吗大家好我是小小明,今天给大家演示如何使用python直接采集百度指数的数据。百度指数(BaiduIndex)是以百度海量网民行为数据为基础的数据分析平台,它能够能够告诉用户:某个关键词在百度的搜索规模有多大,一段时间内的涨跌态势以及相关的新闻舆论变化,关注这些词的网民是什么样的,分布在哪里,同时还搜了哪些相关的词。百分十先生分享过如何使用uiautomation采集百度指数:百度指数如何批量获取?不过个人感觉这方法好像有点杀鸡用牛刀,对于网页使用selenium完全足以,当然对于专门针对sele

    2022年10月8日
    2
  • oppo手机锁屏断网怎么解除_oppo手机锁屏的时间怎么调整位置

    oppo手机锁屏断网怎么解除_oppo手机锁屏的时间怎么调整位置oppo手机是有很多种锁屏时钟的,手机在息屏状态下,即可以查看时间,还可以在屏幕上显示很多相关的信息,不过很多小伙伴想要更多的个性化锁屏界面,比如把锁屏时钟调个位置和样式等等。那么oppo锁屏时钟怎么改格式?锁屏时钟位置在哪里设置调整呢?下面小编就来详细讲一讲!oppo锁屏时钟怎么改格式?锁屏时钟位置在哪里设置调整一、先来看oppo锁屏时钟怎么改格式?1、第一找到桌面上的“设置”—“显示与亮度”—…

    2022年9月29日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号