模仿学习–技术综述[通俗易懂]

模仿学习–技术综述[通俗易懂]概念:局限性:2.1数据的可获得性影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;2.2模型的有效性端到端的特性:1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)2)难以在中间过程中,接收信息和指令;应用方式:1)基于规则的规划、控制模块,还是基础的功能实现方案;2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-connercase或规则无法覆盖的场景,能够有效的实现相应功能模块。论文及学习..

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

  1. 概念
    1)不同于监督学习,强化学习被用于处理复杂的决策任务,但是决策空间巨大,强化学习需要试错,样本的复杂程度较高(sample complexity),限制了强化学习的应用场景;
    2)模仿学习,直接从专家样本中进行学习;由于比较高质量的决策行为数据,模仿学习被认为是可以降低样本复杂度的手段之一。
    3)难点:决策行为的rewarding难以定义,高质量的决策示例可以确定合理的奖励设定方法。

  2. 局限性
    2.1 数据的可获得性
    影子模式可以有效的解决数据的可获得性,但是其中的数据也包括了不值得提倡的司机行为;

    2.2 模型的有效性
    端到端的特性
    1)可解释性较差;可解释性上刚刚有所进展(可解释机器学习?-文档)
    2)难以在中间过程中,接收信息和指令;

    2.3 预测能力
    不能教Autopilot系统处理无法轻易预测的危险情景。比如,老司机看到飘在前方的塑料袋时会不转向,但自动驾驶系统会;存在识别训练数据相关性问题,它不能通过纯粹观察相关性来建构因果模型,并且无法在模拟中主动测试反事实。

  3. 应用方式
    1)基于规则的规划、控制模块,还是基础的功能实现方案;

    2)强化学习、模仿学习,作为规划、控制模块的备份方案,在极端场景下-conner case 或规则无法覆盖的场景,能够有效的实现相应功能模块。

  4. 论文及学习:
    1)https://arxiv.org/abs/1812.03079v1;
    学习:https://blog.csdn.net/Nick_cloud/article/details/109701213;https://zhuanlan.zhihu.com/p/57275593
    2)https://arxiv.org/abs/2111.08575v1

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/192705.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 八数码问题求解「建议收藏」

    八数码问题求解「建议收藏」(一)问题描述在一个3*3的方棋盘上放置着1,2,3,4,5,6,7,8八个数码,每个数码占一格,且有一个空格。这些数码可以在棋盘上移动,其移动规则是:与空格相邻的数码方格可以移入空格。现在的问题是:对于指定的初始棋局和目标棋局,给出数码的移动序列。该问题称八数码难题或者重排九宫问题。(二)问题分析八数码问题是个典型的状态图搜索问题。搜索方式有两种基本的方式,即树式搜索和线式搜索。搜索策略大体有盲…

    2022年7月26日
    3
  • fvwm 中文手册_kindle vol

    fvwm 中文手册_kindle volFvwmisawindowmanagerforX11.Itisdesignedtominimizememoryconsumption,providea3Dlooktowindowframes,andavirtualdesktop.—TheFVWM(F?VirtualWindowManager)manual在看这个文档之前你

    2022年10月3日
    0
  • cropper.js 实现HTML5 裁剪图片并上传(裁剪上传头像。)「建议收藏」

    cropper.js 实现HTML5 裁剪图片并上传(裁剪上传头像。)「建议收藏」我的需求功能:在手机端实现上传头像,带裁剪框。cropper.js通过canvas实现图片裁剪,最后在通过canvas获取裁剪区域的图片base64串。cropper文档:官方文档是全英文的,好吧我看不懂。只能一个个试试效果,就有了下面的总结。官方文档<-点这1.container容器2.canvas图片3.crop裁剪框option相…

    2022年5月27日
    31
  • JavaScript数组filter方法

    JavaScript数组filter方法1.数组filter方法作用筛选数组,将满足条件的元素放入新数组中2.语法:array.filter(function(item,index,arr){})第一个参数:item,必须,当前元素的值第二个参数:index,可选,当前元素在数组中的索引值第三个参数:arr,当前元素所处的数组对象3.filter方法特点(1)函数执行次数===数组长度(2)函数内部的returnreturntrue:满足筛选条件,放入新数组中return

    2022年7月14日
    14
  • Data URI scheme「建议收藏」

    Data URI scheme「建议收藏」什么是DataURISchemedataURIscheme允许我们使用内联(inline-code)的方式在网页中包含数据,目的是将一些小的数据,直接嵌入到网页中,从而不用再从外部文件载入。常用于将图片嵌入网页。HTML中网页图片一般是https://ss2.bdstatic.com/70cFvnSh_Q1YnxGkpoWK1HF6hhy/it/u=162360699,3…

    2022年10月19日
    0
  • C++ Boost全库简介

    C++ Boost全库简介

    2021年9月2日
    74

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号