深度学习图像数据自动标注[通俗易懂]

深度学习图像数据自动标注[通俗易懂]Tensorflow和Caffe等深度学习中,监督学习的数据标注是一件非常繁琐和耗时的工作,目前大多数公司都采用外包给标注公司进行处理,或者购买现有的数据集,使得进行深度学习研究的成本异常高。本文介绍一种以人工智能解决数据标注的思路和方法。一、思路步骤:1、以一个初步模型对小批量待标注数据进行检测,这里的初步模型可以是自己用少批量数据集训练出来的,也可以用网上公布的;2、对检测出来的结果进行人为干预纠正;3、把纠正后的数据训练新的模型;4、用新模型对中等批量待测数据进行检测;…

大家好,又见面了,我是你们的朋友全栈君。

    Tensorflow和Caffe等深度学习中,监督学习的数据标注是一件非常繁琐和耗时的工作,目前大多数公司都采用外包给标注公司进行处理,或者购买现有的数据集,使得进行深度学习研究的成本异常高。本文介绍一种以人工智能解决数据标注的思路和方法。

一、思路

步骤:

1、以一个初步模型对小批量待标注数据进行检测,这里的初步模型可以是自己用少批量数据集训练出来的,也可以用网上公布的;

2、对检测出来的结果进行人为干预纠正;

3、把纠正后的数据训练新的模型;

4、用新模型对中等批量待测数据进行检测;

5、通过1~5步骤的循环迭代,可以逐步求精;

6、虽然也需要人工参与,但可以极大减少工作量。

实现方法:

1、Anno-Mage

Anno-Mage是一个半自动标注工具,通过一个通用模型对数据集进行检测。但这个工具能标注的物品类型有限,也没有模型迭代逐步求精的过程,可以自行对其源码进行修改优化。

github代码地址:https://github.com/virajmavani/semi-auto-image-annotation-tool 

深度学习图像数据自动标注[通俗易懂]

2、easyDL智能标注

2.1、智能标注

百度easyDL提供了智能标注的功能,跟以上思路差不多,都是先对小批量数据进行标注学习训练,然后以学习结果去标注剩下的数据集,然后人工纠正,迭代求精。

easyDL平台网址:https://ai.baidu.com/easydl/lite

智能检测技术文档:https://ai.baidu.com/ai-doc/EASYDL/lk38n327g

深度学习图像数据自动标注[通俗易懂]

2.2、数据导出

但easyDL官方不提供数据导出功能和api,这阻碍了我们把数据拿到Tensorflow和Caffe进行训练。所以我们可以通过爬虫技术来爬取训练好的数据。

工具github地址:https://github.com/kooky126/easydl2labelImg

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/147820.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • button.addactionlistener(this)_input button

    button.addactionlistener(this)_input button//首先要在PageLoad()事件中注册属性   protectedvoidPage_Load(objectsender,EventArgse)   {       if(!IsPostBack)       {           Button1.Attributes.Add(“onclick”,”returncheckSame()”);//为Button1添加onc

    2022年9月26日
    0
  • 最全阿里面试题:已拿offer,阿里P8岗位完整阿里技术面试题目,这些面试题你能答出多少

    我们在操作数据库的时候,可能会由于并发问题而引起的数据的不一致性(数据冲突)。如何保证数据并发访问的一致性、有效性,是所有数据库必须解决的一个问题,锁的冲突也是影响数据库并发访问性能的一个重要因素,从这一角度来说,锁对于数据库而言就显得尤为重要。MySQL锁概述相对其他数据库而言,MySQL的锁机制比较简单,其最显著的特点是不同的存储引擎支持不同的锁机制。比如:MyISAM和MEMORY存储引擎采用的是表级锁(table-levellocking);InnoD

    2022年4月5日
    65
  • 能否利用Hadoop搭建完整的云计算平台「建议收藏」

    Hadoop并不完全代表云计算,所以,要用Hadoop搭建完整的云计算平台,答案是不够。我们常说云计算,实际上还是通过计算机的大规模或者说海量处理来为生活中各式各样的人和各行各业服务——所以,核心在“服务”。关于服务,展开来就是常用的那3种(也是事实上的标准):SaaS,PaaS,IaaS。对云计算来说,公有和私有,虚拟和存储,这其实是相对讨论的核心。回头说Hadoop。在Google三大…

    2022年4月7日
    41
  • Mac环境变量配置(Java)

    Mac环境变量配置(Java)1.打开终端:2.输入命令:【/usr/libexec/java_home-V】,查看默认的jdk下载地址(绿色下划线的就是jdk默认路径)(注意⚠️:命令行终端是区分大小写的【-v是不对的,必须是大写-V】)3.如果是第一次配置环境变量,使用命令:【touch.bash_profile】创建一个.bash_profile隐藏配置文件(如果存在已有配置文件就输入:【open-e.bash_profile】)打开如下4.输入以下命令:(注意⚠️:红色字体是第2步查出来自己jd…

    2022年6月29日
    29
  • C# ZIP文件的压缩和解压缩(SharpZipLib.dll)

    C# ZIP文件的压缩和解压缩(SharpZipLib.dll)真是折腾呀,网上虽然有不少的源码但测试几个就是不成功,经过折腾还是折腾出来了现在分享出来给大家。源码还是在网友们的基础上调整的,主要是调整源码大大小写格式。sharpziplib.dll下载:http://pan.baidu.com/share/link?shareid=1016448925&uk=134565274&fid=3214033513首先需要在项目里引用sharp

    2022年7月26日
    3
  • 应用var模型时的15个注意点_应用相对数时的注意事项

    应用var模型时的15个注意点_应用相对数时的注意事项转载自:http://bbs.pinggu.org/forum.php?mod=viewthread&tid=3219921&ctid=2272向量自回归(VAR,VectorAutoregression)常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响。VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型,从而回避了结构化模型的要求。E

    2025年6月15日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号