深度学习图像数据自动标注[通俗易懂]

深度学习图像数据自动标注[通俗易懂]Tensorflow和Caffe等深度学习中,监督学习的数据标注是一件非常繁琐和耗时的工作,目前大多数公司都采用外包给标注公司进行处理,或者购买现有的数据集,使得进行深度学习研究的成本异常高。本文介绍一种以人工智能解决数据标注的思路和方法。一、思路步骤:1、以一个初步模型对小批量待标注数据进行检测,这里的初步模型可以是自己用少批量数据集训练出来的,也可以用网上公布的;2、对检测出来的结果进行人为干预纠正;3、把纠正后的数据训练新的模型;4、用新模型对中等批量待测数据进行检测;…

大家好,又见面了,我是你们的朋友全栈君。

    Tensorflow和Caffe等深度学习中,监督学习的数据标注是一件非常繁琐和耗时的工作,目前大多数公司都采用外包给标注公司进行处理,或者购买现有的数据集,使得进行深度学习研究的成本异常高。本文介绍一种以人工智能解决数据标注的思路和方法。

一、思路

步骤:

1、以一个初步模型对小批量待标注数据进行检测,这里的初步模型可以是自己用少批量数据集训练出来的,也可以用网上公布的;

2、对检测出来的结果进行人为干预纠正;

3、把纠正后的数据训练新的模型;

4、用新模型对中等批量待测数据进行检测;

5、通过1~5步骤的循环迭代,可以逐步求精;

6、虽然也需要人工参与,但可以极大减少工作量。

实现方法:

1、Anno-Mage

Anno-Mage是一个半自动标注工具,通过一个通用模型对数据集进行检测。但这个工具能标注的物品类型有限,也没有模型迭代逐步求精的过程,可以自行对其源码进行修改优化。

github代码地址:https://github.com/virajmavani/semi-auto-image-annotation-tool 

深度学习图像数据自动标注[通俗易懂]

2、easyDL智能标注

2.1、智能标注

百度easyDL提供了智能标注的功能,跟以上思路差不多,都是先对小批量数据进行标注学习训练,然后以学习结果去标注剩下的数据集,然后人工纠正,迭代求精。

easyDL平台网址:https://ai.baidu.com/easydl/lite

智能检测技术文档:https://ai.baidu.com/ai-doc/EASYDL/lk38n327g

深度学习图像数据自动标注[通俗易懂]

2.2、数据导出

但easyDL官方不提供数据导出功能和api,这阻碍了我们把数据拿到Tensorflow和Caffe进行训练。所以我们可以通过爬虫技术来爬取训练好的数据。

工具github地址:https://github.com/kooky126/easydl2labelImg

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/147820.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Java类加载机制与Tomcat类加载器架构

    Java类加载机制与Tomcat类加载器架构Java类加载机制类加载器虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需要的类。实现这个动作的代码模块称为“类加载器”。类加载器可以说是Java语言的一项创新,也是Java语言流行的重要原因之一,它最初是为了满足JavaApplet的需求而开发出来的。虽然目前JavaA

    2022年5月20日
    40
  • 考研数学二常用公式_考研数学写公式有分吗

    考研数学二常用公式_考研数学写公式有分吗面(体)积公式一元二次方程基础极坐标方程与直角坐标转换切线与法线方程因式分解公式阶乘与双阶乘函数的奇偶性排列组合等差数列等比数列常用数列前n项和不等式三角函数公式诱导公式平方关系两角和与差的三角函数积化和差公式和差化积公式倍角公式半角公式万能公式其他公式反三角函数恒等式极限相关公式数列极限递推式重要极限公式常用等价无穷小1^∞型导数相关公式导数定义微分定义连续,可导及可微关系一元函数多元函数导数四则运算复合函数求导反函数求导参数方程

    2022年8月11日
    25
  • jvm的垃圾回收机制_垃圾回收厂

    jvm的垃圾回收机制_垃圾回收厂一、概述我们知道自动的垃圾回收机制是Java语言一个特点,它让我们在写程序的时候不再需要考虑内存管理问题。内存管理实际上就是分配内存和回收内存这两个问题,在上一篇文章我大概介绍了jvm是如何划分内存

    2022年8月16日
    7
  • 公用IPv6 IPv4 DNS[通俗易懂]

    IPv6下一代互联网国家工程中心ChinaIPv6DNS服务器雪人计划YetiDNSProject首选:240c::6666备用:240c::6644备用:240c::4444CNNICIPv6DNS服务器首选:2001:dc7:1000::1百度2400:da00::6666阿里云2400:3200::12400:3200:baba::1中科大2001:da8::666清华大学TUNADNS666101.6.6.6;2001:da8::666北京邮电

    2022年4月13日
    184
  • cnn lstm pytorch_pytorch怎么用

    cnn lstm pytorch_pytorch怎么用LSTM模型结构1、LSTM模型结构2、LSTM网络3、LSTM的输入结构4、Pytorch中的LSTM4.1、pytorch中定义的LSTM模型4.2、喂给LSTM的数据格式4.3、LSTM的output格式5、LSTM和其他网络组合1、LSTM模型结构BP网络和CNN网络没有时间维,和传统的机器学习算法理解起来相差无几,CNN在处理彩色图像的3通道时,也可以理解为叠加多层,图形的三维矩阵当做空间的切片即可理解,写代码的时候照着图形一层层叠加即可。如下图是一个普通的BP网络和CNN网络。图中的隐

    2025年10月25日
    2
  • java 环境配置(详细教程)「建议收藏」

    java 环境配置(详细教程)「建议收藏」文章目录前言一、jdk下载二、windows1、jdk安装2、环境变量的配置3、检测是否配置成功前言java环境配置,网上教程很多,那我为什么还要写?首先为了完善我的知识体系今后一些软件的安装教程也可能会用到想写一个更加详细的,因为这并不仅仅是写给IT行业的,其它行业可能也需要配置java环境提示:以下是本篇文章正文内容,下面案例可供参考一、jdk下载如果你电脑已经下载了jdk,那就恭喜你可以跳过这一步了jdk的下载路径:https://www.oracle.co

    2022年7月9日
    16

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号