文字识别:CRNN「建议收藏」

文字识别:CRNN「建议收藏」文字识别:CRNN

大家好,又见面了,我是你们的朋友全栈君。

文字识别:CRNN「建议收藏」

 

知乎:一文读懂CRNN+CTC文本行识别 (详解 CTC loss)

来自: https://zhuanlan.zhihu.com/p/43534801

代码:https://github.com/bai-shang/OCR_TF_CRNN_CTC

 

文字检测主要解决的问题是哪里有文字,文字的范围有多大,即定位文本行的所在位置和范围及其布局。

文本识别是在文本行定位的基础上,对文本行内容进行识别,将图像中的文本信息转化为文字信息。文字识别主要解决的问题是每个文字是什么。

所以一般来说,从自然场景图片中进行文本行识别,需要包括三个步骤:

  • 图像预处理
  • 文字检测定位文本行区域
  • 对定位好的文本行图片进行识别

文字识别:CRNN「建议收藏」图1 文字识别的步骤

本文的重点是如何对已经定位好的文本行图片进行识别。

文字识别:CRNN「建议收藏」

常用文本行识别算法主要有两个框架:

  • CNN+RNN+CTC(CRNN+CTC)
  • CNN+Seq2Seq+Attention

CTC总结

CTC是一种Loss计算方法,用CTC代替Softmax Loss,训练样本无需对齐。

CTC特点:

  • 同时引入blank字符,解决有些位置没有字符的问题
  • 通过递推,快速计算梯度

……

CRNN+CTC总结

这篇文章的核心,就是将CNN/LSTM/CTC三种方法结合:

  • 首先CNN提取图像卷积特征
  • 然后LSTM进一步提取图像卷积特征中的序列特征
  • 最后引入CTC解决训练时字符无法对齐的问题

提供了一种end2end文本行图片算算法。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/107185.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月20日 下午11:00
下一篇 2022年4月20日 下午11:20


相关推荐

  • linux抓包和分析工具_linux tcpdump 抓包

    linux抓包和分析工具_linux tcpdump 抓包实践中,通常在Linux里用tcpdump命令抓包,然后在Windows里用wireshark软件分析包。较通用的tcpdump命令:tcpdump-ieth0-s0-wpackage.cap注[对eth0进行完整数据包抓取,数据包输入保存到当前目录package.cap中,因为没有-c参数限制,须按Ctrl+C停止抓包]—————–

    2022年10月14日
    3
  • 主流内存数据库功能特性和性能比较

    主流内存数据库功能特性和性能比较内存数据库从范型上可以分为关系型内存数据库和键值型内存数据库 在实际应用中内存数据库主要是配合 oracle 或 mysql 等大型关系数据库使用 关注性能 作用类似于缓存 并不注重数据完整性和数据一致性 基于键值型的内存数据库比关系型更加易于使用 性能和可扩展性更好 因此在应用上比关系型的内存数据库使用更多 本文首先比较 FastDB Memcached 和 Redis 主流内存数据库的功能特性 再从性能上比较

    2026年3月16日
    2
  • 可灵、即梦、通义万相、海螺横评

    可灵、即梦、通义万相、海螺横评

    2026年3月12日
    3
  • pycharm如何搜索关键字_pycharm import变灰

    pycharm如何搜索关键字_pycharm import变灰1DCS调试方案按照以下内容做出一个完整的调试方案。2编制说明为高效优质完成调校工作,确保工艺试车进度,并实现长期、安全稳定生产的目标,特编制本DCS系统调试方案。3编制依据2.1工程合同2.2施工图及产品说明书2.3《工业自动化仪表工程施工及验收规范》GBJ93-864仪表系统调试程序图一为仪表系统调试程序方框图。本着分层隔离、平行作业的方法,本方案将系统调试分划为以下四个层次:4.1…

    2022年8月27日
    7
  • 什么叫做信令_核心网与普通网

    什么叫做信令_核心网与普通网[导读] 本文为你介绍信令与信令网的含义、结构、信令方式,信令网的划分、性能指标、编码方式、信令的三层结构等。关键词:信令网信令什么是信令?信令是终端和终端、终端和网络之间传递的一种消

    2022年8月6日
    10
  • LAMP配置笔记

    LAMP配置笔记1>apache的配置文件路径:/etc/apache2/apache2.conf2>php的配置文件路径:/etc/php5/apache2/php5.ini3>mysql配置文件路径:/etc/mysql/my.cnf4>phpmyadmin配置文件路径:/etc/phpmyadmin/apache.conf5>网站根目录:/var/

    2022年5月3日
    44

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号