CTPN理解

CTPN理解CTPNpipline 类似于 fasterrcnn 的二阶段检测算法 通过 anchor 作为中间元素进行回归 不同之处是增加了 LSTM 单元 anchor 固定宽度为 16 个像素 高度设定为 10 个值 ctpn 中的 anchor 图片来自这里 IOU 的计算 由于 anchor 指定宽度 16 所以对 GoundTruth 的坐标也进行变换 得到宽度为 16 的 GT 和 fasterrcnn 一样计算 anchor 与 GT 的 IOU RPN 为 LSTM 输出序列经 fc 后得到部分 CTPN 中的 RPN 图片来自这里 pro

CTPN理解
CTPN pipline

  • 类似于faster rcnn的二阶段检测算法,通过anchor作为中间元素进行回归;不同之处是增加了LSTM单元;
  • anchor 固定宽度为16个像素,高度设定为10个值;
CTPN理解
ctpn中的anchor 图片来自 这里

  • IOU的计算,由于anchor指定宽度16,所以对GoundTruth的坐标也进行变换,得到宽度为16的GT。和faster rcnn一样计算anchor与GT的IOU;
  • RPN为LSTM输出序列经fc后得到部分;
CTPN理解
CTPN中的RPN,图片来自 这里

  • proposal直接与网络的预测值计算损失。proposal不涉及pooling操作。
  • loss 

CTPN理解

  • 预测时,对预测框先进行nms得到固定宽度的栅格框
  • 合并栅格框——文本线构造算法
CTPN理解
图片来自 这里

参考文献:

  1. 场景文字检测—CTPN原理与实现
  2. 深度学习-TextDetection

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/220725.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午7:48
下一篇 2026年3月17日 下午7:48


相关推荐

  • 前端开发 AI Agent 智能体,需要掌握哪些知识?

    前端开发 AI Agent 智能体,需要掌握哪些知识?

    2026年3月15日
    1
  • 全角字符和半角字符的概念

    全角字符和半角字符的概念1 什么是全角和半角 全角 指一个字符占用两个标准字符位置 汉字字符和规定了全角的英文字符及国标 GB2312 80 中的图形符号和特殊字符都是全角字符 一般的系统命令是不用全角字符的 只是在作文字处理时才会使用全角字符 半角 指一字符占用一个标准的字符位置 通常的英文字母 数字键 符号键都是半角的 半角的显示内码都是一个字节 在系统内部 以上三种字符是作为基本代码处理的 所以用户输

    2026年3月16日
    3
  • 【C语言进阶】⑥函数指针详解

    【C语言进阶】⑥函数指针详解一 函数指针 1 概念函数指针 首先它是一个指针 一个指向函数的指针 在内存空间中存放的是函数的地址 请看示例 intmain inta 10 int pa amp a charch c char pc amp ch intarr 10 0 int parr 10 amp arr 取出数组的地址 return0 解析 parr 是一个指向数组的指针 存放的是数组的地址 所以 数组指针 存放数组地址的指针

    2026年3月19日
    2
  • linux安装DNS服务命令,linux配置dns服务器配置命令

    linux安装DNS服务命令,linux配置dns服务器配置命令linux 配置 dns 服务器配置命令 Linux 系统的 DNS 服务器怎么配置 配置命令有哪些 下面跟 yjbys 小编一起来了解一下吧 一 实验目的熟悉 Linux 系统中 DNS 服务器的配置方法 理解配置过程的基本步骤的作用 二 实验任务 1 建立正向搜索区域 为网络个台服务器建立主机记录 别名记录 为网络建立邮件交换器记录 使得客户机能够根据服务器主机域名搜索出其 IP 地址 2 建立反向搜索区域 为网络个台服

    2026年3月16日
    3
  • 视觉里程计原理_视觉定位和里程计辅助定位

    视觉里程计原理_视觉定位和里程计辅助定位注意到位姿节点之间的变换并不是位姿,之前一直有误解;一般地;路标节点:也就是观测方程【数学形式下见】的观测值,也就是特征点的像素坐标[u,v],或者该帧相机坐标系下的3d坐标[x,y,z];位姿

    2022年8月3日
    9
  • 并行编程中的lock free技术

    并行编程中的lock free技术lockfree(中文一般叫“无锁”,一般指的都是基于CAS指令的无锁技术)是利用处理器的一些特殊的原子指令来避免传统并行设计中对锁(lock)的使用。众所周知,锁在解决并行过程中资源访问问题的同时可能会引入诸多新的问题,比如死锁(deadlock),另外锁的申请/释放对性能也有不小的影响,当然最大的问题还在于使用锁的代码模块通常难以进行组合。lockfree的目标就是要消除锁对编程

    2022年7月19日
    17

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号