JAVA——Tess4J简单的图像识别DEMO

JAVA——Tess4J简单的图像识别DEMO基本概念TesseractOpenSourceOCREngine:包含一个OCR引擎-libtesseract和一个命令行程序-tesseract。Tesseract4添加了一个新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract3的传统TesseractOCR引擎,该引擎通过识别字符模式进行工作。通过使用传统OCR引擎模式(–oem0),可以与Tesseract3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。…

大家好,又见面了,我是你们的朋友全栈君。

基本概念

Tesseract Open Source OCR Engine :包含一个OCR引擎 – libtesseract和一个命令行程序 – tesseract。Tesseract 4添加了一个新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式进行工作。通过使用传统OCR引擎模式(–oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。

Tess4JTesseract OCR API的 Java JNA包装器。

Maven

<dependencies>
        <dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.4.0</version>
        </dependency>
 </dependencies>

GitHub 

Tesseract Open Source OCR Engine :https://github.com/tesseract-ocr/tesseract

Tess4J项目:https://github.com/nguyenq/tess4j

语言库:https://github.com/tesseract-ocr/tessdata/blob/master/eng.traineddata

DEMO

1、首先创建一个新的maven项目,将所需jar包引入pom.xml

2、在任意地方创建一个文件夹tessdata,将下载的chi_sim.traineddata 和 eng.traineddata语言包存放在该目录下,也可以直接存放到自己项目的resources/tessdata目录下。

JAVA——Tess4J简单的图像识别DEMO

 

JAVA——Tess4J简单的图像识别DEMO

3、编写代码

         // 识别图片的路径(修改为自己的图片路径)
        String path = "D:\\test.jpg";

        // 语言库位置(修改为跟自己语言库文件夹的路径)
        String lagnguagePath = "D:\\tessdata";

        File file = new File(path);
        ITesseract instance = new Tesseract();

        //设置训练库的位置
        instance.setDatapath(lagnguagePath);

        //chi_sim :简体中文, eng    根据需求选择语言库
        instance.setLanguage("eng");
        String result = null;
        try {
            long startTime = System.currentTimeMillis();
            result =  instance.doOCR(file);
            long endTime = System.currentTimeMillis();
            System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
        } catch (TesseractException e) {
            e.printStackTrace();
        }

        System.out.println("result: ");
        System.out.println(result);

 

5、可选步骤:配置环境变量(TESSDATA_PREFIX)

环境变量地址指向你存放语言包的文件夹路径,如:我的语言包路径在 D:\tessdata

 

JAVA——Tess4J简单的图像识别DEMO

 

运行结果

以一张简单的图片为例:图片放置在D:\test.png根目录下,因此使用代码测试前需要修改代码中指定的两个路径!!!

识别图片:

JAVA——Tess4J简单的图像识别DEMO

运行代码后:

JAVA——Tess4J简单的图像识别DEMO

常见问题 

解决chi_sim.traineddata报read_params_file: parameter not found: allow_blob_division

Warning: Invalid resolution 0 dpi. Using 70 instead.

关于tesseract 出错信息:read_params_file: Can’t open chi_sim

扩展学习

提高识别率

1.对称近邻均值滤波

参考:

http://blog.csdn.net/fangbinwei93/article/details/50562449

2.指定config为digits,并修改tessdata\configs\digits文件,将白名单中设置需要识别的内容。如只需要识别数字,则指定whitelist为0123456789即可。

也可在程序中指定:

参考:

http://blog.csdn.net/hellousb2010/article/details/39477859

3.尽量指定图像的一块区域识别。比如验证码起始位置和结束位置很多空白的,可以去掉,只对验证码区域做识别。

4.训练字库,提升识别率

参考:

http://blog.csdn.net/white0blue/article/details/47972405

http://blog.csdn.net/tuling_research/article/details/41091163

其他参考

tesseract-ocr参数:http://www.sk-spell.sk.cx/tesseract-ocr-parameters-in-302-version

参考文章

https://www.jianshu.com/p/ef60ef5395c5

https://www.cnblogs.com/asker009/p/11098220.html

https://blog.csdn.net/qincidong/article/details/82781361

https://blog.csdn.net/zai_xia/article/details/80003778

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/135530.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月5日 上午6:00
下一篇 2022年6月5日 上午6:00


相关推荐

  • 重新认识java(十) —- Enum(枚举类)[通俗易懂]

    重新认识java(十) —- Enum(枚举类)[通俗易懂]有的人说,不推荐使用枚举。有的人说,枚举很好用。究竟怎么使用,如何使用,仁者见仁智者见智。总之,先学会再说~

    2025年6月17日
    3
  • a4如何打印双面小册子_用word如何打印小册子(一张A4打两张那种的)

    a4如何打印双面小册子_用word如何打印小册子(一张A4打两张那种的)用 word 打印小册子具体操作步骤 1 首先打开将要打印的文档 然后在菜单栏下面的快捷菜单栏 找到打印机的快捷图标 单击鼠标左键选择打开打印机 2 会弹出打印机设置对话框 可以进行打印前的一些细节的设置 由于是要选择打印一本小册子所以选择打印 所有页面 3 在下面一栏是调整页面大小 也就是打印模式 选择 小册子 进行打印 4 然后下面是关于小册子的一些设置 按照自己的需要进行设置 5 设置完成以后

    2026年3月19日
    2
  • 数据库概念结构设计的方法和步骤_概念结构设计是整个数据库

    数据库概念结构设计的方法和步骤_概念结构设计是整个数据库概念结构设计什么是概念结构设计将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定概念结构设计是整个数据库设计的关键概念结构设计的特点(1)能真实、充分地反映现实世界(2)易于理解(3)易于更改(4)易于向关系、网状、层次等各种数据模型转换

    2022年10月12日
    2
  • validateRequest=false 可以禁用请求验证[通俗易懂]

    validateRequest=false 可以禁用请求验证[通俗易懂]参看了MVP的利用WebClient和WebRequest类获得网页源代码于是想自己动手写点,当然是参考其的办法啦。我这次下载了visualwebdeveloper2005express按照上面的文章编写了代码,我的btn函数如下       stringurlPage=””;       urlPage=UrlText.Text;

    2022年6月10日
    31
  • think in java一_Think in Java(一):Java基础「建议收藏」

    think in java一_Think in Java(一):Java基础「建议收藏」一.OOP的特点(1)万物皆为对象;(2)程序是对象的集合,他们通过发送信息来告诉彼此所要做的;(3)每个对象都有自己的由其他对象所构成的存储;(4)每个对象都拥有它的类型;(5)某一特定类型的对象都可以接收同样的消息;二.Java比C++简单?(1)Java有垃圾回收器,不用手动销毁对象;(2)Java使用单根继承;(3)Java只能以一种方式创建对象(在堆上创建);三….

    2022年7月8日
    24
  • 虚拟机怎么退出vi编辑模式_手机系统占用30个g正常吗

    虚拟机怎么退出vi编辑模式_手机系统占用30个g正常吗ESC键->冒号->小写q->(可选:不保存退出加个惊叹号!)->(可选:如文件需保存加个小写w)  当编辑完文件,准备退出Vi返回到shell时,可以使用以下几种方法之一。   (1)在命令模式中,连按两次大写字母Z,若当前编辑的文件曾被修改过,则Vi保存该文件后退出,返回到shell;若当前编辑的文件没被修改过,则Vi直接退出,返回到shel

    2026年4月19日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号