Tess4J 简单使用入门[通俗易懂]

Tess4J 简单使用入门[通俗易懂]Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在JavaPC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍。———————本文来自jian_cheng_90的CSDN博客,全文地址请点击:https://blog.csdn.net/risky

大家好,又见面了,我是你们的朋友全栈君。

一.简介

Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍

二.入门教程

1.去Tess4J官网下载最新的源码包

Tess4J官网.

我们现在最新的是3.4.8

Tess4J-3.4.8-src下载地址.

2.创建Java项目并配置Tess4J

  • 下载下来的Tess4J目录一般都是如下

在这里插入图片描述

  • dist:综合jar,不需要配置dll
  • lib:所有相关的jar包
  • src:源码包
  • tessdata:训练好的字体模型
  • test:测试用例

这里要把dist下的jar包和lib下的jar包都要导入Java项目中

3.一个Demo

 		File file = new File("D:\\1.jpg");
        ITesseract instance = new Tesseract();
        instance.setDatapath("...");//设置你的Tess4J下的tessdata目录
        instance.setLanguage("eng");//指定需要识别的语种
        String result = instance.doOCR(file);
        System.out.println(result);
  • 其中语种就在tessdata目录下

在这里插入图片描述

  • 你如果要识别的是其他语种
  • 可以去其他语种.把对应的traineddata下载放这里
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132239.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月11日 上午7:36
下一篇 2022年6月11日 上午7:46


相关推荐

  • linux phpstorm激活码2021【在线注册码/序列号/破解码】[通俗易懂]

    linux phpstorm激活码2021【在线注册码/序列号/破解码】,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月18日
    72
  • ibm x201 怎么清理内部_联想 Thinkpad x201i怎么拆机清理风扇灰尘?_硬件教程「建议收藏」

    ibm x201 怎么清理内部_联想 Thinkpad x201i怎么拆机清理风扇灰尘?_硬件教程「建议收藏」笔记本散热风扇使用时间长了就累积很多灰尘,堵塞出风口,从而大幅降低散热效果。因此有必要对其清理。要彻底清理风扇灰尘,需要拆机方可。首先要把笔记本的电池取下。这款笔记本的硬盘仓很隐蔽,不过在D面还是有明显的图标提示,拧下螺丝和卡扣,即可看到硬盘。硬盘盖拆下来之后,只需用力的拔出黑带即可把硬盘取下。电池、硬盘、内存都取下之后,我们用螺丝刀把D壳周围的螺丝你拧下,之后就可以开始拆卸键盘以及外壳了。拆卸键…

    2022年6月27日
    56
  • python精彩编程200例 pdf-Python程序设计 第3版pdf「建议收藏」

    Python程序设计第3版内容简介《Python程序设计第3版》是面向大学计算机科学专业的教材。本书以Python语言为工具,采用相当传统的方法,强调解决问题、设计和编程是计算机科学的核心技能。全书共13章,此外,还包含两个附录。第1章到第5章介绍计算机与程序、编写简单程序、数字计算、对象和图形、字符串处理等基础知识。第6章到第8章介绍函数、判断结构、循环结构和布尔值等话题。第9章到第1…

    2022年4月6日
    118
  • 定点数和浮点数的表示

    定点数和浮点数的表示计算机中常用的数据表示格式有两种 一种是定点格式 二是浮点格式 定点数和浮点数的意思是 小数点的位置是固定的还是浮动的 一般来说定点格式能表示的数值范围有限 单要求处理的硬件简单一些 浮点格式能表示的数的范围很大 但要求处理的硬件比较复杂一些 定点数 所谓定点格式 是指小数点位置是固定不变的 定点数的表示方式有两种 第一种是 定点小数用于表示纯小数 小数点固定在符号位和数值位之间第二种是 定点整数用于表示纯整数 小数点固定数值后面浮点数 小数点的位置由阶码规定 因此是浮动的 用来

    2026年3月17日
    2
  • js获取时间戳字符串

    js获取时间戳字符串vardate newDate varseperator varseperator varmonth date getMonth 1 varstrDate date getDate varhour date getHours

    2026年3月18日
    2
  • javascript中void(0);用法及常见问题解析

    javascript中void(0);用法及常见问题解析转载这篇文章使用过ajax的朋友经常会见到这样的代码:here,这里面的void是一个操作符,该操作符指定要计算一个表达式但是不返回值。javascript:void(0)在某些情况下会有浏览器不兼容的bug。下面我们先来看下javascript:void(0)的基础介绍及用法,然后再来看使用它会出现什么问题,该怎么解决。提示:在学习一下内容之前,你可以先通过javascript:vo…

    2022年7月18日
    16

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号