java tess4j 示例_java 使用tess4j实现OCR的最简单样例[通俗易懂]

java tess4j 示例_java 使用tess4j实现OCR的最简单样例[通俗易懂]网上很多教程没有介绍清楚tessdata的位置,以及怎么配置,并且对中文库的描述也存在问题,这里介绍一个最简单的样例。1、使用maven,直接引入依赖,确保你的工程JDK是1.8以上net.sourceforge.tess4jtess4j4.3.12、实现代码publicclassOCRDemo{publicstaticvoidmain(Stringargs[])throwsExce…

大家好,又见面了,我是你们的朋友全栈君。

网上很多教程没有介绍清楚tessdata的位置,以及怎么配置,并且对中文库的描述也存在问题,这里介绍一个最简单的样例。

1、使用maven,直接引入依赖,确保你的工程JDK是1.8以上

net.sourceforge.tess4j

tess4j

4.3.1

2、实现代码

public classOCRDemo {public static void main(String args[]) throwsException {

ITesseract instance= newTesseract();

instance.setDatapath(“tessdata”); //相对目录,这个时候tessdata目录和src目录平级//instance.setDatapath(“E:\\myProgram\\java\\ocrdemo\\tessdata”);//支持绝对目录

instance.setLanguage(“chi_sim”);//选择字库文件(只需要文件名,不需要后缀名)

try{

File imageFile= new File(“d:\\temp\\4.jpg”);

String result= instance.doOCR(imageFile);//开始识别

System.out.println(result);//打印图片内容

} catch(Exception e) {

System.out.println(e.toString());//打印图片内容

}

}

}

3、这里一定要注意tessdata的目录位置

70570f47e416b4b6a99b8d86d7e1cfc9.png

你从上面下载的不是真正的训练字库,你需要真正找到字库才行。

5、真正的中文字库是比较大的,用notepad++打开文件看看确认是否是真的字库,不然程序会报错误,无法打开chi_sim.traineddata文件,

1865143b400d2c412827b56d6ef09198.png

6、识别的效果一般,复杂的表格识别需要自定义识别区域

识别的图片:

b788ba23dc4b1feb250c5d9c6649a283.png

识别后的文字:

. 防 火 塔 系 统

防 火 埋 作 为 不 同 网 络 或 网 络 安 全 城 之 间 信 息 的 出 入 口 能 根 据 企 业 的 安 全 策 畦 接 制

出 人 网 络 的 信 息 流 口 本 身 具 有 较 强 的 抗 攻 击 能 力 「 它 是 提 供 信 息 安 全 服 务 实 现 网

络 和 信 息 宗 全 的 基 蛎 设 施 . 在 逐 辐 上 , 防 火 境 是 一 个 分 离 器 限 制 器 和 分 析 器 , 可

以 有 效 勘 接 内 部 网 和 Intemet 之 间 的 任 何 活 动 「 保 证 内 部 网 络 的 安 全 . 防 火 墙 通 常

放 在 外 部 Intemet 网 和 内 部 网 络 之 间 , 以 保 证 内 部 网 络 的 安 全 . 。

防 火 埕 对 流 经 它 的 网 络 通 信 进 行 扫 揽 , 泉 样 能 够 过 滁 掉 一 些 攻 击 , 以 免 其 在 目 标 计

算 机 上 被 执 行 “ 仿 火 墙 运 可 以 伟 闭 不 使 用 的 堵 口 而 丝 它 还 能 菲 止 特 定 堡 口 的 流 出

通 信 封 锁 特 洛 伊 木 马 曝 后 「 它 可 以 蔡 止 来 自 特 殊 站 点 的 访 问 仕 而 防 止 来 自 不 明

人 促 者 的 所 有 通 信 。 。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145200.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 理解目标检测中的mAP与F1 Score

    理解目标检测中的mAP与F1 Score文章目录总述IoUTP、TN、FP、FNPrecisionRecallF1-ScoremAPmAP计算过程:总述要理解mAP与F1Score需要一些前置条件,比如:IoU、FP、TP、FN、TN、AP等IoU衡量监测框和标签框的重合程度。一张图就能解释。TP、TN、FP、FNTP,即TruePositives,表示样本被分为正样本且分配正确。TN,即TrueNegatives,表示样本被分为样本且分配正确。FP,即FalsePositives,表示样本被分为正样本但分配错

    2022年10月14日
    4
  • 神经网络BP反向传播算法原理和详细推导流程

    神经网络BP反向传播算法原理和详细推导流程1反向传播算法和BP网络简介误差反向传播算法简称反向传播算法(即BP算法)。使用反向传播算法的多层感知器又称为BP神经网络。BP算法是一个迭代算法,它的基本思想为:(1)先计算每一层的状态和激活值,直到最后一层(即信号是前向传播的);(2)计算每一层的误差,误差的计算过程是从最后一层向前推进的(这就是反向传播算法名字的由来);(3)更新参数(目标是误差变小)。迭代前面两个步骤,直到满足…

    2022年6月13日
    36
  • 慧荣SM2246XT主控的固态硬盘修复开卡不识别怎么短接方法

    慧荣SM2246XT主控的固态硬盘修复开卡不识别怎么短接方法一块坏了的240G的固态硬盘,电脑完全不认盘了,所以想修复一下,拆开看到主控是慧荣的SM2246XT,幸好此主控是有开卡软件的,下载也比较方便,最新的SM2246XT_MP_EnhancePageMode_MPQ1102A_DBQ0412_FWR1212A.rar修复成功率很高,但跟U盘量产不同,固态硬盘开卡是需要短接的,但很多人不知道SM2246XT的固态硬盘该怎么短接,这里就教大家。如图拆开ssd外壳后可以看到板子上有ROMMODE的字样,那里就是短接的位置了,这里的4个短接点,我们是需要用镊子两两短

    2022年6月14日
    190
  • opencv保存图片小bug

    opencv保存图片小bug错误:cv2.error:OpenCV(4.4.0)C:\Users\appveyor\AppData\Local\Temp\1\pip-req-build-6sxsq0tp\opencv\modules\imgcodecs\src\loadsave.cpp:667:error:(-2:Unspecifiederror)couldnotfindawriterforthespecifiedextensioninfunction’cv::imwrite_’图片路径不对,

    2022年6月23日
    30
  • rgbd-slam_slam算法详解

    rgbd-slam_slam算法详解代码仓库:https://gitee.com/davidhan008/rgbd-slam

    2025年12月16日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号