tess4j正确的使用 OCR

tess4j正确的使用 OCR在官网上下载下来的tess4j的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…实际上使用时需要注意一下几点:一、引jar包打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。l

大家好,又见面了,我是你们的朋友全栈君。

在官网上下载下来的 tess4j 的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…

实际上使用时需要注意一下几点:

一、引jar包

打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。lib下是否所有jar都需要用到我也不清楚,这里我引入了lib下所有jar(简单粗暴)。

二、指定tessdata文件

在tessdata文件夹中存放着字库文件(xxx.traineddata),很关键。字库可扩展。tessdata的文件夹名称不能改变,否则会找不到。程序默认此文件夹位置为 “ ./tessdata/eng.traineddata”,即path下。路径可以设置

	ITesseract instance = new Tesseract();
	instance.setDatapath("D:\\IDEA\\mytest\\OCR"); //当tessdata路径为"D:\IDEA\mytest\OCR\tessdata" 时

三、引dll库

好多网友说需要引入dll库,实际上无需引用任何dll库,tess4j.jar 内有所需dll库。在这里无需做任何处理

做好以上几点就可以识别正规无干扰的图片文字了。

代码如下:

public static void main(String[] args) {
    try {
        File imageFile = new File("D:\\IDEA\\mytest\\OCR\\src\\img\\繁体字.png");//图片位置
        ITesseract instance = new Tesseract();  // JNA Interface Mapping
        instance.setDatapath("D:\\IDEA\\mytest\\OCR");//设置tessdata位置
        instance.setLanguage("osd");//选择字库文件(只需要文件名,不需要后缀名)
        String result = instance.doOCR(imageFile);//开始识别
        System.out.println(result);//打印图片内容
    } catch (TesseractException e) {
        e.printStackTrace();
    }
}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141819.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Centos 7 图形化界面安装

    Centos 7 图形化界面安装1.centos安装完成centos72.测试网络是否能进行链接重启网络。[root@localhost~]#servicenetworkrestart出现以下页面,则网络重启成功。测试链接。[root@localhost~]#pingwww.baidu.com出现以下页面则可以链接网络,ctrl+c退出,进入步骤4。如果链接失败进入步骤3。3.进行网络配置首先进入以下文件夹[root@localhost~]#cd/etc/sysconfig/netwo

    2022年5月30日
    59
  • visa仪表matlab,通过VISA接口获取安捷伦示波器捕获的波形

    visa仪表matlab,通过VISA接口获取安捷伦示波器捕获的波形CapturingawaveformfromanAgilentoscilloscopeoverastandardVISAinterfaceMATLABisasoftwareenvironmentandprogramminglanguagewithover1,000,000users.MATLABextendsthefunctionalityof…

    2022年10月12日
    0
  • javaweb项目图书管理系统教程(图书管理系统java课程设计)

    版权声明:本文为博主原创文章,未经博主允许不得转载2019.5.22更新看到很多人看这个项目我也没想到,不过我现在不在CSDN写文章了,博客地址链接←这是我的博客地址链接GitHub地址链接←这是我的github地址链接里面有我学习Java的过程以及笔记,希望大家一起交流。由于刚刚学习完JSP和Servlet在学习框架之前下你给更加巩固一下前面的知识所以写…

    2022年4月15日
    38
  • 手机分辨率介绍_手机分辨率通俗讲解

    手机分辨率介绍_手机分辨率通俗讲解分辨率(resolution,港台称之为解释度)就是屏幕图像的精密度,是指显示器所能显示的像素的多少。由于屏幕上的点、线和面都是由像素组成的,显示器可显示的像素越多,画面就越精细,同样的屏幕区域内能显示的信息也越多,所以分辨率是个非常重要的性能指标之一。可以把整个图像想象成是一个

    2022年8月13日
    3
  • java中数组的下标的数据类型是_java返回数组下标

    java中数组的下标的数据类型是_java返回数组下标packagepractice;publicclassArrayElementsAddIndices{ publicstaticvoidmain(String[]args){ intarray[]={5,4,3,2,1,6,7,8,9}; System.out.println(“原数组中的元素:”); for(inti=0;i<array.length;i++){ System.out.print(array[i

    2022年10月11日
    1
  • android如何获取证书签名?

    android如何获取证书签名?cygwin环境下在cygwin环境下运行如下命令,输出结果即为signaturekeytool-exportcert-alias[alias]-keypass[aliaspassword]-keystore[keystorefilepath]-storepass[keystorepassword]|md5sum 例如:当前路径下包含用于对app签名的t

    2022年5月31日
    110

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号