tess4j正确的使用 OCR

tess4j正确的使用 OCR在官网上下载下来的tess4j的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…实际上使用时需要注意一下几点:一、引jar包打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。l

大家好,又见面了,我是你们的朋友全栈君。

在官网上下载下来的 tess4j 的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…

实际上使用时需要注意一下几点:

一、引jar包

打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。lib下是否所有jar都需要用到我也不清楚,这里我引入了lib下所有jar(简单粗暴)。

二、指定tessdata文件

在tessdata文件夹中存放着字库文件(xxx.traineddata),很关键。字库可扩展。tessdata的文件夹名称不能改变,否则会找不到。程序默认此文件夹位置为 “ ./tessdata/eng.traineddata”,即path下。路径可以设置

	ITesseract instance = new Tesseract();
	instance.setDatapath("D:\\IDEA\\mytest\\OCR"); //当tessdata路径为"D:\IDEA\mytest\OCR\tessdata" 时

三、引dll库

好多网友说需要引入dll库,实际上无需引用任何dll库,tess4j.jar 内有所需dll库。在这里无需做任何处理

做好以上几点就可以识别正规无干扰的图片文字了。

代码如下:

public static void main(String[] args) {
    try {
        File imageFile = new File("D:\\IDEA\\mytest\\OCR\\src\\img\\繁体字.png");//图片位置
        ITesseract instance = new Tesseract();  // JNA Interface Mapping
        instance.setDatapath("D:\\IDEA\\mytest\\OCR");//设置tessdata位置
        instance.setLanguage("osd");//选择字库文件(只需要文件名,不需要后缀名)
        String result = instance.doOCR(imageFile);//开始识别
        System.out.println(result);//打印图片内容
    } catch (TesseractException e) {
        e.printStackTrace();
    }
}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141819.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Oracle保留两位小数_java中怎么保留小数点后两位

    Oracle保留两位小数_java中怎么保留小数点后两位在最近的项目开发中,有个业务需求是界面显示的数字需要保留两位小数,目前我想到的解决方法有两种:(1)在写SQL的时候,直接保留两位小数(2)在java代码里面将查询出来的数进行格式化处理,保留两位小数先说第一种方案:在SQL中的处理我使用的oracle数据库,所以有3个函数可以选择,分别是:(1)ROUND(A/B,2)ROUND()函数是会将计算结果进行四舍五入的,如果所需

    2022年9月24日
    0
  • python破解wifi(暴力破解wf)

    自己家的网路实在是差劲的一批…然后电脑打开WiFi,发现了有及格信号还蛮不错的WiFi,于是…就开始了愉快的Python之旅~~~主要步骤获取第一个无线网卡断开断开所有的wifi读取密码本设置睡眠时间fromtkinterimport*frompywifiimportconstimportpywifiimporttime#主要步骤:#1、获取第一个无线网卡#2、断开所有的wifi#3、读取密码本#4、设置睡眠时间#测试连接defwi

    2022年4月12日
    377
  • 创建xsync 脚本

    创建xsync 脚本1、安装rsync:yum-yinstallrsync2、创建xsync文件并进行编辑(最好放到配置过环境变量的目录下)输入命令:vi/usr/local/spark/spark-standalone/bin/xsync#!/bin/bash#1获取输入参数个数,如果没有参数,直接退出pcount=$#if[$pcount-lt1]thenechoNoEnoughArguement!exit;fi#2.遍历集群所有机器forh…

    2022年5月5日
    41
  • C++中set用法详解

    C++中set用法详解1.关于setC++STL之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector,string,list等方便的容器,更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构操作。vector封装数组,list封装了链表,map和set封装了二叉树等,在封装这些数据结构的时候,STL按照程序员的使用习惯,以成员函数方式提供的常用操作,如:插入、排序、删除、查找等。让用户…

    2022年5月11日
    42
  • c#键盘钩子全解

    c#键盘钩子全解usingSystem;usingSystem.Collections.Generic;usingSystem.Text;usingSystem.Runtime.InteropServices;//调用操作系统动态链接库usingSystem.Reflection;usingSystem.Diagnostics;usingMicrosoft.Win32;usingSys

    2022年4月29日
    48
  • dnspod url转发_url解析

    dnspod url转发_url解析一些比较常用的域名软件有又url转发的功能,类似于花生壳,nat123,dnspod等都有转发url的功能没大会具体是怎么转发的方式是怎么样的呢?经过网上资料查找,查看了一些书籍,大概有了一些了解        首先了解一下,URL转发包括显性转发和隐性转发。显性转发:访问域名后,转跳到新的自定义URL地址,浏览器http地址是变化的。隐性转发:访问域名后,浏览器HTTP地址是不变的,但

    2022年10月19日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号