tess4j正确的使用 OCR

tess4j正确的使用 OCR在官网上下载下来的tess4j的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…实际上使用时需要注意一下几点:一、引jar包打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。l

大家好,又见面了,我是你们的朋友全栈君。

在官网上下载下来的 tess4j 的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…

实际上使用时需要注意一下几点:

一、引jar包

打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。lib下是否所有jar都需要用到我也不清楚,这里我引入了lib下所有jar(简单粗暴)。

二、指定tessdata文件

在tessdata文件夹中存放着字库文件(xxx.traineddata),很关键。字库可扩展。tessdata的文件夹名称不能改变,否则会找不到。程序默认此文件夹位置为 “ ./tessdata/eng.traineddata”,即path下。路径可以设置

	ITesseract instance = new Tesseract();
	instance.setDatapath("D:\\IDEA\\mytest\\OCR"); //当tessdata路径为"D:\IDEA\mytest\OCR\tessdata" 时

三、引dll库

好多网友说需要引入dll库,实际上无需引用任何dll库,tess4j.jar 内有所需dll库。在这里无需做任何处理

做好以上几点就可以识别正规无干扰的图片文字了。

代码如下:

public static void main(String[] args) {
    try {
        File imageFile = new File("D:\\IDEA\\mytest\\OCR\\src\\img\\繁体字.png");//图片位置
        ITesseract instance = new Tesseract();  // JNA Interface Mapping
        instance.setDatapath("D:\\IDEA\\mytest\\OCR");//设置tessdata位置
        instance.setLanguage("osd");//选择字库文件(只需要文件名,不需要后缀名)
        String result = instance.doOCR(imageFile);//开始识别
        System.out.println(result);//打印图片内容
    } catch (TesseractException e) {
        e.printStackTrace();
    }
}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141819.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月25日 上午6:20
下一篇 2022年5月25日 上午6:20


相关推荐

  • mysql窗口函数用法_mysql实现窗口函数

    mysql窗口函数用法_mysql实现窗口函数一,MySQl8.0窗口函数窗口函数适用场景:对分组统计结果中的每一条记录进行计算的场景下,使用窗口函数更好;可以跟Hive的对比着看:点我,特么的花了一晚上整理,没想到跟Hive的基本一致,还不因为好久没复习博客了,淦注意:mysql因为没有array数据结构,无法像Hive一样行列进行转换;1.1窗口函数分类MySQL从8.0版本开始支持窗口函数。窗口函数的作用类似于在查询中对数据进行分组,不同的是,分组操作会把分组的结果聚合成一条记录,而窗口函数是

    2022年10月5日
    3
  • n8n基础教程系列(四)mysql节点介绍

    n8n基础教程系列(四)mysql节点介绍

    2026年3月15日
    3
  • SpringBoot——解决application.properties文件不生效的问题

    SpringBoot——解决application.properties文件不生效的问题SpringBoot——解决application.properties文件不生效的问题

    2022年4月23日
    241
  • pycharm flask框架_挣钱的项目

    pycharm flask框架_挣钱的项目基于Pycharm轻松创建Flask项目需要pycharm专业版,社区版是没有项目模板的,也可以手动创建这几个文件夹完成模板的创建。打开Pycharm的file,选择创建新的项目,然后弹出对话框,我们可以看到里面有很多的案例,Flask、Django等等,我们选择生成Flask的demo程序选择创建之后一个简易的Flask项目就出现在我们眼前,第一个是入口程序,还有一个static的静态目录,templates是模板存放的位置我们可以手动来启动这个Flask项目,但是这不是很理智的,在Pych

    2022年8月28日
    6
  • vim简单用法-配合pycharm

    vim简单用法-配合pycharmAbstract 常用的 vim 使用方法 不要陷入这些语法 挑选正常能用的就行 这对 linux 中 man 命令的使用也会有帮助 知道一些快捷键的用法 这是关于 pycharm 安装插件的使用 vscode 也能用 不经常写英文不建议使用这个东西 Keywords vim 使用参考文献 1 yuck1412 VimCtrolTypo usinggvim amp typorawritem gvimcontrolt github com 2 Gvim

    2026年3月18日
    3
  • layui table reload 重载

    layui table reload 重载在所有记录中通过姓名搜索需要的数据 nbsp nbsp 搜索记录为空时返回所有记录 nbsp nbsp HTML nbsp 方法渲染 table 表格重载 nbsp reload 将再次访问 servlet 第一次访问 nbsp reload 访问 ennn 然后就是后台操作了 我的方法比较笨拙就不贴代码了 but 还是记录一下思路吧 前面做分页时查询了所有的记录 然后 reload 时获取到了 sN

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号