tess4j正确的使用 OCR

tess4j正确的使用 OCR在官网上下载下来的tess4j的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…实际上使用时需要注意一下几点:一、引jar包打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。l

大家好,又见面了,我是你们的朋友全栈君。

在官网上下载下来的 tess4j 的zip,初见时看的云里雾里的,原以为是个jar,直接引用就好了,结果竟是个zip。网上查一下用法,各种说法,各种菜,全是误导,自己不懂就敢瞎说…

实际上使用时需要注意一下几点:

一、引jar包

打开压缩包,在dist下边有tess4j的jar,这个jar包在lib下也可以找到,这是关键jar。此外还需要其他好多依赖jar包,这些都可以在lib下找到。lib下是否所有jar都需要用到我也不清楚,这里我引入了lib下所有jar(简单粗暴)。

二、指定tessdata文件

在tessdata文件夹中存放着字库文件(xxx.traineddata),很关键。字库可扩展。tessdata的文件夹名称不能改变,否则会找不到。程序默认此文件夹位置为 “ ./tessdata/eng.traineddata”,即path下。路径可以设置

	ITesseract instance = new Tesseract();
	instance.setDatapath("D:\\IDEA\\mytest\\OCR"); //当tessdata路径为"D:\IDEA\mytest\OCR\tessdata" 时

三、引dll库

好多网友说需要引入dll库,实际上无需引用任何dll库,tess4j.jar 内有所需dll库。在这里无需做任何处理

做好以上几点就可以识别正规无干扰的图片文字了。

代码如下:

public static void main(String[] args) {
    try {
        File imageFile = new File("D:\\IDEA\\mytest\\OCR\\src\\img\\繁体字.png");//图片位置
        ITesseract instance = new Tesseract();  // JNA Interface Mapping
        instance.setDatapath("D:\\IDEA\\mytest\\OCR");//设置tessdata位置
        instance.setLanguage("osd");//选择字库文件(只需要文件名,不需要后缀名)
        String result = instance.doOCR(imageFile);//开始识别
        System.out.println(result);//打印图片内容
    } catch (TesseractException e) {
        e.printStackTrace();
    }
}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141819.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 0-1背包问题回溯法C++代码

    0-1背包问题回溯法C++代码 /*给定n种物品和一背包。物品i的重量是wi,其价值为vi,背包的容量为C。问应如何选择装入背包的物品,使得装入背包中物品的总价值最大?*/#includeusingnamespacestd;#defineMAXSIZE100#defineTRUE1#defineFALSE0#defineERROR-1typedeffloatvalu

    2022年10月20日
    3
  • 加入购物车怎么操作_买家加入购物车不买怎么办

    加入购物车怎么操作_买家加入购物车不买怎么办ShoppingCart.javapackagecom.aff.bookstore.domain;importjava.util.Collection;importjava.util.Ha

    2022年8月1日
    10
  • 如何利用Javascript发送GET/POST请求「建议收藏」

    如何利用Javascript发送GET/POST请求「建议收藏」如何利用Javascript发送GET/POST请求最近在做基于TWS的分析系统,因为采用Flask+Java的技术架构方案,所以需要开发Web,然而我自己没有做过类似的开发,所以很多工作是从头开始学着做的。因此,在实现表单数据提交的时候,当时就想到个问题,如果一个页面里内容足够多的话,仅用form提交的话,后台就需要做非常复杂的判断,以此确认用户提交的是哪类数据,这样工程不仅难看,而且低效。于是咨

    2022年5月17日
    34
  • 十三、外观模式—— 简化接口 #和设计模式一起旅行#

    我不想成为上帝或英雄,只想成为一棵树,为岁月而生长,不伤害任何人。 ——米沃什故事背景在英国体验了康桥的魅力,我挥一挥衣袖,不带走一片云彩,但是 英国的天空没有留下我的痕迹,但我曾去过。哈哈!从英国到法国,在浪漫的巴黎,我和设计模式MM感受到这个城市别样的风景,很是吸引人,我们决定在这里待一段时间在走。于是去政府部门办理一些手续,本来以为会花费很多时间的,因为之前办…

    2022年2月27日
    43
  • 机器学习之K均值聚类

    K均值聚类思想  聚类的核心概念是相似度或距离,有很多相似度或距离的方法,比如欧式距离、马氏距离、相关系数、余弦定理、层次聚类和K均值聚类等  K均值聚类的

    2021年12月30日
    35
  • DOS中Copy命令合并文件[通俗易懂]

    DOS中Copy命令合并文件[通俗易懂]今天在查找DOS中合并文件的命令时,发现使用该命令还可以在有些情况下加密一些帐户信息,遂转。OriginalURL: http://hi.baidu.com/leland/item/a55f753f60a61480b611dbf0我们都知道DOS中Copy命令的主要作用是复制文件,它还有一个作用是合并文件。一般情况下,它主要用于合并相同类型的文件,比如将两个文本文件合并为一个文本

    2022年7月18日
    15

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号