验证码识别(Tess4J初体验)

验证码识别(Tess4J初体验)遇到一道机试题当时就懵逼了0.0查了好多资料,大体知道了基本的步骤:1.预处理2.灰度化3.二值化4.去噪5.分割6.识别还好题目要求不严格,可以使用开源程序。机智的我还真找到一个:Tesseract下面开始正文:Tess4J官方描述:AJavaJNAwrapperforTesseractOCRAPI.1.先去官网下载:http://

大家好,又见面了,我是你们的朋友全栈君。

遇到一道机试题

验证码识别(Tess4J初体验)

当时就懵逼了0.0查了好多资料,大体知道了基本的步骤:1.预处理 2.灰度化 3.二值化 4.去噪 5.分割 6.识别

还好题目要求不严格,可以使用开源程序。机智的我还真找到一个:Tesseract

下面开始正文:

Tess4J官方描述:A Java JNA wrapper for Tesseract OCR API.

 

1.先去官网下载:http://tess4j.sourceforge.net/(我用的是目前最新版本3.1)

2.将下载的文件解压后把下面几个文件夹(图片中选中的)复制到新建的项目中

验证码识别(Tess4J初体验)

3.将lib下的jar包加到build path 中。注意:lib里面除了jar包还有别的。

4.根据官网的样例在刚建的项目中使用一下:

The following code example shows common usage of the library. Make sure tessdata folder are in the search path, and the .jar files are in the classpath.注意在第4步之前确保tessdata 文件夹在项目中,jar包在classpath中。前面的2,3两步已经做了。

 

package net.sourceforge.tess4j.example;

import java.io.File;
import net.sourceforge.tess4j.*;

public class TesseractExample {

    public static void main(String[] args) {
        File imageFile = new File("eurotext.tif");
        ITesseract instance = new Tesseract();  // JNA Interface Mapping
        // ITesseract instance = new Tesseract1(); // JNA Direct Mapping

        try {
            String result = instance.doOCR(imageFile);
            System.out.println(result);
        } catch (TesseractException e) {
            System.err.println(e.getMessage());
        }
    }
}

我稍微改了一下,识别指定文件夹下所有验证码

 

 

package blog.csdn.net.dr_guo;

import java.io.File;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
/**
 * 验证码识别(图片名即为验证码数字)
 * @author drguo
 *
 */
public class VCR {
	public static void main(String[] args) {
		File root = new File(System.getProperty("user.dir") + "/imgs");
		ITesseract instance = new Tesseract();

		try {
			File[] files = root.listFiles();
			for (File file : files) {
				String result = instance.doOCR(file);
				String fileName = file.toString().substring(file.toString().lastIndexOf("\\")+1);
				System.out.println("图片名:" + fileName +" 识别结果:"+result);
			}
		} catch (TesseractException e) {
			System.err.println(e.getMessage());
		}
    }
}

直接运行就行了,但这时可能会报错

 

 

Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract304': Native library (win32-x86-64/libtesseract304.dll) not found in resource path ([file:/G:/Eclipse/Demo/bin/, file:/G:/Eclipse/Demo/lib/commons-beanutils-1.9.2.jar, file:/G:/Eclipse/Demo/lib/commons-io-2.4.jar, file:/G:/Eclipse/Demo/lib/commons-logging-1.2.jar, file:/G:/Eclipse/Demo/lib/ghost4j-1.0.1.jar, file:/G:/Eclipse/Demo/lib/hamcrest-core-1.3.jar, file:/G:/Eclipse/Demo/lib/itext-2.1.7.jar, file:/G:/Eclipse/Demo/lib/jai-imageio-core-1.3.1.jar, file:/G:/Eclipse/Demo/lib/jna-4.2.2.jar, file:/G:/Eclipse/Demo/lib/jul-to-slf4j-1.7.19.jar, file:/G:/Eclipse/Demo/lib/junit-4.12.jar, file:/G:/Eclipse/Demo/lib/lept4j-1.1.2.jar, file:/G:/Eclipse/Demo/lib/log4j-1.2.17.jar, file:/G:/Eclipse/Demo/lib/logback-classic-1.1.6.jar, file:/G:/Eclipse/Demo/lib/logback-core-1.1.6.jar, file:/G:/Eclipse/Demo/lib/rococoa-core-0.5.jar, file:/G:/Eclipse/Demo/lib/slf4j-api-1.7.19.jar, file:/G:/Eclipse/Demo/lib/xmlgraphics-commons-1.5.jar])

注意前面的报错信息,把lib下的win32-x86-64拷到项目中的bin目录下就可以了

 

验证码识别(Tess4J初体验)
准确率还是挺高的。

 

如果你还觉得麻烦,直接把我的项目下载下来改吧:https://git.oschina.net/drguo/VerificationCodeRecognition.git

注意我的jdk版本是jdk1.8.0_74,如果你的版本低于我的版本可能会报错~

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131463.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 电平转换芯片整理「建议收藏」

    电平转换芯片整理「建议收藏」最近做项目遇到的电平转换芯片比较多,这两天会持续汇总整理一下。1.何为电平转换芯片?简言之,就是在不同电压等级的系统电路中,两者通讯也满足信号电平匹配,如果不匹配,就必须要电平转换,电平转换芯片就是为这个而存在的。2.那电平转换都有哪些类型?这个要从不同通信协议的信号电平说起,我们通常在电子电路中,遇到的都是24V以下的电路系统,举个典型的例子–单片机系统,在单片机电路中,常见的信号电平以3.3V和5V为主,比如C51内核的(ATMEL,此处说明一点:ATMEL公司是搞芯片的,51架构是intel搞

    2022年8月10日
    5
  • linux下卸载jdk1.7安装jdk1.8「建议收藏」

    linux下卸载jdk1.7安装jdk1.8「建议收藏」卸载jdk1.7查询java安装版本java-version查询java的安装目录echo$JAVA_HOME我以前在/etc/profile里配置了全局的JAVA_HOME、CLASSPATH和PATH,针对我这种情况想卸载的话,必须把下边这些语句删除vi/etc/profile/i进入编辑,删除之后:wq保存退出.这样的话,你的jdk1.7实际…

    2022年9月25日
    2
  • Java设计模式(六)之结构型模式:适配器模式

    Java设计模式(六)之结构型模式:适配器模式

    2021年4月9日
    119
  • Arcgis api for JavaScript下载及部署(IIS和Tomcat)

    Arcgis api for JavaScript下载及部署(IIS和Tomcat)目录一,各版本下载地址二,ArcGISAPIForJavaScript3.17本地部署(IIS)2.1修改相应的js文件(2个文件)2.2将修改好的函数库复制到指定位置2.3测试ArcGISAPIForJavaScript函数库是否安装成功三,Tomcat部署3.1修改2个js文件3.2将修改好的函数库复制到指定位置3.3测试ArcGI…

    2022年6月3日
    176
  • Oracle PL/SQL编程之五: 异常错误处理(知已知彼、百战不殆)

    Oracle PL/SQL编程之五: 异常错误处理(知已知彼、百战不殆)Oracle PL/SQL编程之五:异常错误处理(知已知彼、百战不殆) 本篇主要内容如下:5.1 异常处理概念5.1.1 预定义的异常处理5.1.2 非预定义的异常处理5.1.3 用户自定义的异常处理5.1.4  用户定义的异常处理5.2 异常错误传播5.2.1 在执行部分引发异常错误5.2.2 在声明

    2022年6月17日
    32
  • linux开机启动步骤

    linux开机启动步骤

    2021年9月8日
    62

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号