涨姿势——教你如何获取图片上的文字

涨姿势——教你如何获取图片上的文字

 涨姿势——教你如何获取图片上的文字

 

同事写了一句很美丽的句子,我叫他发了一下给我,我想收藏,结果他却截图,截图,截图 给我,我很方……

看了看图片,想到了现在的图片识别,我没有什么好的方法能快速识别图片上的文字,想到这里,立马开始行动起来。

 

1— 我们的想法总是会使我们前进

那我们的目的就非常清楚,我们需要做的就是将图片上的文字提取出来,然后得到我们的文字信息。

 

想法:

1、我们还没有能力写出机器学习的本来,那我们要怎么做,这时候,我突然发现第三方绝对是一个神秘的组织群体,

2、有了第三方,那使用哪个第三方呢?当然是提供给我们需要功能的第三方。

3、搜索百度之后,才发现,百度这个第三方很好使用,就是他了。

4、刚好查询到,百度有一个图片识别的接口,好了,就用它了。

接口:

https://aip.baidubce.com/rest/2.0/ocr/v1/webimage

其他材料:

一张带有文字的图片。

 

02— 代码实现

获取到接口,那接下来就是去实现它:

首先来解决一下 

access_token

我们需要使用到另外的一个接口,

access_token= 'https://aip.baidubce.com/oauth/2.0/token?'       'grant_type=client_credentials&' \       'client_id=YtY4Q9wTWBFuc6B6P8XhmOV' \       '&client_secret=rwi6dj6YB4kH9IvbK6gtGvdXtq'

client_id 和 client_secret  这两个参数都需要到百度api后台去申请应用才能获取到。

然后是获取access_token的代码​:

headers={'Content-Type': 'application/json; charset=UTF-8'}host = 'https://aip.baidubce.com/oauth/2.0/token?' \       'grant_type=client_credentials&' \       'client_id=YtY4Q3UwTWBFuc6BP8XhmOV' \       '&client_secret=rwi6dj6YB4CkHhRNOIvbK6gtGvdXtq'access_token=requests.get(host,headers=headers).json()["access_token"]

access_token获取成功,那我们接下来拿出我们准备的图片​,

获取图片文字代码:

file = open("图片地址", 'rb')image = file.read()file.close()webimage=requests.post("https://aip.baidubce.com/rest/2.0/ocr/v1/webimage?access_token="+access_token,headers={"Content-Type":"application/x-www-form-urlencoded"},data={"image":base64.b64encode(image)}).json()for i in webimage["words_result"]:    print(i["words"],end='')#拼接文字输出

来看完整代码​:

import requestsimport base64headers={'Content-Type': 'application/json; charset=UTF-8'}host = 'https://aip.baidubce.com/oauth/2.0/token?' \       'grant_type=client_credentials&' \       'client_id=YtY4Q3UwTFuc6B6P8XhmOV' \       '&client_secret=rwi6dj6YB4CkHhRV1NvbK6gtGvdXtq'access_token=requests.get(host,headers=headers).json()["access_token"]file = open("图片地址", 'rb')# 读取图片image = file.read()file.close()webimage=requests.post("https://aip.baidubce.com/rest/2.0/ocr/v1/webimage?access_token="+access_token,                       headers={"Content-Type":"application/x-www-form-urlencoded"},                       data={"image":base64.b64encode(image)}).json()for i in webimage["words_result"]:    print(i["words"],end='')#拼接文字并输出

当然除了用来获取文字之外,还可以用来翻页验证码使用​。

在进行自动化操作时,验证码跳不过去,那可以试一下把验证码翻译​过来。

 

震惊!字符还可以这样玩……

论如何简单快捷的批量添加微信好友

如何给自己心仪的人每天发送天气提醒消息

 

了解更多,欢迎关注我们​:

涨姿势——教你如何获取图片上的文字

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111409.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 将 VSCode 快捷键修改为 eclipse的快捷键[通俗易懂]

    将 VSCode 快捷键修改为 eclipse的快捷键[通俗易懂]文章目录1、VSCode中打开`命令面板`,如下图所示。2)在命令面板中输入`keyboard`3)打开`首选项:打开键盘快捷方式(JSON)`4)在`keybindings.json`中配置快捷键配置1(常用的快捷键)配置2(最全的快捷键)1、VSCode中打开命令面板,如下图所示。2)在命令面板中输入keyboard在命令面板中输入keyboard,然后在列表中选择首选项:打开键盘快捷方式(JSON):3)打开首选项:打开键盘快捷方式(JSON)点击

    2022年6月3日
    97
  • 用 Windows Media Center 免费看大片 (二)

    用 Windows Media Center 免费看大片 (二)接本系列上篇文章用WindowsMediaCenter免费看大片(一)点击“确定”,然后选择WindowsMediaCenter中的“电视”功能:此时,可以看到在“电视”功能中,多了一个名为“指南”的功能项,选择并点击“指南”:这时,就能看到有很多网络资源供用户免费观看,任选其一,进行单击选择。此时,会弹出“免费观看互联网视频”…

    2022年7月11日
    35
  • pycharm怎么导入数据库_pycharm导入python

    pycharm怎么导入数据库_pycharm导入python记录一下自己最近一段时间可能用不上的代码,免得以后再找起来麻烦。pycharm连接数据库首先在找到Database,选择连接自己下载的数据库软件。填写完自己的数据库密码后,如果正确的话,就会出现下面这张图。点下“刷新”按钮后即可连接数据库。测试是否连接成功。到这里基本完成了外部数据导入步骤。2.代码importpymysqlimportmath#用来操作数据库的类classclimb_test_DataInput(object):#…

    2022年8月27日
    0
  • 特斯拉起诉505万胜诉_微软案

    特斯拉起诉505万胜诉_微软案微软近日开源了数据处理引擎Trill,它每天能够分析万亿次事件。项目地址:https://github.com/Microsoft/trill当下每毫秒处理大量数据正成为一种常见的业务需求,此次微软开源的Trill,据说每秒能够处理高达数十亿事件,它结合了多模式分析支持和一系列其它功能,微软声称其它任何系统都无法完全与之匹敌。它有如下特点: 作为单节点引擎库,任何.NET应用…

    2025年5月25日
    0
  • 卡尔曼滤波 — 从推导到应用(一)「建议收藏」

    卡尔曼滤波 — 从推导到应用(一)「建议收藏」前言卡尔曼滤波器是在估计线性系统状态的过程中,以最小均方差为目的而推导出的几个递推数学等式,也可以从贝叶斯推断的角度来推导。本文将分为两部分:第一部分,结合例子,从最小均方差的角度,直观地介绍卡尔曼滤波的原理,并给出较为详细的数学推导。第二部分,通过两个例子给出卡尔曼滤波的实际应用。其中将详细介绍一个匀加速模型,并直观的对比系统状态模型的建立对滤波的影响。

    2022年6月17日
    35
  • keypad driver

    keypad driver键盘是6×6矩阵式,在网上下了对应的PATCH,下载地址是https://patchwork.kernel.org/patch/71857/ 这个补丁会创建两个文件arch/arm/plat-mxc/include/mach/mxc_keypad.h//mxc_keypad_platform_data键盘平台设备的结构体/drivers/input/keyboard/mxc_

    2022年4月27日
    41

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号