【全栈开发】—— Paddle OCR 文字识别 + deepseek接入(基于python 最新!!!)

【全栈开发】—— Paddle OCR 文字识别 + deepseek接入(基于python 最新!!!)

所有源码都在文章中,大家不要私信来要源码,当然,评论区欢迎交流技术

配置环境

清华源下载 paddlepaddle

清华源下载 paddlehub

飞桨官网安装:

根据自己电脑的配置进行选择,选择 GPU 或者 CPUGPU 要选择 CUDA 版本,可在cmd输入指令查看:

release 后面的就是 CUDA 版本,还未下载 CUDA 的可以看我之前配置 YOLO8GPU 环境,有CUDA Cudnn教程:

官网复制适合自己的指令,在控制台下载(我这只是示例):

下载完后再下载 paddleocr

DeepSeek 教程

示例

配置完成,下面进行一个简单示例(官方示例):

原图片是这样的:

运行代码,识别文字:

识别是一行一行来的,第一个数据是该文字在图片的位置信息是,第二个是文字识别的内容,第三个则是置信度。

可以看到,由于我识别的图片拍的比较清晰,所有文字的识别置信度都在0.998之上,大家也可以放点不清晰的看看效果咋样。

环境配置

先去 deepseek 官网注册,申请 api

这样获取的 api 是没有免费额度的:

但我们也试试代码。

api 调用代码

安装 openai

运行代码:

这样是会报错的:

因为自己 deepseek 官网没有 token 请求次数,大部分小伙伴又不想花钱,API就没办法调用。当然,大大家有能力也可以自己去充值,充值了就有 token 使用权力,就可以正常调用 api。

没超能力就无法调用 deepseek 了吗?当然不是,大家也可注册获取使用Deepseek模型的平台 sliconflow

去这个网站注册,注册即送两千万 token,白飘党的福利:

新建密钥:

使用硅基平台的 api 时,在调用时,需要修改部分代码,修改如下:

完整代码如下:

message 中是上下文,model 可以根据 message 生成结果,role 是发送消息的对象,content 是内容,这里 role 有系统和用户,系统就是 model 上次的回答,用户则是你自己 。当然 message 中也可以不止放这两行上下文,能放很多。

运行代码:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/238883.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 上午10:04
下一篇 2026年3月16日 上午10:04


相关推荐

关注全栈程序员社区公众号