DeepSeek-OCR实战(03)：本地部署+轻松UI测试

Ai探索者 • 2026年3月16日下午1:09 • DeepSeek • 阅读 3

DeepSeek-OCR实战是一个系列文章，包含了从基础运行环境搭建到应用接入全过程。本章介绍DeepSeek-OCR如何本地部署

DeepSeek-OCR实战(03)：本地部署+轻松UI测试

前面在《DeepSeek-OCR实战(01)：基础运行环境搭建》中已经安装好了 conda ：

注意：在安装flash-attn==2.7.3时如果出现问题，可以到github的flash-attention官方（https://github.com/Dao-AILab/flash-attention/releases）下载对应版本的.whl官方包。

简单来说，FlashAttention（flash-attn）是一个专门用于DeepSeek 教程优化Transformer模型中注意力机制（Attention）计算的库，它能显著提升计算速度并大幅减少GPU显存消耗。对于像DeepSeek-OCR这样庞大的模型来说，安装它是比较重要的。

如何选择 flash-attn的版本：

版本文件名中的第一部分（例如、）为 CUDA 版本，本地CUDA版本使用命令查看(本地为：11.8版本)

版本文件名中的第二部分（例如、、）为 pytorch 版本。本地 pytorch 版本可以通过命令查看(本地为：2.6.0+cu118)

版本文件名的第三部分（例如）为 Python 版本，选择本地 Python 版本即可。本地 Python 版本可以通过命令查看（本地为：3.12）

所以这里就应该下载：这个版本

DeepSeek-OCR实战(03)：本地部署+轻松UI测试