字节开源Dolphin文档解析模型-部署指南+实战测试

字节开源Dolphin文档解析模型-部署指南+实战测试


在数字化办公席卷全球的今天,文档解析技术已成为企业数字化转型的关键瓶颈。面对海量的合同、报告、论文等文档资料,传统解决方案要么速度缓慢,要么错误百出。5月22日,字节跳动开源的全新文档解析模型Dolphin横空出世,凭借仅322M参数的轻量级架构,在性能上实现了对GPT-4.1、Claude3.5等重量级模型的全面超越!

github: https://github.com/bytedance/Dolphin

在线Demo:  http://115.190.42.15:8888/dolphin


下面开始部署指南:


一、安装依赖环境


二、下载模型权重

选项A:原始模型格式(基于配置)

从百度云或谷歌驱动器下载,并将它们放在。/checkpoint文件夹中。

百度网盘:

https://pan.baidu.com/share/init?surl=5zcARoX0CTOHKbW8bFZovQ&pwd=9rpx

豆包 大模型 教程

谷歌云盘:

https://drive.google.com/drive/folders/1PQJ3UutepXvunizZEw-uGaQ0BCzf-mie


选项B:Huggingface模型格式

huggingface模型地址:

https://huggingface.co/ByteDance/Dolphin

魔搭的模型地址:

https://www.modelscope.cn/models/ByteDance/Dolphin


#从Hugging Face Hub下载模型

Git LFS安装

git clone https://huggingface.co/ByteDance/Dolphin ./hf_model


本文采用选项A:原始模型格式,百度网盘下载模型权重,放入checkpoints 目录中;



三、实战测试效果

模型推理的配置文件:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/267954.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午5:34
下一篇 2026年3月12日 下午5:35


相关推荐

关注全栈程序员社区公众号