在数字化办公席卷全球的今天,文档解析技术已成为企业数字化转型的关键瓶颈。面对海量的合同、报告、论文等文档资料,传统解决方案要么速度缓慢,要么错误百出。5月22日,字节跳动开源的全新文档解析模型Dolphin横空出世,凭借仅322M参数的轻量级架构,在性能上实现了对GPT-4.1、Claude3.5等重量级模型的全面超越!
github: https://github.com/bytedance/Dolphin
在线Demo: http://115.190.42.15:8888/dolphin
下面开始部署指南:
一、安装依赖环境
二、下载模型权重
选项A:原始模型格式(基于配置)
从百度云或谷歌驱动器下载,并将它们放在。/checkpoint文件夹中。
百度网盘:
https://pan.baidu.com/share/init?surl=5zcARoX0CTOHKbW8bFZovQ&pwd=9rpx
豆包 大模型 教程
谷歌云盘:
https://drive.google.com/drive/folders/1PQJ3UutepXvunizZEw-uGaQ0BCzf-mie
选项B:Huggingface模型格式
huggingface模型地址:
https://huggingface.co/ByteDance/Dolphin
魔搭的模型地址:
https://www.modelscope.cn/models/ByteDance/Dolphin
#从Hugging Face Hub下载模型
Git LFS安装
git clone https://huggingface.co/ByteDance/Dolphin ./hf_model
本文采用选项A:原始模型格式,百度网盘下载模型权重,放入checkpoints 目录中;
三、实战测试效果
模型推理的配置文件:
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/267954.html原文链接:https://javaforall.net
