heygem.ai 是一款顶级效果数字人工具,通过可视化网页操作就能做出一个效果不错的数字人视频。
GitHub 项目地址:
https://github.com/GuijiAI/HeyGem.ai
整套数字人方案代码已上传github,访问上面网址即可查看
有一点很重要,开源还不是满血版,硅基智能推出满血 API 版本,允许授权商用
以下是 HeyGem.ai 的详细本地部署流程
- 系统配置
操作系统:Windows 10 19042.1526 或更高版本
存储空间:C盘需100GB(存放Docker镜像),D盘需30GB(存储数字人数据)
硬件推荐 manus 教程:NVIDIA RTX 4070显卡 + 32GB内存(最低支持1080Ti显卡)
- 依赖软件
Docker Desktop(需配置WSL2)
Node.js 18(部分前端功能需要)
最新版NVIDIA显卡驱动
必须有 D 盘:主要用于后续数字人、作品等数据存储
- 空闲空间要求:大于30G
C 盘:用于存储服务镜像文件
- 空闲空间要求:大于 100G
- 如果不足 100G,可以在安装完成docker后,在下图的位置重新选一个剩余空间大于 100G 的磁盘文件夹。
确保有英伟达显卡,并正确安装显卡驱动英伟达驱动下载地址:
https://www.nvidia.cn/drivers/lookup/
powershell
# 以管理员身份运行PowerShell,执行以下命令 wsl --install wsl --set-default-version 2
完成安装后重启系统。
从官网下载适用于Windows的Docker安装包(选择WSL2后端)
安装过程中勾选以下选项:Use WSL 2 instead of Hyper-VAdd shortcut to desktop
安装完成后,在设置中调整镜像存储路径(建议指向D盘以避免C盘空间不足)
bash
# 在D盘创建部署目录并下载Docker配置文件 git clone https://github.com/GuijiAI/HeyGem.ai cd HeyGem.ai/deploy # 启动Docker容器(需确保网络通畅) docker-compose up -d
此过程会下载约70GB的镜像文件,耗时约1-2小时(建议使用网络加速工具)。
从GitHub Releases页面下载Windows客户端EXE文件:
markdown
https://github.com/GuijiAI/HeyGem.ai/releases
安装完成后运行程序,界面自动连接本地Docker服务
通过前端界面执行:
- 上传素材:视频:8秒以上正脸无遮挡视频(推荐1080P/60帧)照片:高清正面照(建议4K分辨率)
- 生成模型:
python
# 后台执行的克隆核心代码(供开发者参考) from heygem.core import CloneEngine cloner = CloneEngine(device=‘cuda’) cloner.create_avatar(video_path=“input.mp4”, output_dir=“D:/heygem_models”)
- 生成时间约30秒(RTX 4070显卡)
- 镜像下载失败
修改Docker镜像源为国内地址(如阿里云)
手动下载离线镜像包并加载
- 显卡驱动报错
powershell
# 验证CUDA是否正常 nvidia-smi # 应显示显卡状态 docker run —gpus all nvidia/cuda:11.0-base nvidia-smi # 验证Docker GPU支持
- 存储路径配置
在Docker Desktop中修改镜像存储路径:
json
// settings.json “storage-path”: “D:\\docker_images” [5,7](@ref)
- 多语言支持:修改config.yml中的language: en参数(支持中/英/日/韩等8种语言)
- 批量生成:调用batch_generate()接口实现队列渲染
- API对接:通过http://localhost:8000/docs访问Swagger文档
部署验证
成功运行后,Docker Desktop应显示三个活跃容器:
- heygem-voice(语音合成)
- heygem-face(面部驱动)
- heygem-api(接口服务)
如需进一步优化部署细节,可参考官方文档或开发者社区讨论
发布者:Ai探索者,转载请注明出处:https://javaforall.net/246152.html原文链接:https://javaforall.net
