Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

最近，一种新型的短视频形式在社交平台上引起了极大关注——《假如书籍会说话》。这类视频通过赋予书籍“生命”，让它们以动画形式与主持人互动，突破了传统的阅读方式，给观众带来了沉浸式的体验。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

今天，我将带领大家进行一次全面的技术拆解，从素材准备到工作流实现，我将提供一个保姆级教程，帮助大家扣子 Coze 教程快速掌握这一工作流。无论你是视频制作初学者，还是有一定经验的创作者，都能在这篇文章中找到实用的技巧与方法，让我们一起探索这一创意视频背后的技术实现吧！

效果如下面的视频所示，我这边控制了让它显示一轮对话，因为token伤不起……

主持人（自己抠图，不喜欢这种风格就丢即梦里面改一下）：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

书（自己抠图，不喜欢这种风格就丢即梦里面改一下）：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

开场动画：

p3-bot-workflow-sign.byteimg.com

整体工作流为两大部分，分别为开场白部分以及主持人和书籍的对话部分，完整工作流如下图所示：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

开场白这部分的工作流就是视频开头的书籍出场部分，还是按照惯例来讲一下工作流的核心节点：

开始节点： 开始节点的接收参数有book(书籍图片)、host(主持人图片)、background(背景图)、book_name(书名，这个视频将围绕这本书展开)、logo(视频作者名)、video(开场视频)、start（时间游标，这个时间游标是开场视频播放完后时间到来到的秒数、单位为微秒，图里为，可以理解为视频开场视频播放完以后，时间来到了3.5秒，我们需要继续在3.5秒这个时间后面追加新内容，如书名，主持人和书籍的对白。）

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

speech_synthesis（插件）： 这个插件主要是基于开始节点中的book_names生成音频，可以点击插件详情，修改音色和其他参数设置。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

get_audio_duration（插件）： 获取朗读书名这段音频的时长。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

create_draft（插件）： 创建草稿，需要设置一下草稿视频的宽和高，我设置的是1920*1080。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

代码（组装数据）： 我们前置的参数，需要基于剪映小助手插件放入到剪映草稿中，我们就需要转换一下，将其转换为剪映小助手插件要求的输入格式，以下图的add_audios工具为例，我们需要传递给插件的参数为audio_infos和draft_url，audio_infos为一个json数组：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

我们就需要基于一个代码节点将我们的前置参数转换为剪映小助手需要的格式，代码的输入参数为：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

完整代码为：

add_audios(插件)、add_videos(插件)、add_captions(插件):这三个插件我放在一起写，他们的作用就是承接代码输出的audios、videos、captions参数，实现在剪映草稿中批量添加音频、视频和字幕：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

大模型 _生成对话文案： 这个节点的作用是基于书名生成生动有趣的对话口播字幕文案。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

提示词我就不放了，放出去以后会有很多同质化的内容出来，比如我前段时间写的治愈老奶奶手把手教程，更离谱的是很多人直接拿我文章洗稿发出去，体验太差，提示词我之后也不会放，下面提示词输出的结果，大家可以投喂给大模型让大模型反推出提示词就行。

人物与书籍对话是工作流是基于大模型生成的对话数组，是一个子工作流，这个工作流的大概思路和主工作流的思路一样，也是构造内容，输入到剪映小助手插件中。我这里只说几个核心节点。完整工作流如下：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

开始节点： 开始节点的输入有audio_text(大模型生成的对话元素)、book（书籍图片）、host（主持人图片）、img（背景图）、log_text(视频右下角作者名)、type（对话的主角：主持人或者书籍）、draft_url(草稿地址)。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

循环： 这个节点接收的是一个对话元素，形如：

我们需要遍历line数组，将line数组元素生成音频，写入到剪映小助手插件当中，如下图，首先我们要先判断role_name为是人为主持人，如果是主持人则合成主持人音频，否则合成书籍音频：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

组装数据(代码)： 这个节点的内容和主工作流一样，目的就是将循环生成的内容转换为剪映小助手需要的输入格式：

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

完整代码为：

退出循环后，我们就将音频、图片、特效、字幕依此写入剪映小助手插件就行。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

你觉得大模型不好用，可能是你不会写提示词，小肥肠为你准备了海量提示词模板和DeepSeek相关教程，只需关注gzh后端小肥肠，点击底部【资源】菜单即可领取。

本文的 工作流 及提示词已经上传至coze空间，感兴趣的朋友可以私信小肥肠详细了解~

在本文中，我们深入探讨了如何利用 Coze 平台制作《假如书籍会说话》风格的视频内容。从素材准备到工作流实现，每一步都力求详细呈现，旨在帮助创作者快速上手，打造出具有创意和吸引力的 AI 视频作品。在未来，随着 AI 技术的不断发展，我们可以期待 Coze 平台在智能体构建、内容生成等方面带来更多的创新和突破。希望本文能为大家提供有价值的参考，激发更多创作灵感，共同探索 AI 内容创作的无限可能。

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/262318.html原文链接：https://javaforall.net

Coze实战：《如果书籍会说话》保姆级教程！全流程拆解（附源码）

关于作者

全栈程序员-站长

相关推荐

图文教程本地部署开源扣子Coze Studio工作流并接入 Gemini 大模型（windows亲测） Coze Studio 本地部署、Gemini 模型接入、开源 AI 工具平台、大模型工作流搭建

字节开源“扣子”，普通人也能玩的AI工具来了，你准备好了吗？

扣子Coze教程：10W+小红书爆款知识卡片 Coze工作流一键批量生成

小红书知识卡片制作智能体以及工作流详解，扣子最新教程

扣子开发平台 Agent 开发教程（二）

发起了一个开源需求广场 NexSolve AI，网页版已上线，寻找志同道合的极客