写网文,学会拆书很重要,我们要学习优秀作品的精华。但是由于时间有限,往往很难真的做到仔细分析。
目前市面上也有一些ai阅读,ai拆书的工具,但是要么收费,要么功能单一,都不太符合我的预期,于是有了自己搭建一个ai拆书工具的想法。
这个系列的文章用来记录一下整个过程。
我们以结果为导向,先聊一聊AI拆书要解决什么问题,具体哪些能力。然后再思考怎么实现这些能力。
目前我希望这个工具有以下几种能力:
- 能自动总结每章的故事梗概。
- 能自动识别每章中留下的钩子,爽点,识别总结套路。
- 能自动总结出场的人物,包括性格,能力,人际关系,人物志等。
- 能自动总结小说的世界观设定。比如玄幻小说中的力量体系、势力架构、技能、道具等等。扣子 Coze 教程
基于以上这些能力,可以画出下面的简易架构图。
输入: 第一层是输入层,我们要支持各种各样的输入方式。各自直接复制小说的文本字符串,可以上传文件,可以是一个小说的url等。
转换器:所有的输入最终都要转换为文本字符串,统一格式,便于后面处理。
章节解析器:我需要从长段的文本中,解析出每一章的内容。比如一次性输入10章的内容,解析成有10个元素的集合,每个元素都有章节号num,和章节的内容content。
分析器:分析器就是AI拆书的核心组件了,上面都是预处理。分析器内部又分为几大模块,有故事梗概、角色分析、爽点分析、钩子分析、世界观设定。分析器的难点可能是上下文记忆了,这里要合理运用扣子的知识库,以及数据库来解决。比如在分析前先加载已有的知识。
一口气吃不成胖子,MVP版本,我先实现最简单的功能:
- 读取长段小说内容文本,拆分成一章一章的内容。这个功能可以直接使用ai帮我们生成python代码来完成
- 循环遍历,总结每一章的故事梗概并且存储到数据表中。
下一篇:
3分钟提取百万字章节,小白也能用!
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/265569.html原文链接:https://javaforall.net
