集成:DeepSeek,豆包,混元,通义千问。
2025年7月份,开始转型独立开发者。
第一款尝试的产品自然是AI方向,此前不具备专业的产品经验,所以只能更多的依赖大模型的能豆包 大模型 教程力。
年初DeepSeek成功证明模型即产品的理念,所以第一款产品尽量降低传统的产品设计思维,会把场景和流程交给大模型去处理,通过反复测试来调整干预的权重,找到一个相对平衡的比例。
有时候在反思,自己的脑回路会不会限制AI的发挥。
在产品的初期,先选择接入四款大模型,深度求索的DeepSeek,字节跳动的豆包,腾讯的混元,阿里的通义千问。
模型即产品,那产品是什么?
当然每家的大模型,都有自己的能力特点,这里只是从产品的整体功能考量,这几款模型可能更适合,后续可能也会在实践中做动态调整。
如何快速熟悉大模型的能力?多提问题,多和它来回拉扯。
首先给这几款大模型,抛出一个灵魂拷问:
作为一款很强的大模型,请你客观的分析DeepSeek,豆包,千问,混元,这四款大模型的差异,并从综合能力的角度给个排序。
看热闹不嫌事大,先让大模型自我分析一把,验证一下自己对它们的预期。
DeepSeek回答:

豆包回答:

通义千问回答:

混元回答:

各个大模型对于能力的排序,权当个热闹看一看。
不过有个结论可以得出来的:不同平台的业务和数据有很大差异,所以训练出来的模型能力也有差异。
此前文章中写过DeepSeek的代码测评,确实很惊艳;豆包的产品化能力,方便解决很多生活问题;混元经常用来分析行业热门事件;通义千问常用来提供业务设计的参考。
所以产品的不同功能,交给不同的大模型来处理,是比较合理的策略。
从产品的业务需求出发,来设计后端框架的模型对接,既然需要集成多款大模型,自然是通用的组件更方便管理,通过测试对比个人倾向使用依赖包。
这几款模型的使用文档,都适配了OpenAI的接口规范,只是豆包有轻微的细节差异。
这里说一下简单的思路,是先敲定组件的版本,在这个组件中依赖的版本,以此定了后端的框架和版本。
首先看基础的配置文件,比较常见的就是请求的地址和方法,然后指定大模型使用的版本名称,这里要注意豆包配置的差异,千问和混元也是一样的方式。
简单做个测试的用例,构建类,传入自定义的提示词,请求DeepSeek大模型,没有使用流式输出,所以请求响应的时间比较长。
通过配置文件管理模型的集成虽然简单高效,但是产品的场景中有模型动态选择的功能,所以做个简单的封装,在容器中存类,选中哪款调用哪款。
多款大模型的配置信息,统一维护在表中即可,在服务启动时加载一次,初始化中的容器。
简单的测试一下模型动态选择的封装。
产品在完成大模型集成后,测试具体的业务场景时,可以先不考虑自定义的干预策略,就看一看大模型能发挥到什么程度。
如果效果不符合预期,再逐步的加入自定义的策略,直到产品和大模型这个”产品”形成默契的配合,建议测试过程放在模型官网的对话框进行。
毕竟独立开发者的收入,已经独立了。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/269381.html原文链接:https://javaforall.net
