
文:王智远 | ID:Z
3月7日凌晨,小马哥睡不着。
转发了腾讯云的活动消息,朋友圈只留了一句:没有想到会这么火;三天后早上7点12分,他又发了条朋友圈,扯了一堆产品。
一个管着几万人公司的人,连着两次在凌晨、清早发朋友圈聊同一件事,说明这件事真的让他睡不踏实。
前年文心、去年豆包、今年突然冒出来一堆能做PPT能编工作流的「空间」;有人说入口在对话框,有人说入口在工具箱,还有人说未来根本没有入口。
我把最近看到的碎片拼了拼,发现事情没那么简单。
01
往回看,入口位置一直在变;第一阶段:模型即产品,对话框即入口。
文心一言出来时,界面一个框;你打字,它回答;后来元宝、豆包、Kimi,长得都差不多,都是对话框套一个大模型。谁家模型强,用户就去谁家。入口是对话框,模型本身是核心。
这个状态没持续太久,因为光聊天解决不了复杂事。
比如:做个PPT,对话框顶多给你个文字大纲,剩下排版、配图,还得你自己动手;分析一份财报,它只给你个结论,中间怎么算的、怎么推理的,你看不见,也没法调整。
用户开始不满足了,第二阶段悄悄冒头;Coze出来时,已经不像个聊天工具了。
依然有对话框,但旁边多了好多东西:技能、插件、工作流。可以把一堆能力拖拽到一起,编一套流程,先搜索行业报告,再提取数据,再生成图表,最后排版成PPT,编好以后存起来,下次一键运行。
Claude很快,出了Workflow;GPT那边也上了GPTs,让用户定制专属工具,连专注编程的Claude Code,也开始往工作流的方向靠。
这个变化背后的驱动力很朴素:用户要把事办成。
商业上也有考量,纯聊天产品很难收费,用户习惯了免费;工具箱可以,一套好用的工作流,用户愿意付费,Coze的会员、GPTs的内购,都是这个逻辑。
所以,第一阶段「你有什么问题,我来答」;第二阶段是「你有什么事,我帮你做」,入口从一个点,变成了一张网。
直到最近,Claude开了Marketplace,腾讯一口气推了好几个名字不同的产品;这些新动作指向的方向,比工具箱本身更有意思。
02
智远看来,AI入口产品已经演化成三个层级;第一层叫基础层,模型加算力。
OpenAI、Anthropic、Google、Meta,都在这一层打架;国内能上牌桌的,也就字节、腾讯、阿里、百度,再加上几家融资能力强的创业公司。
这一层特点是烧钱、拼规模、拼技术储备;过去两年,百万token的成本掉了90%以上,开源模型也追得越来越近。
就说Kimi,用旗舰模型八分之一的价格,跑出了差不多的效果。这说明,基础层正在快速变成水电煤,谁都能用,但谁都很难靠这个赚钱。
这不是创业公司该待的地方,想在这里活下来,得每年烧几十亿美金,得养几百个博士,得跟英伟达抢显卡。
第二层叫编排层。
让AI学会规划任务、调用工具、记住上下文、协调多个子任务;LangChain、LlamaIndex、各种Agent框架都在这一层,Coze工作流、Claude的Workflow、GPT的技能插件,也属于这一层。
这一层现在最热闹,创业公司扎堆,资本往里面冲,都觉得找到了大厂没顾上的缝隙。
第三层叫应用层。
垂直工作流加用户关系;一个专门给律所做的合同审查Bot,一个给医生用的病历整理助手,都落在这一层,这一层离用户最近,离钱也最近。
把上面产品往里放,位置就清楚了。
文心一言、元宝、豆包,千问、既有基础层的能力,又在往编排层探;Coze和Claude的Workflow,核心在编排层,已经开始长应用层的东西;腾讯最近推的一堆产品,更像在应用层直接布点。
三层结构摆在这儿,入口在哪一层,答案还没定。有人想从下往上打,用基础层通吃编排层和应用层;比如:OpenAI在做这件事,Anthropic也在做。
有人想从上往下打,用应用层倒逼模型能力,那些垂直领域的AI创业公司,走的是这条路;有人卡在中间,想用编排层收过路费,LangChain和国内的Agent框架创业者,赌的是这条。
03
我认为,编排层现在最热闹,也最危险。
Claude出了Code,能在终端里直接帮用户写代码、跑命令;OpenAI的Operator,可以直接操作电脑屏幕,点按钮、填表单。
这些能力以前要靠外面的编排层才能实现,现在被模型厂商一点点内化进去了。
Agent的进化史,就是脚手架不断被内化的历史。
推理模型出来,催生了第一批Agent产品;这些产品跑出了数据,数据训练了更强的模型;更强的模型把之前需要脚手架才能做到的事情,直接变成原生能力,然后又催生了新的脚手架需求,循环往复。
每一次进步,都在把编排层往模型底层吸。
The Information有个分析,直接点出这个问题:编排层会在18到24个月内被模型厂商吸收;OpenAI的Operator、Anthropic的Claude Code,都是模型厂商在收回编排权。
我查了一下,OpenClaw故事最能说明问题,它在编排层做到了极致,能让模型执行超长任务,业内口碑很好。结果呢?
爆火之后,Meta的扎克伯格和OpenAI的Altman同时向他抛出邀约;Steinberger选了OpenAI。他自己说得很直接:我想改变世界,不想建一家大公司,和OpenAI合作是最快实现这件事的方式。
2026年2月14日,他宣布加入OpenAI;OpenClaw项目移交基金会,OpenAI提供资金和技术支持。
对创业者来说,编排层要算一笔账:你在建一栋楼,还是给大楼搭脚手架?脚手架也能赚钱,但楼盖完,脚手架是要拆的。
真正的机会在应用层;a16z观察过,每次平台转型,人们都预测基础设施会捕获所有价值,但每次都错了。
PC时代,微软赢了操作系统,但Oracle、SAP、Salesforce在应用层捕获了巨大价值;移动时代,苹果和谷歌赢了平台层,但Uber、Airbnb、Instagram在应用层赚得盆满钵满。
基础设施的特点是薄利多销,靠规模赚钱;应用层特点是深挖场景,靠不可替代性赚钱。
但应用层的竞争逻辑,不是「做一个AI版的XX」,用户不傻,套壳产品留不住人;真正的机会是深度嵌入特定场景,建立只有在场景里才能积累的东西。
比如:
蚂蚁的阿福App,聚焦慢病管理和健康陪伴,2025年6月以AQ之名上线,12月升级更名,月活已经破了3000万,是目前国内最大的健康管理AI App。
慢病患者每天要监测、记录、咨询,谁会去通用对话框里输健康数据?数据在这里积累,壁垒也就慢慢形成了。
Bessemer Venture Partners分析过,高价值的垂直Agent有四个共同特征:
任务频率高、错误成本高、有专有数据积累、监管复杂性对通才形成壁垒。律师不能出错,医生不能乱说,病历数据不会流到通用对话框里;这些门槛,天然挡掉一批竞争对手。
这跟编排层的逻辑完全不同。
编排层拼技术整合能力,你今天编出一个好工作流,明天模型厂商可能就内化了;应用层拼场景理解,你在医院泡了三年,知道医生怎么说话、病历怎么流转、系统怎么对接,这些东西,模型厂商学不会,也内化不了。
选对场景,比做对产品更重要。离用户近一点,离钱近一点,离数据近一点,这三个「近」,是应用层能守住入口的根本原因。
04
三层结构摆清楚,很多事情就明白了,机会怎么抓,得看现在正在发生的几件事,大厂们已经开始各自押注了。
腾讯最近动作很密。
3月9日上线了WorkBuddy,完全兼容OpenClaw,能对接企业微信、、飞书、钉钉,内置了20多种技能包和MCP协议,还支持多窗口、多Agent并行工作。
国内版更方便,能无缝切换混元、DeepSeek、GLM、Kimi、MiniMax这些模型。
其实腾讯的思路很清晰:
元宝占日常对话,WorkBuddy占职场办公,QClaw占个人Agent,每个场景布一个点,底层共享模型能力。
三个产品的分工就清楚了:元宝是最轻的一层,谁都能用,聊天问答为主;WorkBuddy是桌面级的办公工作台,替你处理文件、做报表、写文案;QClaw是通过微信触发的个人调度入口。
我认为,鹅厂用这套打法,找到了给模型装上手和脚的形态;但这套打法有一个隐患,它的根基是企业微信的渗透率。
企业微信在大元宝 混元 Hunyuan 教程厂和互联网公司里用得很深,但在制造业、医疗、政府这些场景里,钉钉和飞书的份额并不小,腾讯把入口嵌进工作流,可工作流本身不全在腾讯手里,值得思考,如何解决,我还没找到答案。
Claude走另一条路。
3月9日它推出了Code Review工具,用多智能体并行审查代码漏洞,单次费用15到25美元,Uber、Salesforce、Accenture已经在用了。
Anthropic的产品负责人Cat Wu在接受TechCrunch采访时说,现在企业领导反复问的一个问题是:Claude Code提交了这么多Pull Request,怎么保证它们能被高效审查?
Anthropic一直强调,自己不是取代SaaS公司,要提供基础设施,让合作伙伴把自身的业务知识带进来。
简单说,Claude做基座,保持一个简洁的入口,第三方开发者进来开店卖Bot,Claude收模型调用费;自己不碰垂直场景,让市场去填。
这套打法,很像苹果App Store,平台抽成,生态繁荣。
它有一个前提,第三方开发者得愿意留在Claude的生态里。现在模型的切换成本太低了,今天在Claude上开店的Bot,明天接入GPT或者Gemini,一点都不难。
Anthropic能不能把开发者锁住,关键看两点:Claude的模型能力能不能持续领先,还有调用费够不够便宜。
最后看小米,路子又不一样。
3月6日,Xiaomi miclaw开启封测,这是国内首个手机端系统级Agent应用,基于MiMo大模型,能直接操作手机系统,调用50多个系统级工具,不过目前只支持小米17系列。
小米技术团队说得很清楚:这是探索模型从「对话能力」向「系统级执行能力」的落地路径。
小米这条路在三种打法里壁垒最高,也最难复制;它需要同时拥有手机硬件、操作系统权限和自研大模型,缺一不可。
但它现在的问题同样明显,仅支持小米17系列,意味着入口还锁在几百万台设备里,离真正的规模化还很远;能不能下放到更多机型,以及MiMo的模型能力能不能跟上任务复杂度的要求,是这条路能不能走通的两个关键。
把三种打法放在一起看,本质是三种不同的押注:
腾讯押社交和办公的生态黏性,Claude押模型能力的持续领先,小米押硬件和系统权限的物理壁垒。
但它们最终指向的是同一个终局:
未来你打开手机,豆包、元宝、文心、千问也罢,你说要写合同,它就自动调用法律Bot;你说要做PPT,它就调用设计Bot。
这些Bot,可能来自Claude的Marketplace,也可能来自任何一家的生态;说到底,谁能帮用户把事办成,谁就是入口,不管中间长什么样,藏在哪一层。
2026年2月,Anthropic以商标问题起诉,逼迫OpenClaw改名;一个月后,Anthropic自己的产品Claude Code,成了企业里最热的Agent入口。
腾讯没输,软硬一体的小米刚上桌;模型够聪明已经是门槛了,这一轮入口之争,赢在谁先把调度做到用户感知不到的程度。
参考来源:
Peter Steinberger个人博客(2026年2月);腾讯云、Anthropic官方发布(2026年3月);马化腾朋友圈(2026年3月)
a16z Top 100 Gen AI Consumer Apps(2025年12月);Bessemer Venture Partners Vertical AI Playbook(2026年1月);蚂蚁集团CEO韩歆毅全员信(2026年1月).

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/274060.html原文链接:https://javaforall.net
