斗胆聊聊小马哥在AI入口上押了什么？

斗胆聊聊小马哥在AI入口上押了什么？
文：王智远 | ID:Z

3月7日凌晨，小马哥睡不着。

转发了腾讯云的活动消息，朋友圈只留了一句：没有想到会这么火；三天后早上7点12分，他又发了条朋友圈，扯了一堆产品。

一个管着几万人公司的人，连着两次在凌晨、清早发朋友圈聊同一件事，说明这件事真的让他睡不踏实。

前年文心、去年豆包、今年突然冒出来一堆能做PPT能编工作流的「空间」；有人说入口在对话框，有人说入口在工具箱，还有人说未来根本没有入口。

我把最近看到的碎片拼了拼，发现事情没那么简单。

01

往回看，入口位置一直在变；第一阶段：模型即产品，对话框即入口。

文心一言出来时，界面一个框；你打字，它回答；后来元宝、豆包、Kimi，长得都差不多，都是对话框套一个大模型。谁家模型强，用户就去谁家。入口是对话框，模型本身是核心。

这个状态没持续太久，因为光聊天解决不了复杂事。

比如：做个PPT，对话框顶多给你个文字大纲，剩下排版、配图，还得你自己动手；分析一份财报，它只给你个结论，中间怎么算的、怎么推理的，你看不见，也没法调整。

用户开始不满足了，第二阶段悄悄冒头；Coze出来时，已经不像个聊天工具了。

依然有对话框，但旁边多了好多东西：技能、插件、工作流。可以把一堆能力拖拽到一起，编一套流程，先搜索行业报告，再提取数据，再生成图表，最后排版成PPT，编好以后存起来，下次一键运行。

Claude很快，出了Workflow；GPT那边也上了GPTs，让用户定制专属工具，连专注编程的Claude Code，也开始往工作流的方向靠。

这个变化背后的驱动力很朴素：用户要把事办成。

商业上也有考量，纯聊天产品很难收费，用户习惯了免费；工具箱可以，一套好用的工作流，用户愿意付费，Coze的会员、GPTs的内购，都是这个逻辑。

所以，第一阶段「你有什么问题，我来答」；第二阶段是「你有什么事，我帮你做」，入口从一个点，变成了一张网。

直到最近，Claude开了Marketplace，腾讯一口气推了好几个名字不同的产品；这些新动作指向的方向，比工具箱本身更有意思。

02

智远看来，AI入口产品已经演化成三个层级；第一层叫基础层，模型加算力。

OpenAI、Anthropic、Google、Meta，都在这一层打架；国内能上牌桌的，也就字节、腾讯、阿里、百度，再加上几家融资能力强的创业公司。

这一层特点是烧钱、拼规模、拼技术储备；过去两年，百万token的成本掉了90%以上，开源模型也追得越来越近。

就说Kimi，用旗舰模型八分之一的价格，跑出了差不多的效果。这说明，基础层正在快速变成水电煤，谁都能用，但谁都很难靠这个赚钱。

这不是创业公司该待的地方，想在这里活下来，得每年烧几十亿美金，得养几百个博士，得跟英伟达抢显卡。

第二层叫编排层。

让AI学会规划任务、调用工具、记住上下文、协调多个子任务；LangChain、LlamaIndex、各种Agent框架都在这一层，Coze工作流、Claude的Workflow、GPT的技能插件，也属于这一层。

这一层现在最热闹，创业公司扎堆，资本往里面冲，都觉得找到了大厂没顾上的缝隙。

第三层叫应用层。

垂直工作流加用户关系；一个专门给律所做的合同审查Bot，一个给医生用的病历整理助手，都落在这一层，这一层离用户最近，离钱也最近。

把上面产品往里放，位置就清楚了。

文心一言、元宝、豆包，千问、既有基础层的能力，又在往编排层探；Coze和Claude的Workflow，核心在编排层，已经开始长应用层的东西；腾讯最近推的一堆产品，更像在应用层直接布点。

三层结构摆在这儿，入口在哪一层，答案还没定。有人想从下往上打，用基础层通吃编排层和应用层；比如：OpenAI在做这件事，Anthropic也在做。

有人想从上往下打，用应用层倒逼模型能力，那些垂直领域的AI创业公司，走的是这条路；有人卡在中间，想用编排层收过路费，LangChain和国内的Agent框架创业者，赌的是这条。

03

我认为，编排层现在最热闹，也最危险。

Claude出了Code，能在终端里直接帮用户写代码、跑命令；OpenAI的Operator，可以直接操作电脑屏幕，点按钮、填表单。

这些能力以前要靠外面的编排层才能实现，现在被模型厂商一点点内化进去了。

Agent的进化史，就是脚手架不断被内化的历史。

推理模型出来，催生了第一批Agent产品；这些产品跑出了数据，数据训练了更强的模型；更强的模型把之前需要脚手架才能做到的事情，直接变成原生能力，然后又催生了新的脚手架需求，循环往复。

每一次进步，都在把编排层往模型底层吸。

The Information有个分析，直接点出这个问题：编排层会在18到24个月内被模型厂商吸收；OpenAI的Operator、Anthropic的Claude Code，都是模型厂商在收回编排权。

我查了一下，OpenClaw故事最能说明问题，它在编排层做到了极致，能让模型执行超长任务，业内口碑很好。结果呢？

爆火之后，Meta的扎克伯格和OpenAI的Altman同时向他抛出邀约；Steinberger选了OpenAI。他自己说得很直接：我想改变世界，不想建一家大公司，和OpenAI合作是最快实现这件事的方式。

2026年2月14日，他宣布加入OpenAI；OpenClaw项目移交基金会，OpenAI提供资金和技术支持。

对创业者来说，编排层要算一笔账：你在建一栋楼，还是给大楼搭脚手架？脚手架也能赚钱，但楼盖完，脚手架是要拆的。

真正的机会在应用层；a16z观察过，每次平台转型，人们都预测基础设施会捕获所有价值，但每次都错了。

PC时代，微软赢了操作系统，但Oracle、SAP、Salesforce在应用层捕获了巨大价值；移动时代，苹果和谷歌赢了平台层，但Uber、Airbnb、Instagram在应用层赚得盆满钵满。

基础设施的特点是薄利多销，靠规模赚钱；应用层特点是深挖场景，靠不可替代性赚钱。

但应用层的竞争逻辑，不是「做一个AI版的XX」，用户不傻，套壳产品留不住人；真正的机会是深度嵌入特定场景，建立只有在场景里才能积累的东西。

比如：

蚂蚁的阿福App，聚焦慢病管理和健康陪伴，2025年6月以AQ之名上线，12月升级更名，月活已经破了3000万，是目前国内最大的健康管理AI App。

慢病患者每天要监测、记录、咨询，谁会去通用对话框里输健康数据？数据在这里积累，壁垒也就慢慢形成了。

Bessemer Venture Partners分析过，高价值的垂直Agent有四个共同特征：

任务频率高、错误成本高、有专有数据积累、监管复杂性对通才形成壁垒。律师不能出错，医生不能乱说，病历数据不会流到通用对话框里；这些门槛，天然挡掉一批竞争对手。

这跟编排层的逻辑完全不同。

编排层拼技术整合能力，你今天编出一个好工作流，明天模型厂商可能就内化了；应用层拼场景理解，你在医院泡了三年，知道医生怎么说话、病历怎么流转、系统怎么对接，这些东西，模型厂商学不会，也内化不了。

选对场景，比做对产品更重要。离用户近一点，离钱近一点，离数据近一点，这三个「近」，是应用层能守住入口的根本原因。

04

三层结构摆清楚，很多事情就明白了，机会怎么抓，得看现在正在发生的几件事，大厂们已经开始各自押注了。

腾讯最近动作很密。

3月9日上线了WorkBuddy，完全兼容OpenClaw，能对接企业微信、、飞书、钉钉，内置了20多种技能包和MCP协议，还支持多窗口、多Agent并行工作。

国内版更方便，能无缝切换混元、DeepSeek、GLM、Kimi、MiniMax这些模型。

其实腾讯的思路很清晰：

元宝占日常对话，WorkBuddy占职场办公，QClaw占个人Agent，每个场景布一个点，底层共享模型能力。

三个产品的分工就清楚了：元宝是最轻的一层，谁都能用，聊天问答为主；WorkBuddy是桌面级的办公工作台，替你处理文件、做报表、写文案；QClaw是通过微信触发的个人调度入口。

我认为，鹅厂用这套打法，找到了给模型装上手和脚的形态；但这套打法有一个隐患，它的根基是企业微信的渗透率。

企业微信在大元宝混元 Hunyuan 教程厂和互联网公司里用得很深，但在制造业、医疗、政府这些场景里，钉钉和飞书的份额并不小，腾讯把入口嵌进工作流，可工作流本身不全在腾讯手里，值得思考，如何解决，我还没找到答案。

Claude走另一条路。

3月9日它推出了Code Review工具，用多智能体并行审查代码漏洞，单次费用15到25美元，Uber、Salesforce、Accenture已经在用了。

Anthropic的产品负责人Cat Wu在接受TechCrunch采访时说，现在企业领导反复问的一个问题是：Claude Code提交了这么多Pull Request，怎么保证它们能被高效审查？

Anthropic一直强调，自己不是取代SaaS公司，要提供基础设施，让合作伙伴把自身的业务知识带进来。

简单说，Claude做基座，保持一个简洁的入口，第三方开发者进来开店卖Bot，Claude收模型调用费；自己不碰垂直场景，让市场去填。

这套打法，很像苹果App Store，平台抽成，生态繁荣。

它有一个前提，第三方开发者得愿意留在Claude的生态里。现在模型的切换成本太低了，今天在Claude上开店的Bot，明天接入GPT或者Gemini，一点都不难。

Anthropic能不能把开发者锁住，关键看两点：Claude的模型能力能不能持续领先，还有调用费够不够便宜。

最后看小米，路子又不一样。

3月6日，Xiaomi miclaw开启封测，这是国内首个手机端系统级Agent应用，基于MiMo大模型，能直接操作手机系统，调用50多个系统级工具，不过目前只支持小米17系列。

小米技术团队说得很清楚：这是探索模型从「对话能力」向「系统级执行能力」的落地路径。

小米这条路在三种打法里壁垒最高，也最难复制；它需要同时拥有手机硬件、操作系统权限和自研大模型，缺一不可。

但它现在的问题同样明显，仅支持小米17系列，意味着入口还锁在几百万台设备里，离真正的规模化还很远；能不能下放到更多机型，以及MiMo的模型能力能不能跟上任务复杂度的要求，是这条路能不能走通的两个关键。

把三种打法放在一起看，本质是三种不同的押注：

腾讯押社交和办公的生态黏性，Claude押模型能力的持续领先，小米押硬件和系统权限的物理壁垒。

但它们最终指向的是同一个终局：

未来你打开手机，豆包、元宝、文心、千问也罢，你说要写合同，它就自动调用法律Bot；你说要做PPT，它就调用设计Bot。

这些Bot，可能来自Claude的Marketplace，也可能来自任何一家的生态；说到底，谁能帮用户把事办成，谁就是入口，不管中间长什么样，藏在哪一层。

2026年2月，Anthropic以商标问题起诉，逼迫OpenClaw改名；一个月后，Anthropic自己的产品Claude Code，成了企业里最热的Agent入口。

腾讯没输，软硬一体的小米刚上桌；模型够聪明已经是门槛了，这一轮入口之争，赢在谁先把调度做到用户感知不到的程度。

参考来源：

Peter Steinberger个人博客（2026年2月）；腾讯云、Anthropic官方发布（2026年3月）；马化腾朋友圈（2026年3月）

a16z Top 100 Gen AI Consumer Apps（2025年12月）；Bessemer Venture Partners Vertical AI Playbook（2026年1月）；蚂蚁集团CEO韩歆毅全员信（2026年1月）.

斗胆聊聊小马哥在AI入口上押了什么？

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/274060.html原文链接：https://javaforall.net

斗胆聊聊小马哥在AI入口上押了什么？

01

02

03

04

关于作者

全栈程序员-站长

相关推荐

HAI – 腾讯混元3D模型一键部署

腾讯应用宝怎么设置手柄

腾讯元宝ai帮写教程

原创多亏OpenClaw，AI行业找到了自己的“移动梦网”

腾讯混元发布多模态理解模型混元Large-Vision

腾讯元宝支持API调用吗？