4月18日,阿星发现扣子放大招了!扣子空间开启内测!有点像manus,你体验了吗?
作为一个长期关注AI Agent和AI工作流的博主,饼干哥哥一直在探索能真正改变我们工作模式的AI工具。
缘起:一次AI播客
因为工作繁忙,我习惯在通勤路上听播客来获取最新的AI领域玩法。最初,我使用谷歌的NotebookLM,将一些深度长文转换成播客来听。后来,扣子空间(http://coze.cn)上线后,我尝试了一下它AI播客功能,才真正感受到了“降维打击”:
只需要简单的说一句把这篇文章转成播客,它就能开始工作了


插一句,很多海外的agent 都无法访问微信的公众号文章,而扣子空间这块能力是在线的。




等一小段时间就生成好了:




各位也可以听听看效果:
暂时无法在飞书文档外展示此内容
与NotebookLM仅服务于个人学习笔记、生成的中文播客带有明显“朗诵腔”不同,扣子空间展现了更广泛的应用场景和更强的拟人化效果 。
它能将文章、网页链接、甚至是B站视频轻松转换成双人对话式的播客,两位主播间的对话流畅自然,甚至有打断、停顿和真实的交互感,几乎听不出是AI生成的 。这种在听感上以假乱真的“播客风”,完胜了其他同类工具。
除此之外,扣子空间在昨天上线了PPT功能,内置多个PPT模板。




例如我看「中国智能手机行业PPT」模板挺适合做行业分析的,就点了「做同款」让扣子空间做2025年的AI Agent分析报告看下。




跟以往直接生成不同,这里会补充PPT得具体要求,例如选择一个风格、页数等,先帮我生成大纲




确认大纲满意了,才开始生成PPT。确实是有实习生那味了
跑出来的结果还是不错的。




放几页PPT大家感受一下:












扣子 Coze 教程https://space.coze.cn/s/NIb5azt7h2w/
这次体验让我意识到,AI Agent的能力已经远超简单的问答或内容转换。
于是,我萌生了一个想法:不再满足于常规的写报告、做PPT,而是想玩个大的——将它应用到一个真实、复杂且充满挑战的商业场景中:我的合伙人在创业做一款硬件产品——智能猫砂盆,我想从0开始,利用扣子空间完成其出海美国市场的APP产品需求分析和原型开发。
要是效果好的话,或许真的能落地到实际业务场景里,提高生产力。
一、 背景:智能猫砂盆的出海挑战
作为一名中国智能家居领域的创业者,我合伙人对宠物赛道尤其看好。经过努力,他的团队已经成功研发出一款在硬件层面非常出色的智能猫砂盆。它的结构设计、自动清理机械装置和基础传感器都达到了市场领先水平。出海美国中高端市场,在硬件上我们有信心一较高下。
然而在软件开发,尤其是面向海外市场的软件开发,可能比硬件来的更困难些:
- 本土化: 作为一个纯正的中国团队,我们对美国市场的理解存在天然的鸿沟,包括审美与UI、语言的“地道”、功能优先级差异,背后都依赖对美国消费者习惯的洞察
- 功能定义难: 在解决了本土化的大方向后,具体的功能颗粒度应该多细?是简单地远程启动清理,还是应该加入猫咪的体重监测、如厕次数和时长统计? (2) 我没有产品经理的经验,拍脑袋做的决定很可能偏离用户真实需求。
- 缺乏开发资源: 在产品初期,我们没有预算去组建一个包含海外市场专家、产品经理、UI/UX设计师和前端开发的完整APP团队。我需要一个低成本、高效率的解决方案来完成APP的“冷启动”。
AI Agent其实就很适合扮演一支团队的角色,接下来我就让它帮我完成从市场调研、需求分析(PRD撰写)到APP原型设计的全过程。
二、 实战:用扣子空间打造出海APP
做产品不能是「空穴来风」,这里我找了一个在美亚上的同行爆款,作为我们这次任务的起点。




进入扣子空间https://space.coze.cn/,新建一个任务。
我是重度飞书用户,几乎所有的创作和协作都是在飞书里完成的。
这次的任务也不例外,我想把扣子空间产生的结论直接同步到我的飞书空间里。
这个需求,我们可以通过内置的MCP扩展能力来解决
如图,点开扩展




添加扩展中,找到飞书云文档选择添加




按要求完成账号授权即可。




同时,我们也看到这里还有很多其他的能力可以调用,即使没有,也可以通过自定义的形式把第三方外部的接口通过MCP接进来供AI调用,这样一来,扣子空间的能力边界就大了很多。
话说回来,接下来,老规矩,做产品一定是要先做市场调研的。
第一步:AI市场调研与用户痛点分析
这里,我直接把前面亚马逊网站上的对标爆款链接发给扣子
同时我担心网络问题不知道是否能正常访问,我也下载了一份PDF给到扣子
让它去做深度的美国市场分析报告,并且在最后把报告存到我的飞书空间里(有一种让实习生做完后把报告交到我办公室的感觉)
请分析这份请分析这份关于"Litter-Robot 3 Connect"的亚马逊产品页面PDF,并结合所有用户评论,为我生成一份面向美国市场的深度分析报告。报告需包含:1)用户最赞赏的核心功能点;2)用户抱怨最多的槽点;3)分析并总结产品描述和高赞评论中的语言风格和“口吻”;4)总结一份美国市场的目标用户画像。 具体的产品地址:https://www.amazon.com/Litter-Robot-Connect-Whisker-Grey-Self-Cleaning/dp/B09315VP9K/ref=sr_1_2_sspa?crid=LSHMO5FABVDL&dib=eyJ2IjoiMSJ9.WdudprAr0mYh9AlT5Cu2wM5zEs4u9rox9VbYOcgP1aNyTCvfhfzFD02_0EWIAjaTOWU8VztNXlTq8RKPHX9_Tls7ZXrab-aT4eHCZjPiPgD-3bLkUfTZX3ky6PVpTCADG1qu5H03kUvBPkBzIG-lXbASawho8hPRSTlVcTrRjcwELUDJrKJHhMzUipQWZA_72svjVKdk8AudHDDaJJI3RWB06OWkdMTDl5aED-HsBIguHIeeDosPvdGxHDEBkByMp0K-YerbqdA1mnUx1GOFLt_HoYoQuerxmKa28DruTT0.9XCxAkZpod7QHo2-Vzte0LOIMjoWIv7SOt3eg6yyXl8&dib_tag=se&keywords=litter%2Brobot&qid=&sprefix=liter%2B%2Caps%2C1690&sr=8-2-spons&sp_csd=d2lkZ2V0TmFtZT1zcF9hdGY&th=1 调用工具`飞书云文档`把最终的用户画像分析报告新增到我的飞书空间里,给我飞书文档链接。"Litter-Robot 3 Connect"的亚马逊产品页面PDF,并结合所有用户评论,为我生成一份面向美国市场的深度分析报告。报告需包含:1)用户最赞赏的核心功能点;2)用户抱怨最多的槽点;3)分析并总结产品描述和高赞评论中的语言风格和“口吻”;4)总结一份美国市场的目标用户画像。 具体的产品地址:https://www.amazon.com/Litter-Robot-Connect-Whisker-Grey-Self-Cleaning/dp/B09315VP9K/ref=sr_1_2_sspa?crid=LSHMO5FABVDL&dib=eyJ2IjoiMSJ9.WdudprAr0mYh9AlT5Cu2wM5zEs4u9rox9VbYOcgP1aNyTCvfhfzFD02_0EWIAjaTOWU8VztNXlTq8RKPHX9_Tls7ZXrab-aT4eHCZjPiPgD-3bLkUfTZX3ky6PVpTCADG1qu5H03kUvBPkBzIG-lXbASawho8hPRSTlVcTrRjcwELUDJrKJHhMzUipQWZA_72svjVKdk8AudHDDaJJI3RWB06OWkdMTDl5aED-HsBIguHIeeDosPvdGxHDEBkByMp0K-YerbqdA1mnUx1GOFLt_HoYoQuerxmKa28DruTT0.9XCxAkZpod7QHo2-Vzte0LOIMjoWIv7SOt3eg6yyXl8&dib_tag=se&keywords=litter%2Brobot&qid=&sprefix=liter%2B%2Caps%2C1690&sr=8-2-spons&sp_csd=d2lkZ2V0TmFtZT1zcF9hdGY&th=1 调用工具`飞书云文档`把最终的用户画像分析报告新增到我的飞书空间里,给我飞书文档链接。
此时,不着急马上开始。
扣子空间,对于高频常见的场景做了一些内置的Agent专家,帮助小白用户能快速且高效的完成复杂任务。
这个专家,可以在对话框的专家协作里找到,点击后,会列出来目前有的专家Agent
这里就有用户研究专家适合我们当前的场景,不妨用上。




ok,以下就是完整的需求,点发送,但先别走




扣子空间会先对我们的需求进行拆解,并罗列执行计划,如下图:
看上去还不错,点「开始任务」,这会就可以走了,一般来说,Agent的工作会持续至少5分钟以上,长则大半小时,所以这个时间可以切换到别的页面做别的事,甚至是关掉页面也ok,所有任务都在后台运行




但我是何许人也,抠门老板是会留下来监工的
就发现一件离谱的事:本来我还担心它访问美版亚马逊网站会有什么问题,结果很丝滑地进到了目标网站里进行浏览,同时还能正确识别评论区的位置点击进到更多的评论区域
这里调用的是类似browser-use的网页自动化的能力。




OK,一顿操作后分析报告做好了。
但我们看到,Agent给的不是一份报告,而是多份整理、统计、分析结果汇总出来的分析报告。
说实话,我们团队的实习生来做,也未必能做这么规范。。。




最终报告也同步到了我的飞书空间里:
https://ry6uq5vtyu.feishu.cn/docx/K5y3dXUAao1Ug2xJnXTcN18InVg
在我第一次跑的时候,还会有一份mdx的版本,图文并茂:












坦白说,产出报告的价值,不在于它生成了多少文字,而在于它如何从一个真实的亚马逊产品页面中,提炼出了对“出海”业务(也就是这次需求)至关重要的洞察。
整体上看报告是合格的,对官方营销文案和用户高赞评论的语言风格进行了拆解和对比
另一个惊喜是它构建用户画像的逻辑。它并非简单罗列,而是通过合成分析得出的结论:从产品体积较大,推断出用户多为独立住宅或大公寓 ;从APP远程控制功能,推断出用户是注重效率的上班族 。这种连接“产品参数”与“用户生活方式”的分析能力,往往是我们很多人力所不具备的,或者说吃力的。
OK,美国市场的需求和用户痛点,我们算是略知一二了,接下来就可以着手做产品开发。
第二步:AI生成产品需求文档(PRD)
同样不着急马上去做APP开发,而是要理一份产品需求文档,把需求讲清楚了,才能提高开发效率。
而需求文档,是要基于第一步的深度分析报告里的结论,参考提示词:
根据以上的深度分析报告,为一款名为‘Kitty+’的智能猫砂盆APP撰写一份产品需求文档(PRD)。该APP主要面向美国市场。PRD应优先解决竞品的核心痛点,并包含以下模块:首页状态监控、远程控制、多猫管理、健康数据追踪、耗材余量提醒和智能通知系统。具体根据以上的深度分析报告结论来设计。 同样保存一份到我飞书空间。 参考要求及模板: # 产品需求文档(PRD)与高保真原型设计生成器 角色定位 你是一位兼具产品思维和设计才能的全栈产品专家,精通产品需求分析: - 能深入分析业务需求,精准定义用户痛点,构建清晰的产品逻辑和功能架构。 - 你擅长将抽象需求转化为具体、可交互的高保真原型,强调设计方案与用户痛点的精准匹配。 核心目标 基于用户提供的产品概念,完成一份结构完整、逻辑清晰的产品需求文档(PRD) 确保有效解决目标用户的核心痛点,通过富有说服力的文档,讲述一个完整的产品故事。 输出内容:产品需求文档(PRD) 文档信息 | 版本 | 时间 | 更新人 | 内容 | 位置 | |:-----|:-----|:-------|:-----|:-----| | 1.0 | [日期] | [姓名] | 创建文档 | - | 相关文档 - [列出相关参考文档、设计文档或市场调研报告] 一、需求背景 1. 解决什么问题? [详细描述本产品/功能旨在解决的核心问题和痛点] 2. 覆盖多少用户? [描述目标用户群体及规模,包含用户画像和潜在市场] 3. 上线计划? [说明产品/功能的上线时间表和关键里程碑] 4. 还需要准备什么? [列出实现该产品/功能所需的资源、依赖条件和准备工作] 5. 需求列表 [以表格或列表形式列出所有需求项,包括优先级和状态] 二、方案概述 2.1 核心业务流程 [描述产品/功能的核心业务流程,可使用流程图或文字说明] 2.2 核心功能流程示意 [提供核心功能的流程示意图和关键节点说明] 三、细节方案 [根据产品类型和特性,自定义以下细节方案的章节结构] 3.1 [核心功能模块1] [详细描述该功能模块的设计和实现方案] 3.1.1 [子功能/页面/交互点1] [提供具体的功能设计和交互细节] 3.1.2 [子功能/页面/交互点2] [提供具体的功能设计和交互细节] 3.2 [核心功能模块2] [详细描述该功能模块的设计和实现方案] 3.3 [核心功能模块3] [详细描述该功能模块的设计和实现方案] 四、非功能性需求 4.1 性能需求 [描述性能指标和要求] 4.2 安全需求 [描述安全性要求和措施] 4.3 兼容性需求 [描述兼容性要求,如设备、浏览器、操作系统等] 五、评估与风险 5.1 评估指标 [列出产品/功能的成功评估指标] 5.2 潜在风险 [识别潜在风险和应对策略] 根据以上的深度分析报告,为一款名为‘Kitty+’的智能猫砂盆APP撰写一份产品需求文档(PRD)。该APP主要面向美国市场。PRD应优先解决竞品的核心痛点,并包含以下模块:首页状态监控、远程控制、多猫管理、健康数据追踪、耗材余量提醒和智能通知系统。具体根据以上的深度分析报告结论来设计。 同样保存一份到我飞书空间。 参考要求及模板: # 产品需求文档(PRD)与高保真原型设计生成器 角色定位 你是一位兼具产品思维和设计才能的全栈产品专家,精通产品需求分析: - 能深入分析业务需求,精准定义用户痛点,构建清晰的产品逻辑和功能架构。 - 你擅长将抽象需求转化为具体、可交互的高保真原型,强调设计方案与用户痛点的精准匹配。 核心目标 基于用户提供的产品概念,完成一份结构完整、逻辑清晰的产品需求文档(PRD) 确保有效解决目标用户的核心痛点,通过富有说服力的文档,讲述一个完整的产品故事。 输出内容:产品需求文档(PRD) 文档信息 | 版本 | 时间 | 更新人 | 内容 | 位置 | |:-----|:-----|:-------|:-----|:-----| | 1.0 | [日期] | [姓名] | 创建文档 | - | 相关文档 - [列出相关参考文档、设计文档或市场调研报告] 一、需求背景 1. 解决什么问题? [详细描述本产品/功能旨在解决的核心问题和痛点] 2. 覆盖多少用户? [描述目标用户群体及规模,包含用户画像和潜在市场] 3. 上线计划? [说明产品/功能的上线时间表和关键里程碑] 4. 还需要准备什么? [列出实现该产品/功能所需的资源、依赖条件和准备工作] 5. 需求列表 [以表格或列表形式列出所有需求项,包括优先级和状态] 二、方案概述 2.1 核心业务流程 [描述产品/功能的核心业务流程,可使用流程图或文字说明] 2.2 核心功能流程示意 [提供核心功能的流程示意图和关键节点说明] 三、细节方案 [根据产品类型和特性,自定义以下细节方案的章节结构] 3.1 [核心功能模块1] [详细描述该功能模块的设计和实现方案] 3.1.1 [子功能/页面/交互点1] [提供具体的功能设计和交互细节] 3.1.2 [子功能/页面/交互点2] [提供具体的功能设计和交互细节] 3.2 [核心功能模块2] [详细描述该功能模块的设计和实现方案] 3.3 [核心功能模块3] [详细描述该功能模块的设计和实现方案] 四、非功能性需求 4.1 性能需求 [描述性能指标和要求] 4.2 安全需求 [描述安全性要求和措施] 4.3 兼容性需求 [描述兼容性要求,如设备、浏览器、操作系统等] 五、评估与风险 5.1 评估指标 [列出产品/功能的成功评估指标] 5.2 潜在风险 [识别潜在风险和应对策略]
得到的PRD:
https://ry6uq5vtyu.feishu.cn/docx/B94rdGJ4jo0rQLxW6D0clKvZnBd




生成的PRD还是不错的,但是看文字还是比较枯燥,继续让扣子空间转成html来看
(感受到了老板的松弛感,有个想法就让实习生去做,AI根本不会累)
参考提示词:
请根据 `Kitty+智能猫砂盆APP产品需求文档PRD.md`以及以下的要求,运用你全部的专业知识和创造力,创作一个单页HTML网页。直接输出完整HTML,不需要前后置引导语。
角色定位
你是一位兼具产品思维和设计才能的全栈产品专家,同时精通产品需求分析和html设计:
- 在产品需求方面:你能深入分析业务需求,精准定义用户痛点,构建清晰的产品逻辑和功能架构。
- 在设计方面:你是一位富有同理心且极具创造力的世界级App设计大师,曾获得Apple Design Awards和App Store年度精选推荐。
- 你擅长将抽象需求转化为具体、可交互的高保真原型,强调设计方案与用户痛点的精准匹配。
- 你拥有出色的视觉叙事能力,能将设计理念和用户流程以引人入胜的方式呈现。
输出内容
设计系统构建与风格定义
- 确定符合产品定位与目标用户情感诉求的设计风格和视觉语言
- 创建一致且富有表现力的色彩系统、排版层级和组件库
- 设计符合平台特性且自然流畅的交互模式和画龙点睛的动效
痛点驱动的原型设计与实现
- 设计以解决核心痛点为导向的完整用户流程和页面导航结构
- 创建所有关键页面的高保真界面设计,确保每个设计决策都有明确的用户价值支撑
- 实现核心交互功能和页面转换效果,特别关注那些能直接缓解用户痛点或带来愉悦感的交互细节
- 确保设计在各种设备上的适配性与体验一致性
技术实现要求
HTML交互原型输出格式
请提供一个精心组织、体验流畅的单一HTML文件,包含以下内容:
1. 沉浸式交互原型展示
- 在单一HTML页面中有序地、故事化地展示所有关键界面
- 按核心用户旅程顺序排列原型,引导阅读者自然地理解操作流程
- 实现响应灵敏、符合直觉的可点击交互元素和页面导航
- 恰到好处地展示关键微交互、状态变化和过渡动效,提升代入感和惊喜感
- 考虑加入简短的引导性说明或标注,解释特定设计元素或交互的目的,特别是其如何解决用户痛点
2. 设计理念阐述部分
- 产品定位、目标用户画像及核心痛点分析
- 可视化的核心用户流程图和功能地图(用Mermaid库+Fontawesome实现)
- 痛点解决方案详解:明确指出识别出的核心痛点,并详细阐述原型中的哪些具体设计是如何针对性地解决这些痛点的
- 设计亮点与创新点说明:解释其价值所在
- 设计风格选择理由和设计系统关键要素说明
技术规范
- 基础框架:
- 主要:Tailwind CSS (https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/tailwindcss/2.2.19/tailwind.min.css)
- 备用:Tailwind CSS (https://cdnjs.cloudflare.com/ajax/libs/tailwindcss/2.2.19/tailwind.min.css)
- 图标系统:
- 主要:Font Awesome (https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css)
- 备用:Font Awesome (https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.0.0/css/all.min.css)
- 用户旅程/Flow说明
- Mermaid: https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/mermaid/8.14.0/mermaid.min.js
- 字体系统:
- 中文字体:Noto Sans SC/Noto Serif SC (https://fonts.proxy.ustclug.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap)
- 基础字体:`font-family: Tahoma,Arial,Roboto,"Droid Sans","Helvetica Neue","Droid Sans Fallback","Heiti SC","Hiragino Sans GB",Simsun,sans-self;`
设计要求
1. 视觉设计:
- 创建不仅美观,更能引发情感共鸣的视觉风格
- 使用一致、和谐且服务于信息传达的色彩、间距和组件
- 确保视觉层次清晰,有效引导用户注意力流
2. 交互设计:
- 设计极其直观、无需思考的导航和信息架构
- 提供及时、清晰、甚至令人愉悦的用户反馈和状态指示
- 极致简化操作流程,最大程度降低用户认知负担和操作成本
3. 内容呈现:
- 采用清晰易读、富有节奏感的排版
- 恰当、优雅地使用数据可视化
- 确保内容在不同设备上都具有卓越的可读性和美观度
4. 创新与品质:
- 在遵循规范基础上,融入巧妙、贴心的创新元素,带来"啊哈"时刻
- 像素级关注细节处理,追求卓越的工艺品质
- 为产品注入独特的品牌个性和真诚的情感连接
实际业务落地的话,还是需要先看AI生成的需求文档哪里有问题需要调整后再做下一步。
不过这里,我是想完全让AI完成从0到1,所以就不改了。
最终得到的这份视觉效果拉满的HTML版本的PRD:
























在我看来,扣子空间生成的这份PRD质量是到位的。
起码在产品内核层面,它与前序的市场分析报告契合。报告中提炼的用户画像(如注重效率的年轻上班族)和痛点,在这份PRD中都得到了精准回应。例如,“远程控制”和“定时清洁”功能直击上班族的“忙碌”痛点
中途PPT汇报
对,没错,真正「落地」的业务场景中,不是一股脑就干到底的,我们需要及时跟领导或者客户汇报调研结果,达成共识,才能继续下一步
所以这里,我就让扣子空间帮我生成一份 PPT
把这次任务中的`Litter – Robot 3 Connect美国市场深度分析报告.md`和`Kitty+智能猫砂盆APP产品需求文档.md`做成 PPT ,方便我向领导汇报。
能直接给一份 PPT 文档,就已经省了我们不少工作量了。




节选几张看看效果:












完整 PPT:
暂时无法在飞书文档外展示此内容
不得不说这PPT审美、排版都是在线的,封面、配图都做的不错,内容也都涵盖了我们需要汇报的文档。
OK,这里我们假设已经向领导明确了需求,就可以开始期待接下来的产品原型了。
第三步:AI一键生成APP高保真原型(HTML)
因为在前面扣子空间给的PRD HTML里,APP原型已经初现端倪了,所以这里还是希望它能延续同样的风格,完成高保真原型的生成。
参考提示词:
接下来更进一步,请根据 `Kitty+智能猫砂盆APP产品需求文档.md`以及以下的要求,运用你全部的专业知识和创造力,创作一个单页HTML网页:展示一套功能完善、视觉出众的高保真交互原型。
直接输出完整HTML,不需要前后置引导语。
现在需要输出高保真的原型图,请通过以下方式帮我完成所有界面的原型设计,并确保这些原型界面可以直接用于开发:
1、用户体验分析:先分析这个 App 的主要功能和用户需求,确定核心交互逻辑。
2、产品界面规划:作为产品经理,定义关键界面,确保信息架构合理。
3、高保真 UI 设计:作为 UI 设计师,设计贴近真实 iOS/Android 设计规范的界面,使用现代化的 UI 元素,使其具有良好的视觉体验。
4、HTML 原型实现:使用 HTML + Tailwind CSS(或 Bootstrap)生成所有原型界面,并使用 FontAwesome(或其他开源 UI 组件)让界面更加精美、接近真实的 App 设计。
拆分代码文件,保持结构清晰:
5、每个界面应作为独立的 HTML 文件存放,例如 home.html、profile.html、settings.html 等。
- index.html 作为主入口,不直接写入所有界面的 HTML 代码,而是使用 iframe 的方式嵌入这些 HTML 片段,并将所有页面直接平铺展示在 index 页面中,而不是跳转链接。
- 真实感增强:
- 界面尺寸应模拟 iPhone 15 Pro,并让界面圆角化,使其更像真实的手机界面。
- 使用真实的 UI 图片,而非占位符图片(可从 Unsplash、Pexels、Apple 官方 UI 资源中选择)。
- 添加顶部状态栏(模拟 iOS 状态栏),并包含 App 导航栏(类似 iOS 底部 Tab Bar)。
请按照以上要求生成完整的 HTML 代码,并确保其可用于实际开发。
这个html页面要求同时展示APP的多个页面,也就是说有多个iphone 15 pro的界面平铺在页面中,以便用户能直观看到全部产品页面。




OK,效果长这样。整体来说还是比较完整的。




以下是前面找到的竞品,美国当地的智能猫砂盆爆品的手机app




















对比以下,你觉得扣子空间基于用户调研分析做出来的产品原型图更好看、合理,还是竞品做的更好呢?
三、 总结:实力强但无项目经验的职场新人
这是我对扣子空间,同时也是当前阶段AI Agent的感受。
这次实践中,它能精准地解构真实的竞品页面,提炼出关于用户画像和语言风格的深刻洞察,并转成一份逻辑严谨、交互丰富的可视化PRD
但因为是通用Agent的定位,虽然扣子空间有很多内置的专家角色可以用,但到垂直领域的任务中,想得到专业的反馈,融入业务经验的提示词是少不了的。
也就是说扣子空间是个能力强但无项目经验的职场新人,需要我们带着更多耐心去调教,效果不会令你失望。
很多人可能会觉得前面说的「融入业务经验的提示词」很难写,其实这里有个技巧,就是利用扣子空间搜索调研能力去生成就好了——用魔法打败魔法~
说实话,这次实践扣子空间完全超出了我的预期:
核心在生产结果的稳定性上。要知道,在实际业务里面,我们要的不是多酷炫的结果,而是每次稳定的输出,也就是「确定性」,这点,或许是扣子空间的落地优势。
我们看到,扣子空间为代表的AI Agent产品已经和原先Chat类型的简单问答划分时代了,变成了一个具备感知、规划、执行能力的实习力,还不十分强大,但未来可期。
这,或许就是AI Agent所带来的,生产力的真正重塑。
本文由知乎作者【饼干哥哥AGI】,微信公众号:【饼干哥哥AGI】,原创/授权 发布于知乎,未经许可,禁止转载。
昨天做了一个完整体验,先说结论,和Manus智能体,和Google Gemini pro 2.5 Deep Research类比,都还有相当大的差距。
或者说现在是一个刚推出的半成品,还相当不成熟。
但是整个字节和豆包大投入的情况下,随着MCP协议生态插件的接入和完善,整个后续发展趋势我个人还是看好。类似豆包刚推出的时候也大量不成熟一个道理。
还是先说下试用的情况。
最简单的行程规划,开启了高德地图和墨迹天气两个MCP插件。具体的提示语如下:
我现在住在背景富卓园小区,今天需要去一趟济南,下午2点要在济南未名湖附近开会,预计5点结束,当天需要返回北京。请帮我规划行程。
但是实际的情况是连富卓园的地址都判断错误。在这里关键原因还是没有引入类似12306,携程,城市公交等MCP资源接入导致。




再看下我当时问Google Deep Research的关于文艺复兴的分析总结。提示语如下:
帮我给出一份欧洲文艺复兴时期的艺术成就综合分析报告,需要包括早期,中期,晚期到北方文艺复兴。艺术只分析建筑,雕刻和绘画三方面内容。需要给出每个时期的杰出人物,代表作,创造风格和背景,赞助商等。最好是输出的分析报告里面能够直接看到艺术作品图片。
同样,整个输出结果和Google对比差距明显。而且我在切换到规划模式的时候直接死机,运行了差不多2个小时也没有任何结果。




接着我再试了下华泰A股观察助手的行业垂直AI智能体。让它帮我分析下普元信息的财务信息和后续预测。




同样,得出的分析报告质量相当一般。基本没有太大的参考价值。




回头来看,为何在有了Coze的情况下,还进一步推出扣子空间。实际这个本质是字节希望推出一个类似Manus的通用智能体+行业垂直智能体,同时集成外部MCP资源生态。
原来Coze下作智能体,大家注意有两个关键点,一个是知识库,一个是插件tools资源。知识库通过 RAG方式实现增强检索接入。tools插件资源往往通过传统的web api或FunctionCall方式接入。在哲学资源接入后,再通过workflow进行编排满足不同场景需求。




那么在这种情况下就会人为的产生大量的智能体,这些智能体本身就是一个个信息孤岛,对企业B段的AI应用并不是一个好解决方案。
因此扣子空间的思路就是充分利用大模型的深度思考能了,利用MCP协议生态的接入,来构建一个通用智能体+行业垂直智能体。而不是人为来进行大量编排。具体如下:




所以在扣子空间新模式下,原来的插件资源将全部转变为MCP Server接入。原来大量的workflow编排也不需要,这个编排本身将内置到大模型内部来完成。以后只有类似通用智能体,深度研究智能体,行业专业智能体等简单的分类。
具体基于用户问题的不同场景,究竟应该如何组织MCP Server资源的能力并进行编排完成,变成了大模型内容的事情。大模型本身具备了通用Agent的能力。那么原来的生态就发生巨大的变化,原来可能是开发者不断开发Agent进入到智能商店。那么后续的重点就变成了开发者应该是开发大量的MCP Server实现资源的接入。上层Agent逐渐变成了一个统一面向用户的界面。
类似行程规划智能体如下:




类似行业研究智能体如下:




也就是说只要底层的MCP Server 资源接入足够。大模型完全能够胜任各种通用化的场景需求,逐步演变成一种理想化的通用智能体。
今年 AI 领域什么最火?别的不说,但通用智能体,肯定有一席之位。
继 Manus 之后,短短 2 个月的时间,大厂们纷纷入场:
智谱的「AutoGLM 沉思」、前百度高管创立的 Genspark、字节的「扣子空间」、360 的「纳米AI」,还有前一阵百度出的移动端通用智能体「心响」…
之前已经介绍过一部分了,感兴趣可以看之前的文章(附在文末了)。
今天主要来说说字节「扣子空间」的使用体验。




目前内测阶段,完全免费。实际使用效果如何,一起来看看吧~
先来简单介绍下扣子空间的基本界面功能。已玩过的,可以直接看下面实测用例部分~
打开扣子空间: https://space.coze.cn/
登录后,输入邀请码进入。进来后,就看到了这个界面:




1、任务描述
在输入框中输入任务描述。你想让扣子空间帮你做什么,用大白话描述就可以。
2、附件(可选)
如果任务需要额外信息,可以通过附件上传。
3、扩展(可选)
扣子空间支持添加 MCP 拓展。
包括高德地图、飞书文档、图像工具、语音合成、Notion、Github、数据库等 MCP。
啥意思呢?
比如你想用扣子空间做一份旅游攻略,那么就可以在扩展中添加「高德地图」。
这样就可以使用高德地图的能力了。比如在地图上标出景点的位置,甚至是根据行程,画出每天的行程轨迹等等。




4、两种模式
扣子空间支持两种模式:探索模式和规划模式。




① 探索模式:AI 自主动态思考,速度快。
② 规划模式:扣子空间在接到我们的需求后,会先生成一个执行规划。我们可以对计划进行修改,确认没问题后,再让扣子空间开始执行。(例如下图)




5、专家 Agent
扣子空间现在还提供了两个专家模式。
需要在这两方面提供专业思考的,可以试试下面这两个专家 Agent。(限时免费)








上面是扣子空间界面功能的基本介绍,实际生成效果怎么样,一起来看看~
扣子空间非常适合用来做交互式课程设计。比如以动画的方式,讲解复杂的数学公式,或者物理现象等。
下面这个网页,压强与沸点关系的互动课堂,就是用扣子空间一句话生成的:




课程设计包括动态的模拟实验,问答解析,还有科学原理的讲解。
而这些内容,用扣子空间,一句话就可以生成:




提示词:设计一个交互式互动课堂,面向初中学生,以生动的方式来讲解压强与沸点的关系,生成可交互的网站来演示
上面使用的是「规划模式」,扣子空间在接受到任务后,会先进行任务拆分和规划:
收集资料 -> 转化为初中生可以理解的语言 -> 课程互动设计 -> 生成交互式的网站。
在我确认流程没问题后,扣子空间会自动按照上面的规划,完成所有任务。
非常实用的一项功能。
一方面可以大大提高老师们的做课效率。一句话,就可以让扣子空间帮你设计课程(或提供课程设计灵感),并生成互动式的演示效果。
另一方面,这种生成的动态演示效果,也有利于帮助同学们理解复杂概念。
和其他类 Manus 产品一样,扣子空间也非常适合用来快速生成旅游攻略。
它可以根据用户的任务描述,自动浏览众多旅游相关的网页,然后汇总整理出一份适合的旅游攻略。
下面这个可视化网页,就是用扣子空间生成的。




攻略包括行前准备、每天的行程安排(行程轨迹也会在地图上标出,方便查看)、美食推荐、酒店推荐、伴手礼推荐等。
看了下,还是很详细的,非常适合懒得做攻略的人。只需要大白话说需求,扣子空间很快就能生成一个旅游攻略。
下面是提示词及用到的扩展:




添加扩展:高德地图、墨迹天气、图像工具
在体验了多款可以自动生成旅游攻略的通用智能体后,说说我的感受吧。
也许我不会完全按照生成的旅游攻略来出行,但我觉得它们可以起到一个很好的参考作用。
比如智能体生成的攻略中,有一些是我没有考虑到,或者没有搜集到的,它们可以起到一个很好的查漏补缺的作用。
扣子空间还适合批量搜集网上的资料。比如下面这个例子。
提示词:从小红书搜集 50 个关于“人间清醒”的语录,并记录在飞书文档中
扣子空间会自动打开小红书网页版,滚动到「搜索」,输入「人间清醒」开始检索,找到后会提取文本。向下滚动,继续查找…
基本是模拟人类操作。




在浏览器远程控制期间,需要登录小红书并授权:




最后扣子空间会将搜集到的语录,保存在飞书文档中:




ps:如果第一次使用飞书文档,需要授权(按提示操作即可):




扣子空间也可以一句话做 PPT。下面截取了用扣子空间生成的 PPT 的部分内容:








样式还算可以,不过不是很推荐。
如果想用 AI 做 PPT,还是推荐用专门的 AI PPT 工具。
因为目前扣子空间生成的 PPT,是 PDF 格式的。支持下载,但不方便修改。
扣子空间也可以生成故事绘本。
提示词:生成一个儿童故事绘本,故事情节适合 2-6 岁的儿童,为每个情节配图,需要保持主体的一致性,最终合成视频,并用语音播报。(添加扩展:图像工具、语音合成)
下面是截取了一小段用扣子空间生成的故事绘本:


https://www.zhihu.com/video/
扣子空间会根据任务要求,生成一个适合该年龄段的故事。
然后根据故事,拆分成具体的画面情节,再使用「图像工具」的扩展,生成对应画面。
因为目前扣子空间中,没有生成视频的扩展,所以是以网页的形式来展示绘本。
ps:播报的声音,太像机器了。而且画面风格以及主体一致性无法保证。
扣子空间还可以一句话生成动态图表。方便进行各种专业化的数据展示。
提示词:生成从1949年到2024年间,河北各城市GDP排名动态变化过程




以上就是关于字节扣子空间的介绍以及案例实测。
整体体验还是不错的,功能强大,扣子空间能做的,远远不止上面列出的这些。
大家可以在扣子空间官网,查看更多官方提供的案例,以及用户分享的优秀案例:








因为扣子空间还在内测阶段,用的过程中,不免会有些体验不是很好的地方。
比如,在让扣子空间根据飞书多维表格的内容,生成一个网站时,需要频繁地扫码授权等。
不过,相对于 Manus 邀请码遥遥无期以及每月 $39 的费用,字节的扣子空间,现阶段能让获得邀请码的用户免费敞开了使用,已经很不错了。
而且扣子空间的邀请码,还是比较容易蹲到的。
因为获得邀请码的用户,通过创建任务,就可获得 5 个邀请码,再分享出去,这样更多人就都能体验上扣子空间了。
以上,就是关于字节扣子空间的一些使用体验。感兴趣可以试试~
相关阅读
X小鹿AI工具库:智谱AutoGLM沉思,一款能自主操作的AI智能体X小鹿AI工具库:Genspark,又一款华人团队研发的通用AI智能体引爆海外X小鹿AI工具库:百度心响APP,一款移动端通用智能体
更多AI工具,见【AI工具(持续更新)】专栏。
我是X小鹿AI工具库,前互联网大厂程序员,现自由职业,也一名AIGC爱好者,持续分享更多前沿的「AI 工具」及「AI 副业玩法」,期待和大家一起交流。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/278463.html原文链接:https://javaforall.net
