“打开小红书搜北京美食攻略,收藏前3篇高赞笔记”
“用美团点一份少糖奶茶,选距离最近的商家”
“把Excel里的销售数据整理成PPT,发邮件给经理”
这些需要手动切换多个APP、一步步操作的繁琐任务,现在只需一句话就能让手机自动完成!
前阵子豆包手机火遍网络,动动嘴就能让手机完成各种任务,这看起来十分吸引人!豆包手机现在发售及售空,二手价格已经超过了首发价格!
那些想体验AI手机,但是又抢不到的别着急,今天给大家介绍个开源项目,部署到手机之后,就可以让你的手机秒变AI手机!它就是:Open-AutoGLM
它是手机的“AI超级大脑”
Open-AutoGLM 是一个能让手机听懂人话、自己动手干活的智能框架。你只需要说一句自然语言指令——比如“打开小红书搜北京周末遛娃攻略”“打开支付宝查本月账单”——它就能像个隐形助手,自动解锁手机、点开APP、点击按钮、输入文字,一步步帮你完成任务。
豆包 大模型 教程
不用学复杂的编程,不用手动点屏幕,对着手机“发号施令”就行。
它是怎么让手机“听话”的?
原理其实很像人用手机:
1. “看”屏幕:它会实时给手机截图,就像你睁眼看界面一样;
2. “懂”内容:通过AI模型分析截图,识别出“搜索框在哪”“按钮点哪里”,就像你理解界面功能一样;
3. “做”操作:规划出下一步该点哪里、滑哪里,再通过手机调试工具(ADB)模拟人手操作,比如点搜索框、输文字、点确认;
4. “循环直到完成”:重复“看-懂-做”的过程,直到帮你把任务做完。
整个过程,就像有个“数字分身”在替你玩手机,而且全程可以随时打断,安全感拉满。
这几个亮点,用过的人都夸
1. 手机“双语通”,国内外APP都能搞定
它有两个核心模型:
AutoGLM-Phone-9B:专门优化中文场景,淘宝、微信、美团这些国内APP操作起来丝滑得很;
AutoGLM-Phone-9B-Multilingual:支持英语等多语言,刷Instagram、用Uber也不在话下。
模型可以直接从Hugging Face或ModelScope下载,也能调用第三方服务(比如z.ai、Novita AI),不用自己折腾服务器。
2. 部署超简单,小白也能上手
不想看复杂教程?直接用“懒人模式”:
访问文档,为我安装 AutoGLM
https://raw.githubusercontent.com/zai-org/Open-AutoGLM/refs/heads/main/README.md
想手动试试?步骤也不复杂:
– 下载模型(约20GB,支持本地运行,数据不泄露);
– 启动模型服务,一行命令的事;
– 用手机连电脑(支持无线调试),输入指令就能跑。
具体可以参考官方给的说明一步步安装
最后说句实在的
Open-AutoGLM 目前还是个开源研究项目,主打“自动化操作”,但严禁用来干违法的事(比如偷偷控制别人手机)。数据可以本地部署,隐私有保障,这点大可放心。
项目地址:
https://github.com/zai-org/Open-AutoGLM
还能加入微信/Discord社区和大神交流哦~
发布者:Ai探索者,转载请注明出处:https://javaforall.net/268194.html原文链接:https://javaforall.net
