马斯克:Grok 5将于今年年底前推出。
马斯克:Grok 5将于今年年底前推出。
我不认为Grok 5会有本质(通用智力)突破,以及颠覆性应用。
——通用的底层智能General Foundational Intelligence,作为一个”幽灵”是否存在,仍然是个谜。
那种ARC测试就像瑞文测试,这种测试没有什么意义,人和Agent最能依靠的智能是经验和经历,尤其是经过”环境奖惩压力测试”的经验(对于DL模型来说,就是数据的多样性、针对性、准确性),而不是靠什么ARC和瑞文智力。这种过度抽象和简化的东西,就很不符合进化论的形式复杂性。
一个简单的逻辑,如果瑞文测试无法测试出人类真实的智能,就像你面试时,不用出具瑞文测试成绩,但必须要出具你的经验履历——那你怎么铁口直断ARC可以测试出模型的真实智能?
——目前语言模型能做的事,基本都已经被畅想出来了,都是处于那种”能想到但做大不到”的水平。这个东西,在我们的想象之中,预测之中,那么,就很难说是什么”颠覆”。
另外,过拟合匹配,正在毒害benchmarks,比如GPT-OSS 基准智力80,实际智力可能只有20。
xAI是刷榜大佬,对于马斯克与Sam Altman这种0道德玩家,你可以有一个信念:只要一个benchmark可以被hack,那么它一定会被hack。这个和lmsys arena是一个道理。
(但马斯克比Sam 稍微强一点,至少不会挂羊头卖狗肉,拿廉价的小型Coder模型充当大型General模型)
如果老马认为benchmarks=智能本智,hacking benchmarks = 追求智能,那成功是唾手可得的。
目前,还保持基本信用的,
只有Anthropic和Google,
未来的变革,也大概率只会在这两家中发生,
如果让我再加一个,也许我会加豆包(他们现在有在认真做好底子,而不是去打榜)。


马斯克在X平台上发表声明,宣称Grok5有望成为真正的通用人工智能(AGI)。
以Grok4为例,其表现令人瞩目:在一项模拟经营自动售货机的测试中,该AI需要像企业主一样管理库存、定价和订单。结果显示,Grok4的销量几乎是GPT5的两倍,并能维持业务运营近一年之久,充分展现了其卓越的长期推理能力。




但用户的真实体验却截然不同,网络上充斥着对Grok的负面评价,包括服务不稳定、回答质量不佳,甚至有人认为模型性能出现倒退。




这就暴露出了一个巨大的矛盾:为何在复杂测试中表现完美的AI,到了用户手中却问题频出。




亮眼的基准测试成绩与糟糕的日常体验,究竟哪个更能代表Grok的真实水平?Grok5会是AGI的黎明,还是又一个仅存在于发布会上的神话?在它真正解决用户基本体验问题之前,所有宏大叙事都值得商榷。




最近调用大模型API时,我都在使用胜算云平台。该平台通过单一API即可调用所有主流大模型,且包含充值优惠,实际使用成本相当于原价的九折。




文章来源:「来源见截图水印」
当全世界还把Grok当作“马斯克牌嘴替”,捧作流量锦鲤之时,印尼通信部1月10日直言:
莫先扯星辰大海,先把基本事做——72小时内下架,全球首实施封杀。
但凡你对“AI深伪裸照”这五个字有点了解,都会秒懂这记耳光有多响。
听着吧,就好似你家智能音箱,冷不丁蹦出句约炮的话。
更绝的是,这才是X平台“无限草稿”功能0.3%的测试量。
别着急,后面还有2700万印尼用户等着瞧热闹。




这事爆出来是雅加达时间1月10日早8点。
通信部部长BudiArieSetiadi一句“深度伪造裸照已流到中小学群”,Grok秒变“数字禁书”。
xAI,连公关稿都还没来得及发。
苹果、谷歌商店,与此同时就下架。
听着,仿佛马斯克刚炫完火箭回收,一转身瞧自个聊天机器人被当火箭炮点着。
到底图啥?
印尼给出答案:先保15岁以下2400万未成年人的脸,再谈AI民主。




说白了,Grok的“无限草稿”就是把用户输入当火锅底料,越辣越香。
可底料里掉进去一张人脸,它直接给你生成18+同人图。
问题来了,同样开源的StableDiffusionXL在欧美早被强制加“内衣滤镜”,误判率压到2.3%。
而Grok这次连0.01%的检测都没做。
难道马斯克真觉得赤道国家网速慢,翻车就翻不到他头上?




2023年4月,意大利因ChatGPT隐私泄露,罚了OpenAI两千万欧元,旋即上线合规版。
聪明归聪明,但是印尼连罚款流程都跳过,直接拔网线,这坑xAI怎么填?
你说资本家傻吗
马斯克,把特斯拉上海工厂的毛利率精心压到19.8%。
却又舍不得,给Grok配备一支,花费300万美元的本地内容审核团队,该怪啥。




资本角度:xAI刚融资60亿美元,估值240亿,丢一个2.7亿人口的印尼市场,账面损失才1.2%,但“全球首杀”标签一贴,下一轮融资利息至少涨0.5个点。
从国家视角来说,印尼2025年数字GDP欲达1500亿美元,即便得罪硅谷,也要做“东盟数字守门员。
产业角度:本地AI公司直呼爽,把Grok份额啃下10%,就能年入3000万美元。
这不是封禁,而是给国产模型递刀子。




在印度,申请WhatsApp,于当地,搭建服务器。2024年中期,RelianceJioChat,月活跃用户,迅猛达1.1亿,占国内市场份额的30%。
巴西2022年封Telegram,结果三天后法官自己手机离不开群聊,灰溜溜解封,用户流失仅0.8%。
关键的差别,就在于本地的数据主权。
它相较硅谷那所谓的理想主义,更要紧些。
印尼这回是来真的,压根不留一丝缓冲的余地。




未来3-5年,AI出海,得先闯“清真合规”这道大关。
马来西亚、文莱、沙特,正排着队等着模板。
非主流有预测,到2027年,全球会因深伪色情再封15款大模型,这里头至少3款是从中国来的。
“AI没有国界,但裤裆有国籍。”




现实里,技术狂欢的赌局桌已摆至赤道边缘,筹码是2.7亿张人脸。
马斯克即便能回收火箭,也阻不了裸照传播的速度呀。
下一个遭下架的,难道不是你手机中那个‘高情商’助手呢?
如果喜欢,记得点个关注,点个赞,万分感谢!
声明:本文内容90%以上基于自己原创,少量素材借助AI辅助,但是所有内容都经过自己严格审核和复核。图片素材全部都是来源真实素材或AI原创。文章旨在倡导社会正能量,无低俗等不良引导,望读者知悉。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/277124.html原文链接:https://javaforall.net
