通义千问发布 Qwen3-Max-Thinking 模型正式版；月之暗面上线多模态旗舰模型 Kimi K2.5【2026-01-27】

通义千问发布Qwen3-Max-Thinking模型正式版 #1
月之暗面悄悄上线Kimi K2.5 #2
腾讯发布混元图生图3.0模型 #3
英伟达发布开源AI气象模型Earth-2 #4
Anthropic推出Claude互动工具功能 #5
MCP Apps官方扩展上线支持多媒体交互 #6
OpenAI默默升级ChatGPT代码执行功能 #7
OpenAI或以CPM约60美元的高价兜售ChatGPT广告位 #8
研究团队发布InFi-Check事实核查框架 #9
VIGA发布：逆向图形学多模态Agent #10
腾讯元宝推出社交AI应用元宝派内测 #11
微软推出Maia 200 AI推理加速器 #12
英伟达投资CoreWeave建设AI工厂 #13
国星宇航披露“星算”计划太空算力网络路线图 #14
阶跃星辰B+轮融资超50亿，印奇出任董事长 #15

通义千问推出旗舰推理模型
Qwen3-Max-Thinking 正式版，性能媲美
GPT-5.2、
Claude-Opus-4.5 等顶尖模型。该模型支持
自适应工具调用 与
多轮迭代推理扩展，已在
Qwen Chat 上线并开放
API 调用。

千问Qwen正式推出其最新的旗舰推理模型Qwen3-Max-Thinking，该模型通过大幅增加参数规模并投入大量强化学习训练算力，在事实知识、复杂推理、指令遵循、人类偏好对齐及Agent能力等多个关键维度上实现显著提升。根据官方发布的19项权威基准测试数据，Qwen3-Max-Thinking的性能可媲美GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型。该模型现已上线Qwen Chat并开放API调用，核心创新包括自适应工具调用能力，可自主选择并调用内置的搜索引擎、记忆和代码解释器功能，以及一项经验累积式、多轮迭代的测试时扩展技术，能在推理阶段分配额外计算资源以显著提升性能，并在GPQA、HLE、LiveCodeBench v6、IMO-AnswerBench等多项关键推理基准上超越了Gemini 3 Pro。

https://chat.qwen.ai https://qwen.ai/blog?id=qwen3-max-thinking https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23 https://mp.weixin..com/s/tWpStpBN5i5mZQ9jTiVV9A

月之暗面已在其
kimi 应用中上线
Kimi K2.5 版本，据用户发现，该模型支持
多模态 功能。

月之暗面已在kimi应用端和网页端逐步推出 Kimi K2.5。据多个非官方社交媒体上的用户确认，，选择Kimi K2 Thinking 即可体验 Kimi K2.5。移动端用户需将应用更新至最新版本2.5.6才能体验该版本，据用户发现，K2.5 具备多模态功能。

腾讯
混元发布图像模型
HunyuanImage 3.0，采用
MoE架构，支持
图生图、
编辑与
多图融合。模型已上线
腾讯元宝与官网，官方称该模型视觉质量与
指令对齐性能达
SOTA，媲美领先
闭源模型。

月之暗面 Kimi 教程腾讯混元近日正式发布 80B 参数规模的混元图像 3.0 图生图（HunyuanImage 3.0-Instruct）模型，该模型采用 MoE 架构（激活参数约 13B），集成了视觉理解与精准图像合成能力，支持图片编辑与多图融合。基于原生思维链（Native CoT）与自研 MixGRPO 算法，模型能够先理解图像内容并进行推理，随后生成详细的编辑指令，实现包括元素增删、风格变换、文字修改、老照片修复及多图合成在内的多种功能，并确保非编辑区域的一致性。目前，该模型已同步上线腾讯元宝全端及腾讯混元官网，官方数据显示其生成速度明显提升，且在视觉质量与指令对齐性能上达到了 SOTA 级别，可与领先的闭源模型媲美。

https://hunyuan.tencent.com/chat/HunyuanDefault?

https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct https://mp.weixin..com/s/hzgmBrBCN9wkV6KOAV4_Fg

NVIDIA在
AMS年会上发布全球首个全开放
AI气象软件栈
Earth-2，涵盖天气预测全流程，支持
15天全球预报与局部风暴预测，已上线
Medium Range与
Nowcasting模型，精度超越现有开源方案。

NVIDIA在近期举办的美国气象学会（AMS）年会上，正式推出了Earth-2系列开放AI气象模型、库和框架。该系列被官方称为全球首个全开放且加速的AI天气预报软件栈，旨在使全球科学家、初创公司及政府机构能够更便捷地进行气象与气候预测。Earth-2涵盖了从初始观测数据处理到生成15天全球预报或局部风暴预测的各个阶段，包含基于Atlas架构的Medium Range模型、基于StormScope架构的Nowcasting模型以及基于HealDA架构的Global Data Assimilation模型。相比传统依赖超算运行的物理模型，Earth-2不仅大幅降低了计算时间和成本，其精度在多项标准基准测试中也超越了Google的GenCast等顶尖开源模型。目前，Medium Range和Nowcasting模型已在GitHub、Hugging Face及NVIDIA Earth2Studio上线，Global Data Assimilation预计于今年晚些时候发布。

https://blogs.nvidia.com/blog/nvidia-earth-2-open-models/ https://huggingface.co/nvidia/stormscope-goes-mrms https://github.com/NVIDIA/earth2studio

Anthropie 宣布
Claude 新增互动工具功能，支持与多款应用实时协作。该功能基于
MCP Apps 标准，已在
Claude.ai 的
Pro 及以上版本上线。同时，免费用户已获得包括创建和编辑文档在内的
skills 和其他功能的访问权限。

Anthropic宣布Claude新增互动工具功能，可直接在对话界面内实时交互。首批支持9款工具：Amplitude（构建分析图表）、Asana（管理项目任务）、Box（搜索预览文档）、Canva（定制演示文稿）、Clay（研究公司及起草邮件）、Figma（生成流程图等视觉图表）、Hex（生成交互式数据回答）、monday.com（管理看板）、Slack（搜索对话及发布消息）。

该功能基于Model Context Protocol（MCP）开放标准，已在Claude.ai网页及桌面端上线，支持Pro、Max、Team和Enterprise计划。官方预告Salesforce即将通过Agentforce 360接入，功能未来还将登陆Claude Cowork。

同时，Claude针对免费用户开放功能，现在已支持创建和编辑Excel表格、演示文稿、Word文档及PDF文件，并可用skills和compaction技术以处理复杂任务。

https://claude.com/blog/interactive-tools-in-claude https://blog.modelcontextprotocol.io/posts/2026-01-26-mcp-apps

MCP 维护团队宣布
MCP Apps 拓展正式上线，支持在对话中渲染仪表盘、表单等交互式 UI。
Claude、
Goose 已支持，
ChatGPT
本周上线。

MCP 核心维护者正式宣布 MCP Apps 作为官方 MCP 扩展上线并进入生产就绪阶段。该扩展允许 Tool 返回交互式 UI 组件，直接在对话中渲染仪表盘、表单、可视化图表及多步工作流，从而将 Agent 的能力从纯文本交互扩展到富媒体界面。目前，Claude（Web 与桌面版）和 Goose 已支持该功能，Visual Studio Code Insiders 现已可用，ChatGPT 也将于本周开始支持。开发者可以通过官方发布的 @modelcontextprotocol/ext-apps SDK 构建应用，实现 UI 与主机之间的双向通信。该标准由 Anthropic、OpenAI 及 Block 等公司合作创建，并得到了微软、JetBrains、AWS 和 Google DeepMind 等行业伙伴的支持。

https://blog.modelcontextprotocol.io/posts/2026-01-26-mcp-apps/

有开发者发现
OpenAI 默默升级了
ChatGPT 的代码执行功能，支持
Bash 和多门编程语言。可下载公网文件，且免费用户可用。

近期，开发者 Simon Willison 发现 OpenAI 对 ChatGPT 的代码执行容器进行了一次重大但未公开文档的升级。据其体验和测试，ChatGPT 的代码执行功能（曾用名 Code Interpreter，后更名为 Advanced Data Analysis）现在可以直接运行 Bash 命令，并原生支持包括 Node.js、Ruby、Perl、PHP、Go、Java、Swift、Kotlin、C 和 C++ 在内的多种编程语言。通过一个名为 container.download 的新工具，ChatGPT 能够将公网上的文件下载到沙箱容器内进行处理，尽管容器本身仍无法发起任意的出站网络请求。此外，容器内部署了自定义代理机制，允许通过 pip 和 npm 安装所需的 Python 和 JavaScript 包。这些新功能在免费版 ChatGPT 中也已可用。Willison 指出，container.download 工具具备安全限制，仅允许下载在对话中由用户明确提供或通过搜索结果获得的 URL，以防止潜在的数据泄露风险。而 OpenAI 尚未在其官方发布笔记中对此进行说明。

https://simonwillison.net/2026/Jan/26/chatgpt-containers/

据报道，
OpenAI正以
每千次展示60美元的高价推出
ChatGPT广告，费率对标高端电视时段，采用按展示计费模式。

据媒体报道，OpenAI正以每千次展示约60美元（CPM）的高价推出ChatGPT广告，这一费率被视为与高端电视广告时段，如周日橄榄球之夜NFL直播等优质广告资源相当，而非典型的在线广告价格。报道称，OpenAI采用按展示计费（CPM）的模式而非按点击计费（CPC），后者通常对广告商更具吸引力。

https://the-decoder.com/openai-reportedly-launches-chatgpt-ads-at-premium-tv-prices https://x.com/petergostev/status/

研究团队推出了
InFi-Check 框架，实现对大语言模型输出的细粒度事实核查。该框架生成高质量训练数据，构建了
InFi-Check-FG 基准，并开发出
InFi-Checker 模型，可识别
六类错误、提供证据、理由与修正建议。

研究团队提出了InFi-Check框架，该框架旨在对大语言模型（LLM）的输出进行可解释的、细粒度的事实核查，超越了传统的二元判断。InFi-Check通过一个受控的数据合成管线生成高质量数据，这些数据包含明确的证据、细粒度的错误类型标签、理由说明以及修正建议。基于这些数据，研究团队构建了大规模训练数据和一个名为InFi-Check-FG的人工验证基准。在此基础上，他们开发了InFi-Checker模型，该模型能够联合提供支持性证据、对细粒度的错误类型进行分类，并给出理由和修正。实验表明，InFi-Checker在InFi-Check-FG基准上取得了最先进的性能，并在多个下游任务中表现出强大的泛化能力，其运行成本约为GPT-4o和Claude-3.5等模型的三分之一。InFi-Check能够区分六种具体的错误类型（如实体错误、逻辑反转等），提供证据、理由和修正，从而将事实核查从一个简单的分类任务转变为一个完整的“诊断与修正”循环。该项目由清华大学OpenBMB团队、DeepLang AI及复旦大学合作完成，相关论文、代码及数据集已公开发布。

https://github.com/Phosphor-Bai/InFi-Check https://arxiv.org/abs/2601.06666

VIGA是一个多模态Agent，通过
逆向图形学实现视觉重建。它采用
生成、
渲染、
验证的迭代流程，由具备
自我反思能力的单一Agent完成，交替扮演
生成器和
验证器角色，支持
3D编辑、
2D布局、
单视图重建及
动态场景等多种任务。

VIGA是一个名为Vision-as-Inverse-Graphics Agent的多模态Agent，旨在通过程序化视觉重建实现逆向图形学。它采用一种分析-综合的代码Agent方法，通过生成、渲染和验证场景与目标图像的迭代循环来处理视觉问题。该Agent由一个具备自我反思能力的单一Agent构成，其在Generator和Verifier两个角色间交替：Generator负责使用规划、代码执行、资产检索和场景查询等工具编写并执行场景程序；Verifier则检查多视角渲染输出，识别视觉差异，并为下一次迭代提供反馈。VIGA的整个流程是自我修正的，无需微调，并维护一个包含计划、代码差异和渲染历史的不断演进的上下文记忆。VIGA支持多种领域，包括用于多步3D图形编辑的BlenderBench、用于单步3D图形编辑的BlenderGym、用于2D幻灯片/文档布局合成的SlideBench、用于单视图3D重建的自定义静态场景，以及用于带有物理效果的4D动态场景的自定义动态场景。

https://github.com/Fugtemypt123/VIGA https://fugtemypt123.github.io/VIGA-website/ https://arxiv.org/abs/2601.11109

腾讯AI助手
“元宝”上线社交功能
“元宝派”，支持多人在线互动，打通
微信关系链，提供群聊、观影、听歌、共享屏幕等玩法，目前处于测试阶段。

腾讯旗下AI助手“元宝”近期开启全新社交场景“元宝派”的内测，旨在探索AI技术在多人社交环境下的深度融合。与传统的单一对话机器人不同，“元宝派”被定位为一个多人在线社交空间，用户可以创建或加入特定的“派”，并邀请AI参与群聊、调节氛围及执行任务。该功能深度打通了“微信”与“”的社交关系链，支持通过分享派号或链接一键邀请好友，并集成了基于“腾讯会议”底层技术的“一起看电影”、“一起听音乐”及“共享屏幕”等沉浸式互动玩法。此外，元宝派还提供群聊总结、兴趣打卡及图片二创等功能。目前，相关玩法已进入灰度测试阶段，计划于近期陆续上线。

微软发布
AI推理芯片
Maia 200，采用
台积电
3nm工艺，
FP4性能达
10 PFLOPS，已部署于
美国中部数据中心，并将扩展至
西部3号区域，支持
GPT-5.2等模型及
Microsoft 365 Copilot。

微软推出专为AI推理设计的Maia 200加速器，称其FP4性能为第三代亚马逊Trainium的三倍，FP8性能高于谷歌第七代TPU，且每美元性能比微软现有最新硬件高30%。该芯片基于台积电3nm工艺，集成超140亿个晶体管，配备原生FP8/FP4张量核心、216GB HBM3e内存（7 TB/s带宽）、272MB片上SRAM，在750W SoC TDP下可提供超过10 PFLOPS的FP4算力和约5 PFLOPS的FP8算力。Maia 200已部署于美国中部数据中心，并将扩展至美国西部3号等未来区域，同时微软开放Maia SDK预览版以支持开发者进行模型优化。该芯片将服务于OpenAI的GPT-5.2等模型，支持Microsoft Foundry和Microsoft 365 Copilot，微软Superintelligence团队也已率先使用其进行合成数据生成及强化学习。

https://blogs.microsoft.com/blog/2026/01/26/maia-200-the-ai-accelerator-built-for-inference/

Nvidia向数据中心公司
CoreWeave投资
20亿美元，收购其
A类股票。双方将合作建设采用
Nvidia技术的AI工厂，整合新
Rubin芯片在内的产品。

Nvidia宣布向数据中心公司CoreWeave投资20亿美元，以加速其到2030年年前新增超过5吉瓦AI计算能力的计划。根据协议，Nvidia以每股87.20美元的价格收购了CoreWeave的A类股票，双方将合作建设采用Nvidia产品的“AI工厂”，即数据中心。作为交易的一部分，CoreWeave将在其平台全线整合Nvidia的产品，包括即将取代当前Blackwell架构的新Rubin芯片架构、Bluefield存储系统以及Nvidia新的CPU产品线Vera。Nvidia还将协助CoreWeave为数据中心购买土地和电力，并与CoreWeave合作，将其AI软件和架构纳入Nvidia的参考架构，以销售给云业务和企业。

https://nvidianews.nvidia.com/news/nvidia-and-coreweave-strengthen-collaboration-to-accelerate-buildout-of-ai-factories

国星宇航发布“
星算”计划，拟建
2800颗计算卫星组成的太空算力网，
2035年前完成组网，提供
十万P推理与
百万P训练算力，已成功在轨部署
通义千问Qwen3大模型。

商业航天企业国星宇航披露了星算计划的最新进展与路线图，该计划旨在构建一个由2800颗计算卫星组成的太空算力网络，作为全球首个服务硅基智能体的太空算力网，专注于为自动驾驶、无人机、智能机器人等陆海空天领域的硅基智能体及AI模型提供推理和训练服务。网络由2400颗推理计算卫星和400颗训练计算卫星构成，部署在500-1000公里的辰昏轨道、太阳同步轨道和低倾角轨道，目标是在2035年前完成全部组网，实现十万P级的推理算力和百万P级的训练算力。国星宇航已完成关键技术验证，并于近期成功将通义千问Qwen3大模型部署至其01组太空计算中心，完成了全球首次通用大模型在轨部署与推理任务。

近期，
阶跃星辰完成了超
50亿元B+轮融资，刷新国内大模型单笔融资纪录。投资方包括
上国投先导基金、
国寿股权等，
腾讯、
五源资本跟投。
旷视科技创始人
印奇出任董事长。

阶跃星辰宣布完成超50亿元人民币的B+轮融资，该轮融资刷新了近一年来国内大模型赛道的单笔融资纪录。投资方包括上国投先导基金、国寿股权、浦东创投、徐汇资本、无锡梁溪基金、厦门国贸、华勤技术等机构，腾讯、五源资本等老股东也继续跟投。与此同时，旷视科技创始人、千里科技董事长印奇正式出任阶跃星辰董事长，将与CEO姜大昕、首席科学家张祥雨、CTO朱亦博共同组成核心管理团队。印奇将主要负责整体战略节奏、技术方向的制定以及终端商业化。

https://zhidx.com/p/530904.html

提示：内容由AI辅助创作，可能存在幻觉和错误。

发布者：Ai探索者，转载请注明出处：https://javaforall.net/268374.html原文链接：https://javaforall.net

通义千问发布 Qwen3-Max-Thinking 模型正式版；月之暗面上线多模态旗舰模型 Kimi K2.5【2026-01-27】

关于作者

Ai探索者网站注册用户

通义千问发布 Qwen3-Max-Thinking 模型正式版；月之暗面上线多模态旗舰模型 Kimi K2.5【2026-01-27】

关于作者

Ai探索者网站注册用户

相关推荐

张予彤空降月之暗面，Kimi技术不再独占，IPO遇盈利瓶颈

月之暗面Kimi Linear架构发布：长文本处理效率突破，AgentLLM迎来新篇章

月之暗面开源 Kimi-K2：万亿参数，超强Agent，全线 SOTA

AI与机器人盘前速递丨人形机器人领跑火炬传递，月之暗面Kimi押注Agent

美团发布并开源LongCat-Image图像生成模型；张予彤出任月之暗面Kimi总裁 ｜ 未来商业早参

月之暗面完成C轮5亿美元融资，杨植麟“短期内不着急上市”

美团发布并开源LongCat-Image图像生成模型；张予彤出任月之暗面Kimi总裁｜未来商业早参