腾讯Q2财报发布,现在给大家汇报混元工作

腾讯Q2财报发布,现在给大家汇报混元工作

财报里的元宝,飞速进化中

8月13日 元宝 混元 Hunyuan 教程,腾讯公布2025年二季报,重点提到

图片

我们致力于通过赋能微信内更多应用场景,推动AI原生应用元宝的使用量,升级我们混元基础模型的能力,为用户及企业带来更进一步的AI增益。

我们通过数据增强和合成技术,提升了数据的质量与多样性,并以更有效的后训练与测试时扩展方法,增强混元的基础模型能力。我们的混元3D模型,以领先行业的几何精度、纹理真实度、指令与3D对齐能力,综合评分排名第一。越来越多的游戏开发者、3D打印企业及专业设计师采用混元3D模型来生成数字资产。

刚刚过去这一季度,混元快速迭代,不断成长,“混元模型家族”不断壮大。

小步快跑,持续迭代的混元

大语言模型:

混元旗舰模型TurboS快速升级,保持每月迭代一个版本的节奏,在数学竞赛、编程和STEM推理表现方面都有明显提升。

混元深度推理模型T1,进一步提升Agent能力和通用推理性能,在项目级代码生成、高难度数学推理、文本写作等方面展现出不错的效果。

多模态模型:

连续推出三个不同定位的多模态理解模型

 

在国际知名的大模型竞技场“LMArena Vision排行榜”上,混元Large-Vision取得1256分,位列第五名(国内模型第一名),和业界顶尖模型GPT-4.5和Claude-4-Sonnet处于同一水平,在真实应用场景中展现出卓越的多语言能力和优秀的用户体验。

还带来了首个毫秒级实时生图的图片生成模型—腾讯混元图像2.0

 

相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型,在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式,带来交互体验革新。

面向游戏工业级内容生产,腾讯混元游戏视觉生成平台正式发布,这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎,大幅优化了游戏资产生成与游戏制作流程。

 

在上海人工智能实验室发布的全球3D生成模型评测榜单中,腾讯混元3D系列模型在图生3D(Image-to-3D)和文生3D(Text-to-3D)任务中均拔得头筹,其中混元3D v2.5以卓越性能荣登全球第一,混元 3D v2.0 开源模型紧随其后,凸显技术领先性。

图片

全面开源

多个模型登顶国际开源社区热门趋势榜

过去一个季度,「开源」成为腾讯混元的关键词。

 

大语言模型层面,推出0.5B、1.8B、4B、7B、A13B多款开源模型,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,支持垂直领域低成本微调,为开发者和企业提供更多选择。

多模态模型层面,陆续开源了业界领先的文生图、视频生成和3D生成能力,提供接近商业模型性能的开源基座,图像和视频衍生模型总数达3000个,混元3D系列模型社区下载量突破230万次。最新开源的混元 3D 世界模型 1.0上线后即斩获Hugging Face论文热榜第一,模型热榜第二。

 

此外,还开源定制化图像生成插件 InstantCharacter、全新的多模态定制化视频生成工具HunyuanCustom、语音数字人模型HunyuanVideo-Avatar等多个模型工具和应用。

推进行业应用,打造实用大模型

过去的一个季度,混元大模型持续携手合作伙伴和腾讯司内业务,不断落地大模型应用。

 

支持腾讯元宝上线图片/视频多模态理解、文生图等多个功能。

 

通过腾讯混元ASR(语音识别)大模型助力ima实现语音输入,推出AI播客并在ima、腾讯新闻上线。

 

支持腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。

支持腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,隐私零上传;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。

支持搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问AI」基于模型实现输入框与 AI 即问即答的无缝衔接。

支持金融AI助手通过Prompt优化和少量数据微调实现95%+意图识别准确率,展现出金融级的高可靠性;游戏翻译和飞车手游NPC充分利用模型的理解能力在多语言理解能力、方言翻译和智能对话方面有突出表现

面向外部,腾讯混元正加速推动3D生成技术在各行业的落地应用:在3D生成模型,AI设计智能体Lovart、全球领先的3D打印品牌拓竹科技MakerWorld及创想三维等,均已接入腾讯混元3D模型API。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/255520.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月13日 下午12:03
下一篇 2026年3月13日 下午12:03


相关推荐

关注全栈程序员社区公众号