原阿里千问后训练负责人郁博文跟随林俊旸离职后,被曝闪电加入字节seed

原阿里千问后训练负责人郁博文跟随林俊旸离职后,被曝闪电加入字节seed

强化多模态布局,字节Seed被曝迎来前阿里Qwen后训练负责人郁博文

据IT时代网报道,3月11日,知情人士透露,原阿里巴巴通义实验室Qwen(千问)大模型后训练负责人郁博文已正式加入字节跳动,担任Seed团队视觉模型与多模态交互团队后训练负责人。这是继今年3月初郁博文从阿里离职后,其职业动向的首次明确。

公开资料显示,郁博文本科毕业于中南大学,后考入中国科学院信息工程研究所攻读研究生,2022年获得中国科学院大学博士学位。

在读期间,他专注于自然语言处理与信息抽取领域研究,曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文,并提出将信息抽取任务转化为图结构问题的创新思路,有效解决了实体重叠、嵌套等复杂场景下的识别难题。凭借突出的学术表现,他曾荣获中国科学院院长奖。

2022年博士毕业后,郁博文以阿里集团最高级别校招项目“阿里星”身份加入阿里巴巴达摩院,担任算法专家(P7)。入职初期即深度参与通义千问大模型的早期训练与研发,迅速成长为千问团队核心骨干,并最终担任后训练(Post-training)负责人。

作为后训练负责人,郁博文在大模型的“对齐”与“精调”领域贡献卓著。他主导了Qwen系列Chat模型的研发,通过监督微调(SFT)、强化学习(RLHF)、直接偏好优化(DPO)等技术,将通用大模型转化为符合人类价值观和使用习惯的对话模型。

针对不同规模模型,他设计了“四阶段进化论”和“知识蒸馏”策略,使Qwen模型在长文本生成、复杂推理及多模态理解等任务上表现优异。在LMSYS Chatbot Arena等全球权威评测中,Qwen系列多次跻身前十。

2026年3月,阿里通义实验室启动组织架构调整,计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整导致郁博文的管理范围大幅缩小,且与其坚持的“预训练与后训练必须深度耦合”的技术理念产生冲突。此外,阿里高层对千问团队施加的商业化考核压力,也加剧了团队内部的分歧。

2026年3月3日,郁博文提交辞职申请,次日正式离职。其工作由前Google 千问 Qwen 教程 DeepMind高级资深研究员周浩接任。

字节Seed团队近年来在大模型和多模态领域持续发力,郁博文的加入无疑将强化其在视觉与多模态交互方面的后训练能力,进一步推动字节在AI领域的布局。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/273661.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月12日 下午12:03
下一篇 2026年3月12日 下午12:04


相关推荐

关注全栈程序员社区公众号