原阿里千问后训练负责人郁博文跟随林俊旸离职后，被曝闪电加入字节seed

强化多模态布局，字节Seed被曝迎来前阿里Qwen后训练负责人郁博文

据IT时代网报道，3月11日，知情人士透露，原阿里巴巴通义实验室Qwen（千问）大模型后训练负责人郁博文已正式加入字节跳动，担任Seed团队视觉模型与多模态交互团队后训练负责人。这是继今年3月初郁博文从阿里离职后，其职业动向的首次明确。

公开资料显示，郁博文本科毕业于中南大学，后考入中国科学院信息工程研究所攻读研究生，2022年获得中国科学院大学博士学位。

在读期间，他专注于自然语言处理与信息抽取领域研究，曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文，并提出将信息抽取任务转化为图结构问题的创新思路，有效解决了实体重叠、嵌套等复杂场景下的识别难题。凭借突出的学术表现，他曾荣获中国科学院院长奖。

2022年博士毕业后，郁博文以阿里集团最高级别校招项目“阿里星”身份加入阿里巴巴达摩院，担任算法专家（P7）。入职初期即深度参与通义千问大模型的早期训练与研发，迅速成长为千问团队核心骨干，并最终担任后训练（Post-training）负责人。

作为后训练负责人，郁博文在大模型的“对齐”与“精调”领域贡献卓著。他主导了Qwen系列Chat模型的研发，通过监督微调（SFT）、强化学习（RLHF）、直接偏好优化（DPO）等技术，将通用大模型转化为符合人类价值观和使用习惯的对话模型。

针对不同规模模型，他设计了“四阶段进化论”和“知识蒸馏”策略，使Qwen模型在长文本生成、复杂推理及多模态理解等任务上表现优异。在LMSYS Chatbot Arena等全球权威评测中，Qwen系列多次跻身前十。

2026年3月，阿里通义实验室启动组织架构调整，计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整导致郁博文的管理范围大幅缩小，且与其坚持的“预训练与后训练必须深度耦合”的技术理念产生冲突。此外，阿里高层对千问团队施加的商业化考核压力，也加剧了团队内部的分歧。

2026年3月3日，郁博文提交辞职申请，次日正式离职。其工作由前Google 千问 Qwen 教程 DeepMind高级资深研究员周浩接任。

字节Seed团队近年来在大模型和多模态领域持续发力，郁博文的加入无疑将强化其在视觉与多模态交互方面的后训练能力，进一步推动字节在AI领域的布局。

发布者：Ai探索者，转载请注明出处：https://javaforall.net/273661.html原文链接：https://javaforall.net

原阿里千问后训练负责人郁博文跟随林俊旸离职后，被曝闪电加入字节seed

关于作者

Ai探索者网站注册用户

原阿里千问后训练负责人郁博文跟随林俊旸离职后，被曝闪电加入字节seed

关于作者

Ai探索者网站注册用户

相关推荐

cursor之java入门+Spring ai入门

华为910B GPU训练和推理调研

传阿里巴巴计划推出面向企业，基于千问模型的AI智能体

国际权威榜单放榜：阿里通义千问登顶全球最强开源模型

千问3.5-27B镜像免配置教程：本地权重就绪，10分钟上线Web对话

OpenClaw从入门到实战：打造你的专属AI智能体