
- 通义千问发布Qwen3-235B-A22B-Instruct-2507模型,即将发布Qwen3-Coder
- Google DeepMind 高级版 Gemini Deep Think 在 IMO 中达到金牌标准
- 智谱 Z.ai 推出开源项目阅读工具 Zread.ai
- 月之暗面发布Kimi K2技术报告
- Google宣布Gemini原生文本转语音(TTS)功能达到生产就绪状态
- 字节跳动新视频模型Waver 1.0现身Video Arena排行榜
- 传闻称OpenAI或将发布Sora 2
阿里巴巴通义千问团队发布了新的非思考模式大模型
Qwen3-235B-A22B-Instruct-2507,在多项能力上显著提升,并预告了即将推出的
Qwen3-Coder系列。
阿里巴巴通义千问团队发布了Qwen3-235B-A22B-Instruct-2507模型,这是对先前Qwen3-235B-A22B非思考模式的更新。团队表示,经过与社区的沟通和深思熟虑,决定停止使用混合思维模式,转而分别训练Instruct和Thinking模型以追求最佳质量。本次发布的是一个非思考(non-thinking)模型,它在输出中不会生成<think></think>块,相应的思考(Thinking)模型也正在开发中。
新模型在指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用等多个方面有显著提升。同时,它在多种语言的长尾知识覆盖方面取得了实质性进展,并在主观和开放式任务中更好地与用户偏好对齐,能够提供更有帮助的响应和更高质量的文本生成。此外,模型在256K长上下文理解方面的能力也得到了增强。
对于Agentic使用,官方推荐使用Qwen-Agent以充分利用其工具调用能力。为获得最佳性能,官方建议采样参数设置为 Temperature=0.7, TopP=0.8, TopK=20, MinP=0。
千问 Qwen 教程
目前,该模型已可在Qwen Chat上体验,模型权重已在魔搭和HuggingFace上线。另外,Qwen团队负责人还暗示即将发布Qwen3-Coder系列模型。

https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507 https://x.com/Alibaba_Qwen/status/
Google DeepMind宣布,其高级版
Gemini Deep Think模型在国际数学奥林匹克竞赛中解决了六分之五的题目,正式达到金牌水平。
Google DeepMind宣布,其一个高级版本的Gemini Deep Think模型,在国际数学奥林匹克(IMO)竞赛的问题上正式取得了金牌水平的成绩。该模型在六道题目中完美解决了五道,总共获得35分(满分42分),达到了金牌分数线。
IMO主席Gregor Dolinar教授证实了这一里程碑式的成就,并评价其解决方案“在许多方面都令人惊叹”,认为其清晰、精确且大部分易于理解。
此次成果使用了Gemini Deep Think模式的高级版本,这是一种针对复杂问题的增强推理模式,融合了包括并行思考在内的最新研究技术,使模型能同时探索和组合多种可能的解决方案。为了最大化Deep Think的推理能力,团队还利用新颖的强化学习技术对该版Gemini进行了训练,使其能更好地利用多步推理、问题解决和定理证明数据。此外,模型还被提供了高质量数学问题解决方案的精选语料库,并在其指令中加入了一些关于如何解决IMO问题的一般性提示。
Google DeepMind计划先向包括数学家在内的一组可信测试者提供该Deep Think模型的版本,之后再向Google AI Ultra订阅用户推出。团队表示,虽然目前在自然语言方法上取得了突破,但他们仍在继续推进AlphaGeometry和AlphaProof等形式化系统。他们相信,将自然语言流畅性与形式化语言中的严谨、可验证推理相结合的Agent,将成为数学家、科学家和研究人员的宝贵工具。
此次成果由Thang Luong领导整体技术方向,并与Edward Lockhart共同协调IMO 2025项目。IMO官方确认了提交答案的完整性和正确性,但其审查不涉及对系统、流程或底层模型的验证。

https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
Z.ai(智谱)公司上线了一款名为
Zread.ai的新工具,通过聚合社区洞察和生成项目结构,帮助用户快速理解复杂的开源项目。
Z.ai(智谱)公司正式上线了一款名为Zread.ai的新工具,旨在帮助用户阅读和理解复杂的开源项目。该功能类似于Cognition推出的DeepWiki,优点是支持中文,目前已经索引了大部分热门开源项目,冷门代码仓库可以申请发起索引。
具体来说,用户只需粘贴一个GitHub链接,该工具即可生成清晰的项目结构和易于遵循的指南。Zread.ai还推出了一个名为“Buzz”的特色功能,该功能能够首次聚合展示来自社区的真实洞察,包括相关的commits、issues和新闻。
http://zread.ai https://x.com/Zread_ai/status/
月之暗面(Moonshot AI)正式发布了其
Kimi K2模型的完整技术报告,并已在
GitHub上公开。
月之暗面(Moonshot AI)发布了其Kimi K2模型的完整技术报告,相关文档已上传至GitHub。

https://github.com/MoonshotAI/Kimi-K2/blob/main/tech_report.pdf
Google宣布其
Gemini模型的原生文本转语音(TTS)功能已达到生产就绪状态,支持
Gemini 2.5 Flash和
Gemini 2.5 Pro模型。
Google宣布Gemini模型的原生文本转语音(TTS)功能现已适用于规模化的生产环境。
该功能同时支持Gemini 2.5 Flash和Gemini 2.5 Pro两个模型。据官方人员透露,这项强大的功能适用于多种用例,例如创建类似NotebookLM风格的播客内容。
该功能可以通过 AI Studio 和 Gemini API 体验使用。
https://x.com/OfficialLoganK/status/ https://ai.google.dev/gemini-api/docs/speech-generation
来自
字节跳动(ByteDance)的神秘新视频模型
Waver 1.0已现身
Video Arena排行榜,并直接冲入第三名。
一个名为“Waver 1.0”的神秘新视频模型已出现在Video Arena排行榜上。该模型来自字节跳动(ByteDance),并在榜单上直接进入了第三名的位置。

https://x.com/koltregaskes/status/
行业传闻称,
OpenAI正准备发布其文生视频模型的下一代版本
Sora 2,以与
Google的
Veo 3等模型竞争。
根据行业传闻,OpenAI似乎正在准备发布其文生视频模型的下一代版本Sora 2。
据称,新模型旨在与Google的Veo 3等模型竞争,并可能包含生成更长视频以及集成音频功能等新特性。

https://x.com/AILeaksAndNews/status/
作者橘鸦Juya,视频版在同名哔哩哔哩。如果对你有所帮助,欢迎点赞、关注、分享。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/259897.html原文链接:https://javaforall.net
