Qwen2 大模型架构图

实测腾讯混元T1正式版.vs.DeepSeek.vs.Qwen2.5-Max,推理能力哪家强？

此次测试的选手是大家熟知的DeepSeek R1、Qwen2.5-Max以及腾讯新出的混元T1正式版。先来一道简单的推理题开开胃。测试题一：谁说谎？有三个人 ...

分析表明，DeepSeek-V3-Base 已经展现出「顿悟时刻」，而 Qwen2.5 基础模型即使没有提示模板也表现出强大的推理能力，这表明存在潜在的预训练偏差。

ByteDance advances DeepSeek work in AI reasoning with open-source project led by intern

2024 using Alibaba Group Holding’s Qwen2.5-32B base model, compared with 47 points attained by R1 when applying the same Alibaba model, the paper showed. Alibaba owns the South China Morning Post.

新浪网9d

超越DeepSeek GRPO的关键RL算法，字节、清华AIR开源DAPO

此外，使用该算法训练的模型也将在近期开源发布。使用该算法，该团队成功让 Qwen2.5-32B 模型在 AIME 2024 基准上获得了 50 分，优于同等规模的 ...

腾讯网28d

DeepSeek五连发，通义三“王炸”，杭州成了开源之都

DeepSeek的开源周刚过半，同城的阿里巴巴开始推波助澜，前一日宣布了Qwen2.5-Max与推理版QwQ-Max的开源计划，第二天又正式开源了Wan2.1（万相）视频模型。

Hosted on MSN22d

通义灵码Qwen2.5-Max登顶编程能力榜，AI程序员新体验全面升级！

近期，通义灵码迎来了一次重要更新，正式推出了全新的模型选择功能，除了继续支持DeepSeek满血版V3和R1外，还引入了备受瞩目的Qwen2.5-Max模型。

第一财经23d

杭州：开展阿里巴巴集团云和AI投资计划本地配套供应商摸排

阿里巴巴第三季度营收超预期，公司2025财年第三季度营收2801.5亿元人民币，同比增长8%。吴泳铭透露，阿里会在近期发布基于Qwen2.5-Max的深度推理 ...

每经网29d

重磅！阿里万相，开源

从2023年开始，阿里云就坚定大模型开源路线。自2023年8月起，阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型，囊括了0.5B、1.5B、3B、7B、14B、32B ...

DOIT29d

阿里巴巴宣布未来三年投入超3800亿元加码算力基建，AI驱动行业需求激增

近日，阿里云再次传来振奋人心的消息。据财联社报道，阿里推出了基于混合专家（MoE）架构的旗舰版模型Qwen2.5-Max。这一模型的推出，不仅标志着阿里云在AI技术研发上迈出了坚实的一步 ...

财经网29d

阿里万相大模型正式开源！全模态、全尺寸大模型开源

从2023年开始，阿里云就坚定大模型开源路线。自2023年8月起，阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型，囊括了0.5B、1.5B、3B、7B、14B、32B ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results