Math 5 - 搜索 News

11 天

阿里云通义Qwen2.5-Math-PRM：7B模型超越GPT-4o，数学推理新突破

1月16日消息，阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸，其在推理过程中的表现显著优于现有的开源模型，尤其在推理错误识别方面，7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性，也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...

11 天

阿里云推出Qwen2.5-Math-PRM模型，7B比GPT-4o更强大

在数学推理领域，阿里云再次震撼科技界，推出了其全新的过程奖励模型——Qwen2.5-Math-PRM。于1月16日发布的这一创新，涵盖了72B及7B两种尺寸，表现显著优于同类开源模型，尤其在推理错误的识别能力上，7B版本竟然超越了广受关注的GPT-4o。

11 天

阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准

在科技快速发展的今天，阿里云再一次为人工智能领域推陈出新。1月16日，钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出，标志着在72B与7B尺寸下，其性能远超同类开源过程奖励模型。

腾讯网8 小时

全球掀DeepSeek复现狂潮

来源：新智元作者编辑部HYZ 原标题《全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻》就在刚刚，网上已经出现了一波复现DeepSeek的狂潮。

16 天on MSN

微软 rStar-Math“导师”技术登场：教小语言模型突破数学推理

IT之家 1 月 11 日消息，微软亚洲研究院旗下数学和人工智能研究团队昨日（1 月 10 日）发布博文，针对小语言模型，设计并开发了 rStar-Math 技术，专门用于解决数学问题。和微软之前推出的 Phi-4 不同，rStar-Math ...

腾讯网10 天

阿里云通义开源全新数学推理过程奖励模型Qwen2.5-Math-PRM

多知1月17日消息，通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，包括72B和7B两个版本，将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度，自动识别推理过程中的错误，如计算或逻辑错误，这些错误可能导致不正确的结论，即使最终答案正确，也可能削弱模型推理过程的可信度。在识别推理错误步 ...