搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
11 天
阿里云通义Qwen2.5-Math-PRM:7B模型超越GPT-4o,数学推理新突破
1月16日消息,阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸,其在推理过程中的表现显著优于现有的开源模型,尤其在推理错误识别方面,7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性,也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...
11 天
阿里云推出Qwen2.5-Math-PRM模型,7B比GPT-4o更强大
在数学推理领域,阿里云再次震撼科技界,推出了其全新的过程奖励模型——Qwen2.5-Math-PRM。于1月16日发布的这一创新,涵盖了72B及7B两种尺寸,表现显著优于同类开源模型,尤其在推理错误的识别能力上,7B版本竟然超越了广受关注的GPT-4o。
11 天
阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准
在科技快速发展的今天,阿里云再一次为人工智能领域推陈出新。1月16日,钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出,标志着在72B与7B尺寸下,其性能远超同类开源过程奖励模型。
腾讯网
8 小时
全球掀DeepSeek复现狂潮
来源:新智元 作者编辑部HYZ 原标题《全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻》 就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。
16 天
on MSN
微软 rStar-Math“导师”技术登场:教小语言模型突破数学推理
IT之家 1 月 11 日消息,微软亚洲研究院旗下数学和人工智能研究团队昨日(1 月 10 日)发布博文,针对小语言模型,设计并开发了 rStar-Math 技术,专门用于解决数学问题。和微软之前推出的 Phi-4 不同,rStar-Math ...
腾讯网
10 天
阿里云通义开源全新数学推理过程奖励模型Qwen2.5-Math-PRM
多知1月17日消息,通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,包括72B和7B两个版本,将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度,自动识别推理过程中的错误,如计算或逻辑错误,这些错误可能导致不正确的结论,即使最终答案正确,也可能削弱模型推理过程的可信度。在识别推理错误步 ...
10 小时
全球掀DeepSeek复现狂潮!UC伯克利等成功复现,只用强化学习没有监督 ...
分析认为,大模型比拼的不再是动辄千万亿美元的算力战,OpenAI、Meta、谷歌这些大公司引以为傲的技术优势和高估值将会瓦解,英伟达的股价将开始动摇。从此,大模型时代很可能会进入一个分水岭:超强性能的模型不再独属于算力巨头,而是属于每个人。
13 小时
创造历史!DeepSeek超越ChatGPT登顶中美AppStore
DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。一觉醒来,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。 毕竟,正如 a16z 合伙人、Mistral 董事会成员 ...
来自MSN
4 天
如何评价 Kimi 发布的多模态推理模型 k1.5?
从技术报告看,K1.5的亮点是真的不少。
2 小时
DeepSeek新模型大揭秘,为何它能震动全球AI圈
因为根据DeepSeek的研究,模型的进步并非均匀渐进的。在强化学习过程中,响应长度会出现突然的显著增长,这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟,暗示着某种深层的认知突破。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈