Meta首席执行官扎克伯格在脸书个人主页发文说,新数据中心的占地面积足以覆盖纽约曼哈顿大部分地区。Meta也计划今年让约1吉瓦的计算能力上线,预计数据中心到今年底将拥有超过130万个图形处理器(GPU)。
近期,A股半导体公司密集披露2024年度的业绩预告。数据显示,截至1月23日18点,在161家半导体上市公司中已有84家发布业绩预告,其中近六成公司业绩预喜(含预增、扭亏、减亏)。
快科技1月25日消息,中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。 该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。 在多项权威评测中,TeleAI ...
AMD近期宣布了一项重大进展,成功将经过优化的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这一模型通过SGLang进行了强化,专为AI推理设计,旨在提升性能。
近期,随着AI技术的迅猛发展,AI生成的美女写真作品引发了广泛关注。借助AI绘图工具,不仅普通用户可以轻松拥有个性化的美女图片,连一些艺术创作者也逐渐青睐于此。这种新的创作方式不再依赖摄影师,而是通过简洁易懂的提示词生成,极大提升了创作的便利性与趣味 ...
MiniMax-01 系列模型首次将线性注意力机制扩展到商用模型的级别,并使其综合能力达到全球第一梯队。而受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从 Scaling Law、与 MoE 的结合、结构设计、训练优化和推理优化等层面综合考虑,MiniMax 选择模型参数量为 4560 亿,其中每次激活 459 亿,能够高效处理高达 400 万 token ...
1月21日,美图公司旗下高品质AI素材生成器WHEE预告上线“AI中文海报“新功能。该功能突破性地解决了AI在中文字体生成中变形、乱码的难题,这也是目前市面上唯一一款支持中文海报文字自定义的AI产品。
就说这个本周刚发布的 DeepSeek R1,它没有任何监督训练的纯强化学习路线令人震撼,从去年 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的思维链能力,似乎是很快达成的事。
在过去的几年中,许多人都在询问:AI到底能为我们解决什么问题?随着智能手机的普及和各种应用程序的涌现,用户的信息过载和隐私担忧愈加严重。根据一项调查显示,超过70%的用户担心个人数据被不当使用。此外,市场上的AI解决方案往往无法满足个性化的需求,导致 ...