type
status
date
slug
summary
tags
category
icon
password
蚂蚁集团推出 Ling‑1T 万亿参数 AI 模型,发力高级推理能力
近日,蚂蚁集团宣布开源其全新语言模型 Ling‑1T,这一万亿参数规模的模型被定位为在计算效率和复杂推理能力之间达成平衡的重要成果。
10 月 9 日的消息显示,作为支付宝背后的技术支持方,蚂蚁集团正在加速建设涵盖多种架构的人工智能体系。此次发布的 Ling‑1T 在处理复杂数学问题方面展现出不俗实力,在 2025 年美国邀请数学竞赛(AIME)测试中准确率达到 70.42%,这一成绩通常用于评估 AI 系统解决实际数学题的能力。
据官方技术指标,Ling‑1T 不仅表现优异,同时对资源的消耗也得到了控制,平均每次解题输出超过 4,000 个 token,体现出结果质量与运行效率的结合,被誉为“目前业界领先的 AI 模型”之一。
同步发布 dInfer 推理框架
与 Ling‑1T 同时推出的还有 dInfer——一个专为扩散语言模型设计的推理系统。这两个项目的联合亮相表明,蚂蚁集团并不满足于单一技术路径,而是希望多线推进人工智能研发。
扩散语言模型的工作方式不同于目前主流的自回归结构,如支撑 ChatGPT 的系统。后者是按照顺序逐词生成文本,而扩散模型则是并行生成内容。虽然这种机制在图像和视频生产中有广泛应用,但在语言建模领域尚属前沿尝试。
性能数据显示,dInfer 在蚂蚁自研的 LLaDA‑MoE 扩散模型上运行 HumanEval 编程基准测试时,达到了 1,011 token/s 的速度,远高于 Nvidia Fast‑dLLM 的 91 token/s,以及阿里巴巴 Qwen‑2.5‑3B 模型在 vLLM 上运行的 294 token/s。
研究人员指出:“dInfer 不仅是一套实用工具,也是一个标准化平台,有助于加快扩散语言模型领域的开发进程。”
构建完整的 AI 技术矩阵
Ling‑1T 是蚂蚁近期一系列 AI 产品的组成部分。目前,该公司的模型家族已划分为三大类别:
- Ling 系列:专注于基础文本任务,无需深度推理;
- Ring 系列:强调思考与分析能力,Ring‑1T‑preview 已经发布;
- Ming 系列:融合图像、文字、音频和视频的多模态能力。
同时,蚂蚁也在探索 MoE(Mixture of Experts)模型结构,通过只激活完成特定任务所需的模块,以提高模型效率。例如 LLaDA‑MoE 就是一个实验性成果,展示了其在灵活性与性能之间的潜力。
公司首席技术官何正宇表示:“我们始终认为,通用人工智能应是公共基础设施,是人类未来智能发展的共同成果。”他认为,开放万亿参数模型和 Ring 系列预览版本,正是迈向协作创新的关键一步。
国内科技企业的突围之路
当前,中国 AI 行业面临芯片出口限制带来的挑战,获取高端半导体设备日益困难。在这样的背景下,越来越多企业将目光转向算法优化和软件架构上的自主创新。
同样涉足扩散语言模型的还有字节跳动。今年 7 月,他们发布了 Seed Diffusion Preview,声称在生成速度上比传统自回归架构快了约 五倍。这显示出科技界对于非传统模型路径的高度关注。
尽管如此,扩散语言模型尚未成为主流选择。自回归系统因其在语义理解和连续文本生成方面的成熟度,依然是客户导向型产品的首选。但随着 Ling‑1T 和 dInfer 的出现,新的可能性正在浮现。
开源成为差异化策略
不同于部分公司采用封闭路线的做法,蚂蚁选择将 Ling‑1T 模型及其推理框架 dInfer 对外开放。这不仅有助于加快技术验证,也彰显了其致力于打造共享基础平台的战略意图。
此外,蚂蚁还在发展名为 AWorld 的持续学习框架,目标在于构建可以自主执行任务的 AI 代理系统。这类努力意味着公司在从服务工具提供者角色,向底层能力建设者转型。
从长远来看,能否在全球 AI 领域占据一席之地,取决于两个关键因素:
- 技术在现实场景中的真实表现;
- 开发者社区的实际接受度和参与程度。
Ling‑1T 的开源特性恰好为这两点提供了入口。它有望吸引一批热衷前沿技术的开发者群体,并推动整个生态系统的联动创新。
种种动作也在说明:中国顶级科技力量已经认定当前人工智能格局仍有足够的空间,可供具备综合创新能力的新玩家入场竞争。
- 作者:数字Baby
- 链接:myaigc.top/article/28eb7c2d-0e98-8198-b982-dd19899949a4
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。