蚂蚁集团发布万亿参数大模型 Ling-1T:国产开源 AI 的 “推理 + 生成” 双突破



2025 年 10 月 8 日,蚂蚁集团通过社交媒体平台 “X” 官方账号正式官宣 —— 首款旗舰级语言模型 Ling-1T 重磅亮相。这款参数规模达 1 万亿的大模型,不仅填补了国产开源领域万亿级参数模型的关键空白,更在推理效率、代码生成、数学求解等核心能力上实现突破,直接对标国际顶尖开源与闭源模型,为国产 AI 技术的规模化应用注入新动力。
万亿参数背后:“高效激活” 的技术巧思
不同于传统万亿级模型 “全参数运行” 的高耗模式,Ling-1T 采用了创新的架构设计:在 1 万亿总参数基础上,实现每 token 约 500 亿活跃参数的高效配置,搭配 1/32 的 MoE(混合专家系统)激活比例,既保留了大模型的认知广度,又大幅降低了推理过程中的算力消耗。这种 “轻量激活 + 海量储备” 的设计,让它在复杂任务中既能快速响应,又能保持高精度输出。
为了夯实模型能力底座,Ling-1T 的训练过程堪称 “精雕细琢”。它首先在 20 万亿 + 高质量 token 语料库中完成预训练,其中后期训练数据中推理密集型内容占比超 40%,为模型打下扎实的知识与逻辑基础;随后创新性地采用 “中训练 + 后训练” 的两阶段思维链优化:中训练阶段引入精选思维链语料,实现 “推理预激活”,让模型提前掌握逻辑分析的基本方法;后训练阶段则通过 “进化式思维链(Evo-CoT)” 持续提升推理深度,同时借助 “语言单元策略优化(LPO)” 算法,以句子为语义单位实现奖励与推理行为的精准对齐,进一步保障了训练稳定性与任务泛化能力。
能力实测:从 “解难题” 到 “做应用” 的全面领先
在实际能力测试中,Ling-1T 的表现堪称 “全能选手”,尤其在高难度任务中展现出超越同类模型的优势。
数学推理领域,它不仅能应对常规专业数学问题,更在竞赛级题目中崭露头角。在 2025 年 AIME(美国数学邀请赛) benchmark 中,它突破了 “推理准确率与推理长度” 的帕累托边界,实现 “高效思考 + 精准求解” 的双重目标;面对空间几何优化、复杂方程建模等难题,它不仅能快速给出正确答案,还能提供多种解题方案并验证可行性,展现出类人类的逻辑分析能力。在 UG Math Bench(大学数学基准测试)中,其得分达 74.95,超越 DeepSeek-V3.1-Terminus(72.70)、Kimi-K2-Instruct-0905(69.97)等开源竞品,甚至逼近闭源模型 Gemini 2.5 Pro(70.10)。
代码生成领域,Ling-1T 更是将 “功能性” 与 “美观性” 完美结合。它创新性地引入 “混合语法 - 功能 - 美学奖励机制”,生成的代码不仅逻辑正确、可直接运行,还能兼顾前端视觉设计的美感。在 Artifacts Bench(前端开发基准测试)中,它位列开源模型第一,甚至页面中的基准测试可视化图表,均由模型自行生成;在 LiveCodeBench(2024.08-2025.05)测试中,其得分高达 61.68,远超第二名 Kimi-K2-Instruct-0905(48.95),在实际应用中,它能独立完成诺贝尔奖官网这类复杂页面的内容生成与代码编写,结构清晰且信息完整度高。
除了专业领域,Ling-1T 在生活化场景中也表现出色。例如用户提出旅行规划需求时,它能结合目的地天气、景点分布、交通方式等多维度信息,制定出兼顾效率与体验的个性化行程,甚至能根据用户偏好调整住宿与美食推荐,展现出极强的场景适配能力。
国产 AI 竞争新变量:开源生态与实用导向的双重价值
随着大模型技术进入 “百模争鸣” 的新阶段,Ling-1T 的推出为国产 AI 竞争格局带来了关键变量。一方面,作为开源模型,它打破了万亿级参数模型 “闭源垄断” 的局面 —— 开发者可通过 Hugging Face(https://huggingface.co/inclusionAI/Ling-1T)或 ModelScope(国内镜像)直接下载使用,支持 32K 至 128K 的超长上下文长度,同时提供离线推理、API 调用等多种部署方式,大幅降低了大模型在企业级应用中的使用门槛。
另一方面,Ling-1T 的技术路径也为国产 AI 发展提供了新方向:它不追求 “参数规模的盲目堆砌”,而是通过架构创新、训练策略优化实现 “效率与性能的平衡”,这种 “实用导向” 的研发思路,更符合产业界对大模型 “低成本、高可用” 的需求。未来,随着模型在多轮交互、长期记忆、工具使用等方面的持续优化,它有望在金融分析、工业设计、教育辅助等领域落地更多场景,推动 AI 技术从 “实验室” 走向 “产业界”。
从技术突破到生态开放,Ling-1T 不仅是蚂蚁集团在 AI 领域的 “旗舰之作”,更代表着国产大模型向 “高效化、实用化、开源化” 迈进的重要一步。在全球 AI 竞争日益激烈的当下,这样的探索无疑将为国产 AI 的持续发展注入更强信心与动力。
-
李飞飞团队重磅发布 Marble:一张图生成 3D 世界,空间智能迎来新突破2025-09-2121
-
Apertus:瑞士开源大模型的破局之作,以多语言与透明性重塑 AI 生态2025-09-0616
-
NVIDIA Nemotron Nano 2 – 英伟达推出的高效推理模型2025-08-2034
-
美团 LongCat-Flash-Chat 开源:560B 参数 MoE 模型引领高效 AI,100+tokens/s 推理 + 5 元 / 百万 token 低成本落地2025-09-01177
-
谷歌垄断案 “阶段性胜利” 背后:核心资产保住了,但监管风暴远未平息2025-09-0613
-
美团 AI 生活小秘书 “小美”:解锁便捷生活新方式2025-09-1317
-
阿里通义Fun-ASR语音模型升级 垂直领域识别率跃升超15%2025-08-2318
-
Skywork Super Agents 新上线!AI Developer 打破全栈开发壁垒,非专业者也能轻松建站2025-09-2115
-
CodeBuddy IDE 国内版公测开启:免邀请码直通 DeepSeek V3.1,一个人活成一整个开发团队2025-08-2332
-
全球首个动漫制作神器 “萌动 AI” 国内登场:免费不限次,人人都能当动漫导演2025-10-0118