30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界

发布人：鲸弘科技

发布时间：2025-11-18

浏览量：75 次

一、AI 进入 “实干时代”：你需要的是 “能动手” 的助手

打开手机应用商店，AI 助手类 App 琳琅满目，但多数难逃两个痛点：要么是只会复述信息的 “高级复读机”，要么是机械搬运内容的 “信息中介”。我们真正需要的，是一个能听懂想法、落地创意的 “实干派”—— 既能用自然语言沟通，又能直接生成可用、可玩、可交互的成果。

2025 年，AI 行业正从 “能聊” 向 “能干” 全面转型：OpenAI 的 Atlas 实现 AI 操作电脑，Google Gemini 3.0 强化多模态执行能力，而蚂蚁集团最新推出的全模态通用 AI 助手 “灵光”，则把这种 “说话即操作” 的体验装进了手机。它不绕弯子、直奔结果，用对话作为起点，把脑子里的想法变成眼前的实际成果，重新定义了手机 AI 助手的核心价值。

二、灵光是什么？—— 对话即行动的全模态 AI

灵光的交互界面延续了熟悉的对话窗口，无需复杂操作，用自然语言发起请求即可（比如 “查询这款咖啡的热量”“规划周末广州短途游”），极大降低了上手门槛。但和普通 AI 助手不同，每一次对话对灵光而言都是一次 “行动指令” —— 它不会只返回文字，而是根据需求生成图文、3D 模型、交互地图甚至独立工具，让信息从 “被动接收” 变成 “主动体验”。

作为业界首款聚焦 “创意落地” 的手机全模态 AI 助手，灵光的核心优势在于：以自然语言为入口，整合文本、图像、3D、地图、应用生成等多维度能力，通过多智能体协作，实现 “想法 - 成果” 的一步直达，真正成为用户的 “移动创意合伙人”。

三、实测 3 大核心能力：不止好看，更能解决实际问题

（一）3D + 图文：让答案 “看得见、摸得着”

面对 “广州塔的建筑设计有何特别之处” 这类需要可视化理解的问题，普通 AI 只会返回大段文字，而灵光直接生成了可交互的 3D 建筑模型—— 支持旋转、缩放，能清晰看到广州塔的双面扭转结构、斜交网状外筒设计，甚至能放大观察节点连接细节。

这种 “文本 + 3D + 结构动画” 的整合输出，就像在对话中嵌入了一份实时生成的 “动态解说报告”。无论是建筑专业学生做课题、城市爱好者了解地标，还是游客提前做攻略，都能省去搜索、拼凑资料的时间，直观 get 核心信息。

（二）交互地图：需求落地即 “可用”

紧接着追问 “规划广州塔附近的美食打卡行程”，灵光瞬间理解 “附近” 的地理范围，生成了可缩放、可点击的交互地图—— 标注了 7 家风格各异的小店（从早茶到网红甜品），还设计了 “避开人流的隐藏路线”。每个点位都附带推荐理由、评分、营业时间，甚至自动估算步行距离和时间，点击就能查看详细信息，直接截图就能用作出行攻略。

这种 “对话即规划、规划即可用” 的体验，在手机 AI 助手中十分罕见。它不再是 “提供信息”，而是 “完成任务”，把抽象的 “行程规划” 变成了可直接执行的工具。