阿里通义Fun-ASR语音模型升级 垂直领域识别率跃升超15%
本文由广东鲸弘科技有限公司提供惠州小程序开发 / 网站建设专业分享。

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR,该模型通过强化上下文感知与高精度转写能力,在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示,保险行业准确率较前代提升18%,家装、畜牧等领域增幅达15%-20%。
作为大语言模型驱动的语音识别算法,Fun-ASR采用自研语音算法与Qwen3监督微调技术,结合前沿模型架构与文本模态对齐技术,在保持语言处理优势的同时,集成RAG检索增强方案,支持超1000个自定义热词导入。该功能可自动匹配音频中的领域热词、历史文档及上下文记录,显著优化特定场景下的关键词识别效果。
针对语音识别中的噪声干扰、语种混淆及生成幻觉等痛点,研发团队创新性引入强化学习(RL)技术,通过动态优化策略减少识别误差,系统稳定性与可靠性获实质性提升。值得关注的是,模型在四川话、粤语、闽南语等方言识别中表现优于同类产品,同时适应远场拾音、近场降噪等复杂声学环境,覆盖会议室、工位、超市、户外等多元场景。
训练数据层面,Fun-ASR基于上亿小时音频数据构建,深度融合互联网、科技、畜牧、汽车等十余个领域的专业术语库。这一数据优势使其在垂直行业识别中展现出显著优势,例如在畜牧行业可精准识别牲畜叫声与环境噪声中的关键指令。
阿里通义技术团队表示,Fun-ASR的进化标志着语音识别技术从通用场景向专业化、场景化深度渗透。随着模型在更多行业落地,其动态热词更新与多模态交互能力将进一步推动语音交互效率革新。
广东鲸弘科技有限公司专注惠州网站建设、惠州小程序开发、企业官网定制、微信小程序开发等服务,欢迎咨询合作。
-
杭州六小龙再放大招!SpatialGen 开源:一句话生成可漫游 3D 空间,SpatialLM 1.5 将解锁机器人训练新场景
2025-08-26
94 -
阿里巴巴瓴羊发布首个数据分析 Agent:智能小 Q 升级超级 AI 分析师
2025-08-30
363 -
全球首个动漫制作神器 “萌动 AI” 国内登场:免费不限次,人人都能当动漫导演
2025-10-01
422 -
NVIDIA Nemotron Nano 2 – 英伟达推出的高效推理模型
2025-08-20
118 -
今日 AI 大事件:大模型 / 算力 / 安全 / 应用全梳理(2026.4.4)
2026-04-04
11 -
快手 AI 超级员工 Kwali:一键开启短视频创作 “躺赢” 模式
2025-09-13
532 -
AI 日报 | 2026 年 3 月 30 日 全球 AI 行业最新动态汇总
2026-03-30
78 -
一张照片解锁全球穿搭!Google AI 试衣间再升级,线上购物迎来 “真实试穿” 革命
2025-10-11
115 -
企业 AI 落地参考:2026 年 4 月 5 日 AI 应用案例与趋势
2026-04-05
22 -
中小企业如何低成本引入 AI 技术,提升竞争力?
2026-03-27
20
咨询热线:
联系电话
联系邮箱
联系QQ
方案获取
