阿里通义Fun-ASR语音模型升级垂直领域识别率跃升超15%-AI资讯-鲸弘科技-广东鲸弘科技有限公司

阿里通义Fun-ASR语音模型升级垂直领域识别率跃升超15%

发布人：鲸弘科技

发布时间：2025-08-23

浏览量：170 次

本文由广东鲸弘科技有限公司提供惠州小程序开发 / 网站建设专业分享。

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR，该模型通过强化上下文感知与高精度转写能力，在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示，保险行业准确率较前代提升18%，家装、畜牧等领域增幅达15%-20%。

作为大语言模型驱动的语音识别算法，Fun-ASR采用自研语音算法与Qwen3监督微调技术，结合前沿模型架构与文本模态对齐技术，在保持语言处理优势的同时，集成RAG检索增强方案，支持超1000个自定义热词导入。该功能可自动匹配音频中的领域热词、历史文档及上下文记录，显著优化特定场景下的关键词识别效果。

针对语音识别中的噪声干扰、语种混淆及生成幻觉等痛点，研发团队创新性引入强化学习（RL）技术，通过动态优化策略减少识别误差，系统稳定性与可靠性获实质性提升。值得关注的是，模型在四川话、粤语、闽南语等方言识别中表现优于同类产品，同时适应远场拾音、近场降噪等复杂声学环境，覆盖会议室、工位、超市、户外等多元场景。

训练数据层面，Fun-ASR基于上亿小时音频数据构建，深度融合互联网、科技、畜牧、汽车等十余个领域的专业术语库。这一数据优势使其在垂直行业识别中展现出显著优势，例如在畜牧行业可精准识别牲畜叫声与环境噪声中的关键指令。

阿里通义技术团队表示，Fun-ASR的进化标志着语音识别技术从通用场景向专业化、场景化深度渗透。随着模型在更多行业落地，其动态热词更新与多模态交互能力将进一步推动语音交互效率革新。

推荐专题

AI大模型时代，广东制造企业官网怎么做才能被豆包、DeepSeek优先推荐？

一周AI大事件总结（4.27-5.3）：GPT-4o发布、国产模型反超、具身智能迈入产业化

一周 AI 大事件（4.20-4.26）：OpenAI 升级、DeepSeek 融资、具身智能规模化

2026年4.14-4.20 AI大事件汇总：模型迭代+产业落地+政策扶持，AI行业迎爆发期

今日 AI 大事件：大模型 / 算力 / 安全 / 应用全梳理

2026 年 4 月 14 日 AI 行业有哪些新动态？一文看懂

科技服务行业 AI 日报 | 2026 年 4 月 9 日技术与商业化进展

广东 AI 动态 | 2026 年 4 月 7 日本地企业 AI 应用与政策

企业 AI 落地参考：2026 年 4 月 5 日 AI 应用案例与趋势