XJIPC OpenIR  > 多语种信息技术研究室
基于先验概率线性插值的声学模型自适应方法
王丽; 张震; 张鹏远; 颜永红
2017
会议名称第十四届全国人机语音通讯学术会议
会议日期2017-10-11
会议地点中国江苏连云港
摘要

基于DNN的声学模型自适应算法是语音识别领域中重要的研究方向,自适应技术是通过少量的自适应数据优化基线模型,解决由于目标测试数据与训练数据不匹配而导致的识别性能下降的问题。实际上,少量的自适应数据几乎无法描述所有目标测试数据的分布隋况,因此通过自适应数据统计得到的先验概率同样缺乏通用性。文章中针对这个问题,提出了基于先验概率线性插值的声学模型自适应方法,该方法将自适应数据的先验与基线模型的先验进行线性插值, 使先验知识不仅融合了测试数据信息而且更具有通用性。实验证明, 通过线性插值的先验可以有效改善识别性能。

关键词声学模型自适应 深度神经网络 先验概率
文献类型会议论文
条目标识符http://ir.xjipc.cas.cn/handle/365002/5372
专题多语种信息技术研究室
作者单位1.中国科学院声学研究所语言声学与内容理解重点实验室
2.国家计算机网络应急技术处理协调中心
3.中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
4.中国科学院大学
推荐引用方式
GB/T 7714
王丽,张震,张鹏远,等. 基于先验概率线性插值的声学模型自适应方法[C],2017.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于先验概率线性插值的声学模型自适应方法(970KB)会议论文 开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[王丽]的文章
[张震]的文章
[张鹏远]的文章
百度学术
百度学术中相似的文章
[王丽]的文章
[张震]的文章
[张鹏远]的文章
必应学术
必应学术中相似的文章
[王丽]的文章
[张震]的文章
[张鹏远]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 基于先验概率线性插值的声学模型自适应方法.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。