XJIPC OpenIR  > 多语种信息技术研究室
基于递归神经网络的语音识别快速解码算法
张舸;  张鹏远;  潘接林;  颜永红
2017
发表期刊电子与信息学报
卷号39期号:4页码:930-937
摘要递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。
关键词语音识别 递归神经网络 解码器 跳帧计算
文献类型期刊论文
条目标识符http://ir.xjipc.cas.cn/handle/365002/4754
专题多语种信息技术研究室
作者单位中国科学院声学研究所语言声学与内容理解重点实验室;中国科学院大学;中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
第一作者单位中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
张舸;张鹏远;潘接林;颜永红. 基于递归神经网络的语音识别快速解码算法[J]. 电子与信息学报,2017,39(4):930-937.
APA 张舸;张鹏远;潘接林;颜永红.(2017).基于递归神经网络的语音识别快速解码算法.电子与信息学报,39(4),930-937.
MLA 张舸;张鹏远;潘接林;颜永红."基于递归神经网络的语音识别快速解码算法".电子与信息学报 39.4(2017):930-937.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于递归神经网络的语音识别快速解码算法.(371KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[张舸;张鹏远;潘接林;颜永红]的文章
百度学术
百度学术中相似的文章
[张舸;张鹏远;潘接林;颜永红]的文章
必应学术
必应学术中相似的文章
[张舸;张鹏远;潘接林;颜永红]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 基于递归神经网络的语音识别快速解码算法.pdf
格式: Adobe PDF
此文件暂不支持浏览
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。