XJIPC OpenIR  > 多语种信息技术研究室
卷积神经网络声学模型的结构优化和加速计算
王智超; 徐及; 张鹏远; 颜永红
2018
发表期刊重庆邮电大学学报(自然科学版)
ISSN1673-825X
卷号30期号:3页码:416-422
摘要

将卷积神经网络(convolutional neural networks,CNN)声学模型应用于中文大词表连续电话语音识别任务中,分析了卷积层数、滤波器参数等变量对CNN模型性能的影响,最终在中文电话语音识别测试中,CNN模型相比传统的全连接神经网络模型取得了识别字错误率1.2%的下降。由于卷积结构的复杂性,常规的神经网络加速方法如定点量化和SSE指令加速等方法对卷积运算的加速效率较低。针对这种情况,对卷积结构进行了优化,提出了2种卷积矢量化方法:权值矩阵矢量化和输入矩阵矢量化对卷积运算进行改善。结果表明,输入矩阵矢量化方法的加速效率更高,结合激活函数后移的策略,使得卷积运算速度提升了8.9倍。

关键词语音识别 声学模型 卷积神经网络 矢量化
DOI10.3979/j.issn.1673-825X.2018.03.017
收录类别CSCD
CSCD记录号CSCD:6268313
引用统计
文献类型期刊论文
条目标识符http://ir.xjipc.cas.cn/handle/365002/5416
专题多语种信息技术研究室
作者单位1.中国科学院语言声学与内容理解重点实验室
2.中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
推荐引用方式
GB/T 7714
王智超,徐及,张鹏远,等. 卷积神经网络声学模型的结构优化和加速计算[J]. 重庆邮电大学学报(自然科学版),2018,30(3):416-422.
APA 王智超,徐及,张鹏远,&颜永红.(2018).卷积神经网络声学模型的结构优化和加速计算.重庆邮电大学学报(自然科学版),30(3),416-422.
MLA 王智超,et al."卷积神经网络声学模型的结构优化和加速计算".重庆邮电大学学报(自然科学版) 30.3(2018):416-422.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
卷积神经网络声学模型的结构优化和加速计算(636KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[王智超]的文章
[徐及]的文章
[张鹏远]的文章
百度学术
百度学术中相似的文章
[王智超]的文章
[徐及]的文章
[张鹏远]的文章
必应学术
必应学术中相似的文章
[王智超]的文章
[徐及]的文章
[张鹏远]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 卷积神经网络声学模型的结构优化和加速计算.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。