XJIPC OpenIR  > 多语种信息技术研究室
卷积神经网络声学模型的结构优化和加速计算
王智超; 徐及; 张鹏远; 颜永红
2018
Source Publication重庆邮电大学学报(自然科学版)
ISSN1673-825X
Volume30Issue:3Pages:416-422
Abstract

将卷积神经网络(convolutional neural networks,CNN)声学模型应用于中文大词表连续电话语音识别任务中,分析了卷积层数、滤波器参数等变量对CNN模型性能的影响,最终在中文电话语音识别测试中,CNN模型相比传统的全连接神经网络模型取得了识别字错误率1.2%的下降。由于卷积结构的复杂性,常规的神经网络加速方法如定点量化和SSE指令加速等方法对卷积运算的加速效率较低。针对这种情况,对卷积结构进行了优化,提出了2种卷积矢量化方法:权值矩阵矢量化和输入矩阵矢量化对卷积运算进行改善。结果表明,输入矩阵矢量化方法的加速效率更高,结合激活函数后移的策略,使得卷积运算速度提升了8.9倍。

Keyword语音识别 声学模型 卷积神经网络 矢量化
DOI10.3979/j.issn.1673-825X.2018.03.017
Indexed ByCSCD
CSCD IDCSCD:6268313
Citation statistics
Document Type期刊论文
Identifierhttp://ir.xjipc.cas.cn/handle/365002/5416
Collection多语种信息技术研究室
Affiliation1.中国科学院语言声学与内容理解重点实验室
2.中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
Recommended Citation
GB/T 7714
王智超,徐及,张鹏远,等. 卷积神经网络声学模型的结构优化和加速计算[J]. 重庆邮电大学学报(自然科学版),2018,30(3):416-422.
APA 王智超,徐及,张鹏远,&颜永红.(2018).卷积神经网络声学模型的结构优化和加速计算.重庆邮电大学学报(自然科学版),30(3),416-422.
MLA 王智超,et al."卷积神经网络声学模型的结构优化和加速计算".重庆邮电大学学报(自然科学版) 30.3(2018):416-422.
Files in This Item:
File Name/Size DocType Version Access License
卷积神经网络声学模型的结构优化和加速计算(636KB)期刊论文作者接受稿开放获取CC BY-NC-SAView Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[王智超]'s Articles
[徐及]'s Articles
[张鹏远]'s Articles
Baidu academic
Similar articles in Baidu academic
[王智超]'s Articles
[徐及]'s Articles
[张鹏远]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[王智超]'s Articles
[徐及]'s Articles
[张鹏远]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 卷积神经网络声学模型的结构优化和加速计算.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.