XJIPC OpenIR  > 多语种信息技术研究室
面向维汉机器翻译的语料筛选技术研究
孔金英;  杨雅婷;  王磊;  李晓
2016
发表期刊计算机应用研究
ISSN1001-3695
卷号33期号:12页码:3654-3657
摘要

统计机器翻译是近十年来的主流机器翻译技术,其在维汉机器翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终翻译性能同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用这些方法筛选而来的语料训练出的维汉翻译模型的性能更优。

关键词维汉机器翻译 语料筛选 语言模型
DOI10.3969/j.issn.1001-3695.2016.12.030
收录类别CSCD
CSCD记录号CSCD:5873831
引用统计
文献类型期刊论文
条目标识符http://ir.xjipc.cas.cn/handle/365002/4500
专题多语种信息技术研究室
作者单位中国科学院新疆理化技术研究所;新疆民族语音语言信息处理重点实验室;中国科学院大学
推荐引用方式
GB/T 7714
孔金英;杨雅婷;王磊;李晓;. 面向维汉机器翻译的语料筛选技术研究[J]. 计算机应用研究,2016,33(12):3654-3657.
APA 孔金英;杨雅婷;王磊;李晓;.(2016).面向维汉机器翻译的语料筛选技术研究.计算机应用研究,33(12),3654-3657.
MLA 孔金英;杨雅婷;王磊;李晓;."面向维汉机器翻译的语料筛选技术研究".计算机应用研究 33.12(2016):3654-3657.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
面向维汉机器翻译的语料筛选技术研究.pd(389KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[孔金英;杨雅婷;王磊;李晓;]的文章
百度学术
百度学术中相似的文章
[孔金英;杨雅婷;王磊;李晓;]的文章
必应学术
必应学术中相似的文章
[孔金英;杨雅婷;王磊;李晓;]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 面向维汉机器翻译的语料筛选技术研究.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。