中国科学院新疆理化技术研究所机构知识库
Advanced  
XJIPC OpenIR  > 多语种信息技术研究室  > 期刊论文
题名: 汉维统计机器翻译中的形态学处理
其他题名: morphology processing in chinese-uyghur statistical machine translation
作者: 董兴华; 陈丽娟; 周喜; 周俊林; 吐尔洪·吾司曼
关键词: Chinese-Uyghur ; statistical machine translation ; morpheme ; reordering
刊名: 计算机工程
发表日期: 2011
卷: 37, 期:12, 页:150-152
资助者: 中国科学院西部行动计划高新技术基金资助项目(KGCX2-YN-507)
摘要: 针对汉语和维吾尔语语序差别(前者是主-谓-宾结构,后者是主-宾-谓结构)及形态差别较大的问题,通过编写调序规则将汉语调整为主-宾-谓结构,将维吾尔语单词切分为词干、词缀等更小的词素单元来训练统计模型,同时测试词素的切分粒度对翻译性能的影响。实验结果表明,对汉语句法结构的调整及以词干、词缀等更小的词素形式参与训练可以有效提高翻译质量。
英文摘要: For the large differences of syntactic structure between Chinese and Uyghur,it composes rules to reorder the structure of Chinese sentences to that of Uyghur.For the large morphological differences between Chinese and Uyghur,it splits Uyghur words into stems and affixes,that is,morphemes,to train the statistical model.Meanwhile,it tests the effects of splitting granularities on translation performance.Experimental results show Chinese sentence reordering and splitting Uyghur words into morphemes can effectively improve the performance of translation system.
内容类型: 期刊论文
URI标识: http://ir.xjipc.cas.cn/handle/365002/1561
Appears in Collections:多语种信息技术研究室_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
汉维统计机器翻译中的形态学处理.pdf(1031KB)期刊论文作者接受稿开放获取View 联系获取全文

作者单位: 中国科学院新疆理化技术研究所;中国科学院新疆分院

Recommended Citation:
董兴华,陈丽娟,周喜,等. 汉维统计机器翻译中的形态学处理[J]. 计算机工程,2011,37(12):150-152.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[董兴华]'s Articles
[陈丽娟]'s Articles
[周喜]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[董兴华]‘s Articles
[陈丽娟]‘s Articles
[周喜]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
文件名: 汉维统计机器翻译中的形态学处理.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Powered by CSpace