中国科学院新疆理化技术研究所机构知识库
Advanced  
XJIPC OpenIR  > 多语种信息技术研究室  > 期刊论文
题名: 基于混合方法的维吾尔语词干提取方法研究
作者: 热娜·艾尔肯; 李晓; 艾尼宛尔·托乎提
关键词: 维吾尔语 ; 形态变化 ; 词干 ; 词缀 ; 规则方法 ; 词典方法 ; 混合方法 ; Lovin 算法
刊名: 计算机应用研究
发表日期: 2015
卷: 32, 期:1
摘要: 自然语言信息处理中,词干提取是自然语言信息处理的基础环节,维吾尔语为黏着语言,形态变化较为复杂,词缀连接层次深并且大部分词缀都具有独立的语法功能,所以对维吾尔语进行词干提取是自然语言信息处理中的一大难题。本文针对维吾尔语形态变化,提出了利用规则和词典相结合的混合处理方法进行形态还原技术。利用从左到右分析,利用Lovin 算法实现了词干提取器。通过总结词法连接规则,提出了规则实现词干提取、用词典验证提取结果。经过五次对不同新闻内容的测试得出准确率平均达到了77.4%。
内容类型: 期刊论文
URI标识: http://ir.xjipc.cas.cn/handle/365002/3654
Appears in Collections:多语种信息技术研究室_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
基于混合方法的维吾尔语词干提取方法研究.pdf(601KB)期刊论文作者接受稿开放获取View 联系获取全文

作者单位: 中国科学院新疆理化技术研究所;新疆维吾尔自治区标准化研究院;新疆大学新疆多语种实验室

Recommended Citation:
热娜·艾尔肯,李晓,艾尼宛尔·托乎提. 基于混合方法的维吾尔语词干提取方法研究[J]. 计算机应用研究,2015,32(1).
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[热娜·艾尔肯]'s Articles
[李晓]'s Articles
[艾尼宛尔·托乎提]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[热娜·艾尔肯]‘s Articles
[李晓]‘s Articles
[艾尼宛尔·托乎提]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
文件名: 基于混合方法的维吾尔语词干提取方法研究.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Powered by CSpace