XJIPC OpenIR  > 多语种信息技术研究室
基于混合方法的维吾尔语词干提取方法研究
热娜·艾尔肯; 李晓; 艾尼宛尔·托乎提
2015
发表期刊计算机应用研究
ISSN1001-3695
卷号32期号:1页码:112-114+120
摘要

自然语言信息处理中,词干提取是自然语言信息处理的基础环节,维吾尔语为黏着语言,形态变化较为复杂,词缀连接层次深并且大部分词缀都具有独立的语法功能,所以对维吾尔语进行词干提取是自然语言信息处理中的一大难题。本文针对维吾尔语形态变化,提出了利用规则和词典相结合的混合处理方法进行形态还原技术。利用从左到右分析,利用Lovin 算法实现了词干提取器。通过总结词法连接规则,提出了规则实现词干提取、用词典验证提取结果。经过五次对不同新闻内容的测试得出准确率平均达到了77.4%。

关键词维吾尔语 形态变化 词干 词缀 规则方法 词典方法 混合方法 Lovin 算法
收录类别CSCD
CSCD记录号CSCD:5335748
引用统计
文献类型期刊论文
条目标识符http://ir.xjipc.cas.cn/handle/365002/3654
专题多语种信息技术研究室
作者单位中国科学院新疆理化技术研究所;新疆维吾尔自治区标准化研究院;新疆大学新疆多语种实验室
推荐引用方式
GB/T 7714
热娜·艾尔肯,李晓,艾尼宛尔·托乎提. 基于混合方法的维吾尔语词干提取方法研究[J]. 计算机应用研究,2015,32(1):112-114+120.
APA 热娜·艾尔肯,李晓,&艾尼宛尔·托乎提.(2015).基于混合方法的维吾尔语词干提取方法研究.计算机应用研究,32(1),112-114+120.
MLA 热娜·艾尔肯,et al."基于混合方法的维吾尔语词干提取方法研究".计算机应用研究 32.1(2015):112-114+120.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于混合方法的维吾尔语词干提取方法研究.(601KB)期刊论文作者接受稿开放获取CC BY-NC-SA浏览 请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[热娜·艾尔肯]的文章
[李晓]的文章
[艾尼宛尔·托乎提]的文章
百度学术
百度学术中相似的文章
[热娜·艾尔肯]的文章
[李晓]的文章
[艾尼宛尔·托乎提]的文章
必应学术
必应学术中相似的文章
[热娜·艾尔肯]的文章
[李晓]的文章
[艾尼宛尔·托乎提]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 基于混合方法的维吾尔语词干提取方法研究.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。