XJIPC OpenIR  > 多语种信息技术研究室
基于统计的词素切分算法
董兴华; 杨雅婷; 陈丽娟; 周喜; 吐尔洪·吾司曼
2010
Conference Name第五届全国青年计算语言学研讨会(YWCL 2010)
Conference Date2010
Conference Place武汉
Abstract

这篇论文描述了一种基于统计的词素切分算法,算法构建了一种数据结构,在该结构中语料库中的每个词都可以表示为它的词素的二叉树。因为每个词有不同的词素分割,算法选择使整体概率最高的分割,从而找到最优的词素词典和词的分割。我们用英语和维吾尔语作为实验数据,得出了较好的结果。

Keyword词素 统计分割 二叉树 维语
Funding Organization中国中文信息学会
Document Type会议论文
Identifierhttp://ir.xjipc.cas.cn/handle/365002/2348
Collection多语种信息技术研究室
Affiliation中国科学院 新疆理化技术研究所
Recommended Citation
GB/T 7714
董兴华,杨雅婷,陈丽娟,等. 基于统计的词素切分算法[C],2010.
Files in This Item:
File Name/Size DocType Version Access License
基于统计的词素切分算法.pdf(344KB)会议论文 开放获取CC BY-NC-SAView Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[董兴华]'s Articles
[杨雅婷]'s Articles
[陈丽娟]'s Articles
Baidu academic
Similar articles in Baidu academic
[董兴华]'s Articles
[杨雅婷]'s Articles
[陈丽娟]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[董兴华]'s Articles
[杨雅婷]'s Articles
[陈丽娟]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 基于统计的词素切分算法.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.