中国科学院新疆理化技术研究所机构知识库
Advanced  
XJIPC OpenIR  > 多语种信息技术研究室  > 会议论文
题名: 基于统计的词素切分算法
作者: 董兴华 ; 杨雅婷 ; 陈丽娟 ; 周喜 ; 吐尔洪·吾司曼
会议名称: 第五届全国青年计算语言学研讨会(YWCL 2010)
会议日期: 2010
出版日期: 2010
会议地点: 武汉
主办者: 中国中文信息学会
摘要: 这篇论文描述了一种基于统计的词素切分算法,算法构建了一种数据结构,在该结构中语料库中的每个词都可以表示为它的词素的二叉树。因为每个词有不同的词素分割,算法选择使整体概率最高的分割,从而找到最优的词素词典和词的分割。我们用英语和维吾尔语作为实验数据,得出了较好的结果。
语种: 中文
内容类型: 会议论文
URI标识: http://ir.xjipc.cas.cn/handle/365002/2348
Appears in Collections:多语种信息技术研究室_会议论文

Files in This Item:
File Name/ File Size Content Type Version Access License
基于统计的词素切分算法.pdf(344KB)----开放获取View 联系获取全文

Recommended Citation:
董兴华;杨雅婷;陈丽娟;周喜;吐尔洪·吾司曼.基于统计的词素切分算法.见:.,,2010,
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[董兴华]'s Articles
[杨雅婷]'s Articles
[陈丽娟]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[董兴华]‘s Articles
[杨雅婷]‘s Articles
[陈丽娟]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
文件名: 基于统计的词素切分算法.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Powered by CSpace