XJIPC OpenIR  > 多语种信息技术研究室
加速大数据聚类K-means算法的改进
韩岩; 李晓
2015
Source Publication计算机工程与设计
ISSN1000-7024
Volume36Issue:5Pages:1317-1320
Abstract

为有效处理大规模数据聚类的问题,提出一种先抽样再用最大最小距离进行K-means并行化聚类的方法。基于抽样的方法避免了聚类陷入局部解中,基于最大最小距离法使得初始聚类中心趋于最优化。大量实验结果表明,无论是在单机环境还是集群环境下,该方法受初始聚类中心的影响降低,提高了聚类的准确性,减少了聚类的迭代次数,降低了聚类的时间。

KeywordK-均值算法 随机抽样 最大最小距离法 映射归约 并行化
Document Type期刊论文
Identifierhttp://ir.xjipc.cas.cn/handle/365002/4521
Collection多语种信息技术研究室
Affiliation中国科学院新疆理化技术研究所;中国科学院大学计算机与控制学院
Recommended Citation
GB/T 7714
韩岩,李晓. 加速大数据聚类K-means算法的改进[J]. 计算机工程与设计,2015,36(5):1317-1320.
APA 韩岩,&李晓.(2015).加速大数据聚类K-means算法的改进.计算机工程与设计,36(5),1317-1320.
MLA 韩岩,et al."加速大数据聚类K-means算法的改进".计算机工程与设计 36.5(2015):1317-1320.
Files in This Item:
File Name/Size DocType Version Access License
加速大数据聚类K-means算法的改进.(232KB)期刊论文作者接受稿开放获取CC BY-NC-SAView Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[韩岩]'s Articles
[李晓]'s Articles
Baidu academic
Similar articles in Baidu academic
[韩岩]'s Articles
[李晓]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[韩岩]'s Articles
[李晓]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 加速大数据聚类K-means算法的改进.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.