Data Clustering Based on Random Walk
DOI: 10.12677/HJDM.2017.73008, PDF, HTML, XML, 下载: 1,821  浏览: 4,378  科研立项经费支持
作者: 崔 伟, 夏 汛:泸州职业技术学院,四川 泸州 ;孙瑜鲁*:四川大学电子信息学院,四川 成都
关键词: 聚类分析随机游走权重函数Clustering Analysis Random Walk Algorithm Weighting Function
摘要: 为了实现大数据量、复杂类型数据的聚类分析,本文运用随机游走算法是将数据集合映射为图,各个数据表示节点,用一个加权函数表示数据与数据之间的关系,该加权函数能根据相似性准则表示数据集中两个数据间的权重。在随机游走算法中,权重的大小代表了随机游走者从非种子点第一次到达某一种子点的偏好。最后根据最大转移概率实现聚类分析。结果表明随机游走算法在数值型数据的聚类分析中能够实现聚类。
Abstract: In order to realize the clustering analysis of large data volume and complex types of data, the random walk algorithm maps the data set into graphs, each data represents node, and uses a weighting function to represent the relationship between data and data. The similarity criterion indicates the weight between two data in the data set. In the random walk algorithm, the weight of the weight represents the random walker from the non-seed point for the first time to reach a seed point of preference. Finally, cluster analysis is realized according to the maximum transition probability. The results show that the random walk algorithm can achieve clustering in the clus-tering analysis of numerical data.
文章引用:崔伟, 夏汛, 孙瑜鲁. 基于随机游走的数据聚类[J]. 数据挖掘, 2017, 7(3): 70-76. https://doi.org/10.12677/HJDM.2017.73008


[1] 黄震华, 向阳, 张波, 等. 一种进行K-Means聚类的有效方法[J]. 模式识别与人工智能, 2010, 23(4): 516-521.
[2] 汤效琴, 戴汝源. 数据挖掘中聚类分析的技术方法[J]. 微计算机信息, 2003(1): 3-4.
[3] 张鑫, 赵丞. 层次聚类算法在图象处理中的应用[J]. 计算机光盘软件与应用, 2011(11): 23-23.
[4] 黄劲松, 赵平. 聚类分析在品牌市场定位研究中的应用[J]. 数理统计与管理, 2005, 24(1): 21-26.
[5] 王自强, 钱旭. 基于流形学习和SVM的Web文档分类4.681算法[J]. 计算机工程, 2009, 35(15): 38-40.
[6] 吴夙慧, 成颖, 郑彦宁, 等. K-Means 算法研究综述[J]. 现代图书情报技术, 2011, 27(5): 28-35.
[7] Park, H.S. and Jun, C.H. (2009) A Simple and Fast Algorithm for K-Medoids Clustering. Expert Systems with Applications, 36, 3336-3341.
[8] Gungor, Z. and Unler, A. (2008) K-Harmonic Means Data Clustering with Tabu-Search Method. Applied Mathematical Modelling, 32, 1115-1125.
[9] Barbakh, W.A., Wu, Y. and Fyfe, C. (2009) Non-Standard Parameter Adaptation for Exploratory Data Analysis. Springer, Berlin Heidelberg, 7-28.
[10] 姚明海. 基于连续性原理的聚类算法研究[D]: [硕士学位论文]. 长春: 东北师范大学, 2010.
[11] 魏桂英, 郑玄轩. 层次聚类方法的CURE算法研究[J]. 科技和产业, 2005, 5(11): 22-24.
[12] 王荣, 王飞戈, 吴坤芳. 基于改进ROCK算法的个性化推荐系统研究[J]. 河南科学, 2011, 29(11): 1346-1349.