随着医学信息化、网络化的发展,传统的数据挖掘[1]方法在处理复杂的医学数据方面,表现出很大的局限性.因此,需要研究开发更有效的挖掘方法.通过对聚类分析中最经典的K-means算法[2]进行优化研究,以解决在每次迭代中,K-means算法都要计算数据点和所有中心之间的距离[3]问题为目的.通过保留数据点到最近的簇的距离,并与下次迭代中计算的中心点距离作比较的方法,减少了K-means算法在图案数量和迭代集群数量时所需的时间,并能够产生与原始算法相同有效的聚类结果.最终得到改进后的算法大大提高了执行效率,且在性能上比K-means算法有显著优越性的结论.
作者:宋欣霞;金卫
来源:中国数字医学 2016 年 11卷 8期