随着互联网以及物联网的飞速发展,社交网络和智能手机的大量普及,使全球进入了大数据时代.在健康医疗领域,各种医疗卫生信息系统记录和保存了巨大的医疗健康服务业务数据,但由于信息标准、信息录入等原因,产生了大量的“脏数据”,这些数据是不可用的,给健康医疗大数据信息关联和挖掘分析造成了障碍.因此必须对“脏数据”进行清洗,清除垃圾数据,提高数据的质量,以便通过大数据挖掘和分析真正体现数据的价值.通过对健康医疗原始数据清洗中遇到的问题进行分析,将原始数据进行整合和清洗,为健康医疗大数据的挖掘和分析打下良好的基础.
作者:毛云鹏;龙虎;邓韧;郭欣
来源:中国数字医学 2017 年 12卷 6期