目的 探讨支持向量机(SVM)在肾综合征出血热(HFRS)发病率预测上的优势及应用前景.方法 首先,利用辽宁省葫芦岛市1984-2006的气象资料(包括平均气压、平均气温、平均降雨量、相对湿度、日照时数、日照百分率)和动物疫情资料(包括鼠密度和鼠带病毒率)共8个指标作为解释变量,所有变量均进行归一化到[0,1]区间,将整个数据集分成训练集和检验集,从数据集中随机抽取1/3个体(舍人取整)组成检验集,其余样本作为训练集.其次,利用软件R 2.60构造HFRS发病率预测的SVM模型,获得误差平方和.最后,与基于反馈(BP)和径向基函数(RBF)神经网络模型的预测结果 进行比较.结果 对于训练集,SVM拟合的误差平方和的x±s为(0.031±0.009),而BP和RBF神经网络拟合的误差平方和的.x±s分别为(0.074±0.030)和(0.082±0.018);对于检验集,SVM预测的误差平方和的x±s为(0.067±0.021),而BP和RBF神经网络预测的误差平方和的x±5分别为(0.073±0.022)和(0.089±0.036).结论 SVM作为近年来在统计学理论的基础上发展起来的一种新的模式识别方法 ,在解决小样本、非线性及高维模式识别问题中具有较高的预测精度和较强的泛化能力.该模型对于发病率的预测是可靠的,可以作为HFRS疫情预测的参考方法 .
作者:黄德生;沈铁峰;吴伟;关鹏;周宝森
来源:中国媒介生物学及控制杂志 2008 年 19卷 6期