中医药处方数据挖掘是传承名医经验与新药研发的重要方法之一,然而目前相关工作存在研究方案待优化、统计不规范等问题.研究总结的主要问题与对应解决方案包括 4 个方面.①研究方案设计需考虑疗效与个案质量.②关联规则的置信度顺序差异的意义尚待进一步思考,并且不应忽视提升度.③聚类分析步骤复杂,聚类变量的选择应综合考虑中药频次、网络拓扑学参数与实际应用意义等方面;距离计算与聚类方法的选择应根据中医药临床数据特征进行改进,Jaccard距离及改进方案在今后应得到重视;不应呈现单一的、未经解释的聚类结果,而应综合中医临床特征与聚类客观评价指标选择最终聚类方案.④计算相关性系数时,不应将仅适配于连续变量的算法应用于二分类变量.该文基于中医临床研究特征与统计学原理阐述了上述问题的内涵,并给出对应建议,为今后数据挖掘研究提供重要参考.
作者:但文超;赵国桢;何庆勇;张辉;李博;张广中
来源:中国中药杂志 2023 年 48卷 17期