目的 logistic回归模型中解释变量存在共线性的情形下,比较联合式偏最小二乘logistic回归(IPLSLR),耦合式偏最小二乘logistic回归(CPLSLR)和主成分logistic回归(PCLR)三种降维方法所得到的回归系数估计的偏差和稳定性.方法 运用Monte Carlo随机法,采用SAS软件编程,模拟估算不同共线性情形下三种降维方法所得到的回归系数估计均值及标准差.结果 简单共线性情形下,IPLSLR与CPLSLR回归系数估计的偏差较小,PCLR估计则相对稳定.多重共线性情形下,当样本量较大时,若共线性较高,IPLSLR,CPLSLR和PCLR均获得偏差较小、稳定性较好的回归系数估计;若共线性较低,PCLR且回归系数估计的偏差明显大于IPLSLR和CPLSLR.当样本量较小时,IPLSLR与CPLSLR在回归系数估计偏差和稳定性方面互有优劣.结论 应根据共线性的程度和样本量的大小决定使用相应的降维方法用于处理logistic回归模型中共线性情况.通过对三种降维方法不足的分析,提出了进一步改进的原则.
作者:蒋红卫;张罗漫;孟虹
来源:中国卫生统计 2010 年 27卷 6期