传统Pearson相关系数计算公式具有不稳健性,离群值的存在会导致计算结果与实际不符。针对此问题,文章给出了一种稳健估计方法。在模拟样本量分别为20、50、100、200,污染率分别为1%、5%、10%情形下,比较传统相关系数值与稳健相关系数值...传统Pearson相关系数计算公式具有不稳健性,离群值的存在会导致计算结果与实际不符。针对此问题,文章给出了一种稳健估计方法。在模拟样本量分别为20、50、100、200,污染率分别为1%、5%、10%情形下,比较传统相关系数值与稳健相关系数值,发现:稳健相关系数公式正确率均显著高于传统相关系数。在实例分析中进一步验证了稳健相关系数的可行性和有效性。文章研究结论可用于含离群值变量的相关系数稳健估计。The traditional Pearson correlation coefficient calculation formula is not robust, and the existence of outliers will cause the calculation results to be inconsistent with reality. To solve this problem, this paper presents a robust estimation method. When the simulated sample size is 20, 50, 100 and 200 respectively, the pollution rate is 1%, 5% and 10% respectively, it is found that the accuracy of the robust correlation coefficient formula is significantly higher than that of the traditional correlation coefficient. The feasibility and effectiveness of a robust correlation coefficient are further verified in the example analysis. The conclusions of this paper can be used for robust estimation of correlation coefficients with outlier variables.展开更多
目的基于双重稳健估计(Doubly robust,DR)方法估计非小细胞肺癌治疗过程对院内死亡的因果效应大小,为降低非小细胞肺癌院内死亡率提供参考依据。方法依据非小细胞肺癌治疗质量评价体系,计算治疗过程指标的使用率,以治疗过程质量均值得...目的基于双重稳健估计(Doubly robust,DR)方法估计非小细胞肺癌治疗过程对院内死亡的因果效应大小,为降低非小细胞肺癌院内死亡率提供参考依据。方法依据非小细胞肺癌治疗质量评价体系,计算治疗过程指标的使用率,以治疗过程质量均值得分为界限将患者划分为高质量组与低质量组。以院内死亡为结局指标,采用倾向性评分逆概率加权(Inverse probability of treatment weighting,IPTW)法校正的Kaplan-Meier法及Cox回归,分析治疗过程质量对非小细胞肺癌院内死亡的影响;结合DR估计治疗过程对院内死亡的因果效应大小。结果治疗过程指标使用率的中位数为66.88%,患者治疗过程质量得分为0.270±0.124,其中高质量组为0.358±0.069,低质量组为0.158±0.081。经过IPTW法加权后,患者基线特征标准化平均差(Standardized mean difference,SMD)减小;IPTW前后两组患者生存曲线间差异具有统计学意义(P<0.05),高质量组患者的预后优于低质量组患者(IPTW前:HR=0.367,95%CI:0.275~0.491;IPTW后:HR=0.228,95%CI:0.167~0.312)。与低质量组相比,高质量组患者治疗过程对院内死亡的平均因果效应大小为-0.026。结论DR可弥补logistic或IPTW的不足,规避模型出错的风险,可以获得治疗过程质量对院内死亡的因果效应。医疗实践中应提高治疗过程指标的使用率,从而改善患者预后;因果效应研究提示,除治疗过程外,影响院内死亡的其他因素也是不可忽略的。展开更多
文摘传统Pearson相关系数计算公式具有不稳健性,离群值的存在会导致计算结果与实际不符。针对此问题,文章给出了一种稳健估计方法。在模拟样本量分别为20、50、100、200,污染率分别为1%、5%、10%情形下,比较传统相关系数值与稳健相关系数值,发现:稳健相关系数公式正确率均显著高于传统相关系数。在实例分析中进一步验证了稳健相关系数的可行性和有效性。文章研究结论可用于含离群值变量的相关系数稳健估计。The traditional Pearson correlation coefficient calculation formula is not robust, and the existence of outliers will cause the calculation results to be inconsistent with reality. To solve this problem, this paper presents a robust estimation method. When the simulated sample size is 20, 50, 100 and 200 respectively, the pollution rate is 1%, 5% and 10% respectively, it is found that the accuracy of the robust correlation coefficient formula is significantly higher than that of the traditional correlation coefficient. The feasibility and effectiveness of a robust correlation coefficient are further verified in the example analysis. The conclusions of this paper can be used for robust estimation of correlation coefficients with outlier variables.
文摘目的基于双重稳健估计(Doubly robust,DR)方法估计非小细胞肺癌治疗过程对院内死亡的因果效应大小,为降低非小细胞肺癌院内死亡率提供参考依据。方法依据非小细胞肺癌治疗质量评价体系,计算治疗过程指标的使用率,以治疗过程质量均值得分为界限将患者划分为高质量组与低质量组。以院内死亡为结局指标,采用倾向性评分逆概率加权(Inverse probability of treatment weighting,IPTW)法校正的Kaplan-Meier法及Cox回归,分析治疗过程质量对非小细胞肺癌院内死亡的影响;结合DR估计治疗过程对院内死亡的因果效应大小。结果治疗过程指标使用率的中位数为66.88%,患者治疗过程质量得分为0.270±0.124,其中高质量组为0.358±0.069,低质量组为0.158±0.081。经过IPTW法加权后,患者基线特征标准化平均差(Standardized mean difference,SMD)减小;IPTW前后两组患者生存曲线间差异具有统计学意义(P<0.05),高质量组患者的预后优于低质量组患者(IPTW前:HR=0.367,95%CI:0.275~0.491;IPTW后:HR=0.228,95%CI:0.167~0.312)。与低质量组相比,高质量组患者治疗过程对院内死亡的平均因果效应大小为-0.026。结论DR可弥补logistic或IPTW的不足,规避模型出错的风险,可以获得治疗过程质量对院内死亡的因果效应。医疗实践中应提高治疗过程指标的使用率,从而改善患者预后;因果效应研究提示,除治疗过程外,影响院内死亡的其他因素也是不可忽略的。