陈浩然 1,3 , 刘夏阳 2 , 王敏 1 , 杨林 1 , 王嘉阳 1,3 , 孙海霞 1 , 段永恒 2 , 吴旭生 2 , 尚丽 2 , 钱庆 1,3 , 和晓峰 2 , 李姣 1,3
  • 1. 中国医学科学院/北京协和医学院医学信息研究所(北京 100020);
  • 2. 深圳市卫生健康发展研究中心和数据管理中心(深圳 518028);
  • 3. 中国医学科学院 国家人口健康科学数据中心(北京 100730);
导出 下载 收藏 扫码 引用

目的 总结并探索机器学习模型在不满足等比例风险假设生存资料中的应用,为大样本、高维度的非比例风险(non-proportional hazards,NPH)生存资料分析方法提供参考。方法 首先概述了NPH的概念和相关检验方法;然后根据相关文献重点总结归纳了基于机器学习模型的非比例风险生存分析方法的优缺点;最后利用可公开获取的真实世界临床数据,对重症监护室内脑卒中患者30天内的死亡风险进行了关于两种集成机器学习模型和两种深度学习模型在非比例风险生存资料中的案例研究。结果 归纳总结了8种使用普遍的基于机器学习模型的非比例风险生存分析方法,分别包括随机生存森林等5种一般的机器学习模型和3种基于人工神经网络的深度学习模型(如DeepHit);案例研究结果显示随机生存森林模型的表现最好(C-index=0.773,IBS=0.151),基于排列重要性算法发现年龄是影响脑卒中患者死亡风险最重要的特征。结论 精准医学时代的生存大数据呈现NPH的现象十分普遍,面对更加复杂的生存分析资料和更高的生存分析需求时,可以使用基于机器学习模型的生存分析方法。

引用本文: 陈浩然, 刘夏阳, 王敏, 杨林, 王嘉阳, 孙海霞, 段永恒, 吴旭生, 尚丽, 钱庆, 和晓峰, 李姣. 机器学习模型在非比例风险生存资料中的应用及案例实践. 中国循证医学杂志, 2024, 24(9): 1108-1116. doi: 10.7507/1672-2531.202401190 复制

  • 上一篇

    基于人工智能的临床辅助决策系统早期临床评价研究的报告规范(DECIDE-AI)解读
  • 下一篇

    基于组合优化的机器学习模型预测胃癌术后感染性并发症的诊断性研究