应用分类树模型筛选恶性肿瘤危险因素的研究
摘要:
目的介绍分类树模型筛选恶性肿瘤危险因素基本原理、运算法则和应用价值.方法以浙江省嘉善县乳腺癌现场调查数据为例,采用Exhaustive CHAID法建立分类树模型对调查结果进行危险因素筛选,使用错分概率Risk值和ROC曲线下面积对模型进行评价.结果分类树模型从全部105个候选变量中筛选出9个危险因素,其中职业是最重要的影响因素,工人、教师及退休人员的乳腺癌发生概率显著高于其他人员.另外,模型显示经常参加体育锻炼在不同人群中对乳腺癌的影响效果有所不同.模型错分概率Risk值为0.174,利用预测概率绘制的ROC曲线下面积为0.872,与0.5比较具有显著的统计学意义,模型拟合效果很好.结论分类树模型不仅可以有效挖掘筛选出主要的影响因素,还可以对研究变量科学定义分界点,展示变量间复杂的相互作用,在流行病学研究中具有较高的应用价值.
-
doi:
-
关键词:
分类树模型
乳腺肿瘤
危险因素
卡方自动交互检测法
-
Keyword:
-
作者:
张勇晶
陈坤
金明娟
范春红
-
Author:
ZHANG Yong-jing
CHEN Kun
JIN Ming-juan
FAN Chun-hong
-
作者单位:
-
刊名:
中华流行病学杂志
-
Journal:
-
年,卷(期):
-
所属期刊栏目:
-
基金项目
-
在线出版日期:
-
页码: