【文档说明】研究生医学统计中logistic回归课件.ppt,共(48)页,958.852 KB,由小橙橙上传
转载请保留链接:https://www.ichengzhen.cn/view-255073.html
以下为本文档部分文字说明:
LogisticregressionLogistic回归研究生医学统计中logistic回归1第一节.非条件logistic回归第二节.条件logistic回归第三节.应用及其注意事项研究生医学统计中logistic回归2医学研究中常碰到应变量的可能取值仅有两个(即二分
类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件什么情况下采用Logistic回归研究生医学统计中logistic回归3Brown(1980)在术前检查了53例
前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症淋巴结转
移与未转移)建立淋巴结转移的预报模型。实例研究生医学统计中logistic回归4(一)53例接受手术的前列腺癌患者情况研究生医学统计中logistic回归5(二)26例冠心病病人和28例对照进行病例−对照研究
研究生医学统计中logistic回归626例冠心病病人和28例对照者进行病例−对照研究研究生医学统计中logistic回归7一、logistic回归模型研究生医学统计中logistic回归8概率预报模型)(11011011011011)](exp[11)exp(1)exp(ppXX
ppppppeXXXXXX+++−+=+++−+=+++++++=研究生医学统计中logistic回归9二、模型的参数估计Logistic回归参数的估计通常采用最大似然法(maximum
likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。研究生医学统计中logistic回归10参数估计的公
式研究生医学统计中logistic回归11三、回归参数的假设检验研究生医学统计中logistic回归12优势比及其可信区间研究生医学统计中logistic回归13标准化回归参数用于评价各自变量对模型的贡献大小研究生医学统计中logistic回归14SAS程序研究生医学统计中l
ogistic回归15TheLOGISTICProcedureAnalysisofMaximumLikelihoodEstimates研究生医学统计中logistic回归16预报模型)9169.16443.
08896.5(8181818111)9169.16443.08896.5(exp11)9169.16443.08896.5exp(1)9169.16443.08896.5exp(XXeXXXXXX+++−−+=+
++−−+=+++−++++−=研究生医学统计中logistic回归17TheLOGISTICProcedureAnalysisofMaximumLikelihoodEstimates表16-2参数估计值与优势比OR值jOR的95%CI变量名
jb)(jbSEWald2值P值jbjOR值下限上限常数项0.06183.45990.00030.9857X_RAY2.04530.80726.42080.01130.51287.7321.58937
.614GRADE0.76140.77080.97590.32320.20542.1410.4739.700STAGE1.56410.77404.08350.04330.43524.7781.04821.783AGE-0.06930.05791.43200.2314-0.
23550.9330.8331.045ACID0.02430.01323.42300.06430.35171.0250.9991.051研究生医学统计中logistic回归18预报模型123451234512345exp(0.06182.04530.76141.56410.069
30.0243)ˆ1exp(0.06182.04530.76141.56410.06930.0243)11exp[(0.06182.04530.76141.56410.06930.0243)]iXXXXXXXXXXX
XXXX+++−+=++++−+=+−+++−+研究生医学统计中logistic回归19四、回归参数的意义X当只有一个自变量时,以相应的预报概率为纵轴,自变量为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状00.20.40.
60.81-2.5-1.5-0.50.51.52.53.5X预报概率Logistic回归曲线中心线研究生医学统计中logistic回归20优势比改变exp(j)个单位研究生医学统计中logistic回归21研究生医学统计中logistic回归22五、整个回归模型的假设检验研究生医学
统计中logistic回归23似然比检验(likelihoodratiotest)研究生医学统计中logistic回归24ROC曲线模型评价编号(i)预报(iˆ)实际(iY)编号(i)预报(iˆ)实际(iY)编号(i)预报(iˆ)实际(iY
)编号(i)预报(iˆ)实际(iY)10.2550150.0350280.1000410.726120.1460160.5130290.1800420.536130.2180170.5310300.3310430.869140.0650180.0360310.193044
0.894150.0340190.3210320.4710450.921160.2800200.3680330.5450460.950170.0520210.0660340.6951470.139180.0930220.8680350.1571480.323190.0360230
.1310360.8491490.8781100.0610240.5800370.2181500.8031110.1370250.0970380.4651510.2991120.2010260.0780390.20
01520.9421130.3040270.4510400.5181530.7671140.0720研究生医学统计中logistic回归25ROC曲线模型评价00.20.40.60.8100.20.40.60.811-特异度灵敏度图16-2Logistic回归预报能力的ROC曲线研究生医学统计
中logistic回归26六、logistic逐步回归(变量筛选)MODEL语句加入选项“SELECTION=STEPWISESLE=0.10SLS=0.10;”常采用似然比检验:决定自变量是否引入或剔除。)ln2()ln2()ln(ln210102LLLLLR−−−=−−=
研究生医学统计中logistic回归27模型中有X5、X6、X8,看是否引入X1模型含X5、X6、X8的模型的负二倍对数似然为:=50.402模型含X1、X5、X6、X8的模型的负二倍对数似然为:=46.224
)ln2(0L−)ln2(1L−X1,10.00410.0,1,178.4224.40402.502引入变量===−=PLR研究生医学统计中logistic回归28第二节.条件logistic回归研究生医学统计中logistic回归29条件似然函数
111010111exp()()nmiijipijpipjLXXXX===+−++−研究生医学统计中logistic回归301:3配对的例子研究生医学统计中logistic回归311:2配对的例子研究生医学统计中l
ogistic回归32表16-7条件logistic回归的SAS程序研究生医学统计中logistic回归33结果研究生医学统计中logistic回归34第三节应用及其注意事项应变量为(二项)分类的资料(预测、判别、危险因素分析等等)研究生医学统计中
logistic回归35注意事项1.分类自变量的哑变量编码2.为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的,容易造成错误的解释。)2exp(=OR研究生医学统计中logistic回归
36西、中西、中三种疗法哑变量化==其它中西其它西012011XX原资料姓名性别年龄疗法张山150中西李四120西王五018中刘六070中赵七135中西孙八029西哑变量化姓名性别年龄X1X2张山15001李四12010王五
01800刘六07000赵七13501孙八0291000100121中中西西疗法XX研究生医学统计中logistic回归37注意事项2.自变量的筛选不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料
采集的方便性等,决定采用何种方法的计算结果。研究生医学统计中logistic回归38注意事项3.交互作用交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。研究生医学统计中logistic回归39注意事项4.多分类log
istic回归心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量nominalvariables);疗效评价分为无效、好转、显效、痊愈(有序变量ordinalvariables)。参见第17章应变量研究生医学统计中logistic回归40SPS
S软件计算•Analyze•Regression•BinaryLogistic…•Dependent:y•Covariates:x1~x8•Method:ForwardWard•Save…——→•Predicte
dValues•Probabilities•Groupmembership•Option——→•CIforexp95%•ProbabilityforStepwise•Entry:0.1Removal0.15研究生医学统计中logistic回归41DATAsamp16_1;INPUTx_ray
gradestageageacidnodes;CARDS;......;PROCLOGISTICDESCENDING;MODELnodes=x_raygradestageageacid/RISKLIMITS;OUTPUTOUT=predP
ROB=pred;PROCPRINTDATA=pred;RUN;研究生医学统计中logistic回归42TheSASSystem22:07Monday,November29,20051TheLOGISTICProcedureModelInformationDataSetWORK.SA
MP16_1ResponseVariablenodesNumberofResponseLevels2NumberofObservations53ModelbinarylogitOptimizationTechniqueFishe
r'sscoringResponseProfileOrderedTotalValuenodesFrequency11202033Probabilitymodeledisnodes=1.研究生医学统计中logistic回归43ModelConvergenceStatusConvergencec
riterion(GCONV=1E-8)satisfied.ModelFitStatisticsInterceptInterceptandCriterionOnlyCovariatesAIC72.25260.126SC74.22271.
948-2LogL70.25248.126TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSqLikelihoodRatio22.126450.000
5Score19.451450.0016Wald13.140650.0221研究生医学统计中logistic回归44TheSASSystem22:07Monday,November29,20052TheLOGISTICProcedureAnalysisofMaximumLike
lihoodEstimatesStandardWaldParameterDFEstimateErrorChi-SquarePr>ChiSqIntercept10.06183.45990.00030.9857x_
ray12.04530.80726.42080.0113grade10.76140.77080.97590.3232stage11.56410.77404.08350.0433age1-0.06930.05791.43200.2314ac
id10.02430.01323.42300.0643研究生医学统计中logistic回归45TheSASSystem22:07Monday,November29,20052TheLOGISTICProcedureAnaly
sisofMaximumLikelihoodEstimatesStandardWaldParameterDFEstimateErrorChi-SquarePr>ChiSqIntercept10.06183.45990.00030.9857x_ray12.0453
0.80726.42080.0113grade10.76140.77080.97590.3232stage11.56410.77404.08350.0433age1-0.06930.05791.43200.2314acid1
0.02430.01323.42300.0643OddsRatioEstimatesPoint95%WaldEffectEstimateConfidenceLimitsx_ray7.7321.58937.614grade2.1410.4739.700stage4.7781.04821.783a
ge0.9330.8331.045acid1.0250.9991.051研究生医学统计中logistic回归46AssociationofPredictedProbabilitiesandObservedRespo
nsesPercentConcordant84.5Somers'D0.694PercentDiscordant15.2Gamma0.696PercentTied0.3Tau-a0.332Pairs660c0.847WaldConfidenceIntervalforAdjustedOddsRatio
sEffectUnitEstimate95%ConfidenceLimitsx_ray1.00007.7321.58937.614grade1.00002.1410.4739.700stage1.00004.7781.04821.783age1.00000.9
330.8331.045acid1.00001.0250.9991.051研究生医学统计中logistic回归47Obsnox_raygradestageageacidnodes_LEVEL_pred110116440010.255112200163
40010.14633331006546010.21842440106747010.06459。。。。。。。。。。。。。。。。。50501016489110.8030251510105999110.29880
525211168126110.94215535310061136110.76730研究生医学统计中logistic回归48