【文档说明】研究生医学统计中logistic回归课件.ppt,共(48)页,958.852 KB,由小橙橙上传
转载请保留链接:https://www.ichengzhen.cn/view-255073.html
以下为本文档部分文字说明:
LogisticregressionLogistic回归研究生医学统计中logistic回归1第一节.非条件logistic回归第二节.条件logistic回归第三节.应用及其注意事项研究生医学统计中logistic回归2医学研究中常碰到应变量
的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件什么情况下采用Logistic回归研究生医学统计中logistic回归3Brown(1980)在术前检查了53例前列腺癌
患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、
0分别表示癌症淋巴结转移与未转移)建立淋巴结转移的预报模型。实例研究生医学统计中logistic回归4(一)53例接受手术的前列腺癌患者情况研究生医学统计中logistic回归5(二)26例冠心病病人和28例对照进行病例−对照研究研究生医学统计中logistic回归626例冠心病病人和28例
对照者进行病例−对照研究研究生医学统计中logistic回归7一、logistic回归模型研究生医学统计中logistic回归8概率预报模型)(11011011011011)](exp[11)exp(1)exp(ppXXppppppeXXXXX
X+++−+=+++−+=+++++++=研究生医学统计中logistic回归9二、模型的参数估计Logistic回归参数的估计通常采用最大似然法(maximumlikelihood,ML)
。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。研究生医学统计中logistic回归10参数估计的公式研究生医学统计中logistic回归11三、回归参数的假设检验研究生医学统计中logis
tic回归12优势比及其可信区间研究生医学统计中logistic回归13标准化回归参数用于评价各自变量对模型的贡献大小研究生医学统计中logistic回归14SAS程序研究生医学统计中logistic回
归15TheLOGISTICProcedureAnalysisofMaximumLikelihoodEstimates研究生医学统计中logistic回归16预报模型)9169.16443.08896.5(8181818111)9169.1644
3.08896.5(exp11)9169.16443.08896.5exp(1)9169.16443.08896.5exp(XXeXXXXXX+++−−+=+++−−+=+++−++++−=研究生医学统计中logistic回归17TheLOGISTICPr
ocedureAnalysisofMaximumLikelihoodEstimates表16-2参数估计值与优势比OR值jOR的95%CI变量名jb)(jbSEWald2值P值jbjOR值下限上限常数项0.0
6183.45990.00030.9857X_RAY2.04530.80726.42080.01130.51287.7321.58937.614GRADE0.76140.77080.97590.32320.20542.1410.4739.700STAGE1.56
410.77404.08350.04330.43524.7781.04821.783AGE-0.06930.05791.43200.2314-0.23550.9330.8331.045ACID0.02430.01323.42300.06430.35171
.0250.9991.051研究生医学统计中logistic回归18预报模型123451234512345exp(0.06182.04530.76141.56410.06930.0243)ˆ1exp(0.06182.04530.76
141.56410.06930.0243)11exp[(0.06182.04530.76141.56410.06930.0243)]iXXXXXXXXXXXXXXX+++−+=++++−+=+−+++−+研究生医学统计中logisti
c回归19四、回归参数的意义X当只有一个自变量时,以相应的预报概率为纵轴,自变量为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状00.20.40.60.81-2.5-1.5-0.50.51.52.53.
5X预报概率Logistic回归曲线中心线研究生医学统计中logistic回归20优势比改变exp(j)个单位研究生医学统计中logistic回归21研究生医学统计中logistic回归22五、整个回归模型的假设检验研究生医学统计中log
istic回归23似然比检验(likelihoodratiotest)研究生医学统计中logistic回归24ROC曲线模型评价编号(i)预报(iˆ)实际(iY)编号(i)预报(iˆ)实际(iY)编号(i)预报(iˆ)实际(i
Y)编号(i)预报(iˆ)实际(iY)10.2550150.0350280.1000410.726120.1460160.5130290.1800420.536130.2180170.5310300.3310430.869140.065018
0.0360310.1930440.894150.0340190.3210320.4710450.921160.2800200.3680330.5450460.950170.0520210.0660340.
6951470.139180.0930220.8680350.1571480.323190.0360230.1310360.8491490.8781100.0610240.5800370.2181500.8031110.13
70250.0970380.4651510.2991120.2010260.0780390.2001520.9421130.3040270.4510400.5181530.7671140.0720研究生医学统计中logistic回归25ROC曲线模型评价00.
20.40.60.8100.20.40.60.811-特异度灵敏度图16-2Logistic回归预报能力的ROC曲线研究生医学统计中logistic回归26六、logistic逐步回归(变量筛选)MODE
L语句加入选项“SELECTION=STEPWISESLE=0.10SLS=0.10;”常采用似然比检验:决定自变量是否引入或剔除。)ln2()ln2()ln(ln210102LLLLLR−−−=−−=研究生
医学统计中logistic回归27模型中有X5、X6、X8,看是否引入X1模型含X5、X6、X8的模型的负二倍对数似然为:=50.402模型含X1、X5、X6、X8的模型的负二倍对数似然为:=46.224)ln2(0L−)l
n2(1L−X1,10.00410.0,1,178.4224.40402.502引入变量===−=PLR研究生医学统计中logistic回归28第二节.条件logistic回归研究生医学统计中logistic回归29条件似然函数111010111exp()()nmiijip
ijpipjLXXXX===+−++−研究生医学统计中logistic回归301:3配对的例子研究生医学统计中logistic回归311:2配对的例子研究生医学统计中logistic回归32表
16-7条件logistic回归的SAS程序研究生医学统计中logistic回归33结果研究生医学统计中logistic回归34第三节应用及其注意事项应变量为(二项)分类的资料(预测、判别、危险因素分析等等)研究生医学统计中logistic回归35注意事项1.分类自变量
的哑变量编码2.为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的,容易造成错误的解释。)2exp(=OR研究生医学统计中logistic回归36西、中西、中三种疗法哑变
量化==其它中西其它西012011XX原资料姓名性别年龄疗法张山150中西李四120西王五018中刘六070中赵七135中西孙八029西哑变量化姓名性别年龄X1X2张山15001李四12010王五01800刘六07000赵七1350
1孙八0291000100121中中西西疗法XX研究生医学统计中logistic回归37注意事项2.自变量的筛选不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的
计算结果。研究生医学统计中logistic回归38注意事项3.交互作用交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。研究生医学统计中logistic回归39注意事项4.多分类logistic回归心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量no
minalvariables);疗效评价分为无效、好转、显效、痊愈(有序变量ordinalvariables)。参见第17章应变量研究生医学统计中logistic回归40SPSS软件计算•Analyze•Regre
ssion•BinaryLogistic…•Dependent:y•Covariates:x1~x8•Method:ForwardWard•Save…——→•PredictedValues•Probabilities•Groupmembership•Option——→•
CIforexp95%•ProbabilityforStepwise•Entry:0.1Removal0.15研究生医学统计中logistic回归41DATAsamp16_1;INPUTx_raygradestageageacidnodes;CARDS;......;PROCLOGISTIC
DESCENDING;MODELnodes=x_raygradestageageacid/RISKLIMITS;OUTPUTOUT=predPROB=pred;PROCPRINTDATA=pred;RUN;研究生医学统计中logistic回归42TheSASSystem2
2:07Monday,November29,20051TheLOGISTICProcedureModelInformationDataSetWORK.SAMP16_1ResponseVariablenode
sNumberofResponseLevels2NumberofObservations53ModelbinarylogitOptimizationTechniqueFisher'sscoringResponseProfileOrderedTotalValue
nodesFrequency11202033Probabilitymodeledisnodes=1.研究生医学统计中logistic回归43ModelConvergenceStatusConvergencecriterion(GCONV=1E-8)satisfied.Mo
delFitStatisticsInterceptInterceptandCriterionOnlyCovariatesAIC72.25260.126SC74.22271.948-2LogL70.25248.126TestingGlobalNullHypothesis:BETA=0Te
stChi-SquareDFPr>ChiSqLikelihoodRatio22.126450.0005Score19.451450.0016Wald13.140650.0221研究生医学统计中logistic回归44TheSASSy
stem22:07Monday,November29,20052TheLOGISTICProcedureAnalysisofMaximumLikelihoodEstimatesStandardWaldParameterDFEstimateErrorChi-SquarePr>Chi
SqIntercept10.06183.45990.00030.9857x_ray12.04530.80726.42080.0113grade10.76140.77080.97590.3232stage11.56410.77404.08350.0433age1-0.06930.0
5791.43200.2314acid10.02430.01323.42300.0643研究生医学统计中logistic回归45TheSASSystem22:07Monday,November29,20052TheLOGISTICProcedureAnalysisofMaximumLikeliho
odEstimatesStandardWaldParameterDFEstimateErrorChi-SquarePr>ChiSqIntercept10.06183.45990.00030.9857x_ray12.04530.80726.42080.0113grade10.76140.77
080.97590.3232stage11.56410.77404.08350.0433age1-0.06930.05791.43200.2314acid10.02430.01323.42300.0643OddsRatioEstimatesPoint95%WaldEffectEstimateC
onfidenceLimitsx_ray7.7321.58937.614grade2.1410.4739.700stage4.7781.04821.783age0.9330.8331.045acid1.0
250.9991.051研究生医学统计中logistic回归46AssociationofPredictedProbabilitiesandObservedResponsesPercentConcordant84.5Somers'D0.694Percent
Discordant15.2Gamma0.696PercentTied0.3Tau-a0.332Pairs660c0.847WaldConfidenceIntervalforAdjustedOddsRatiosEffectUnitEstimate95%ConfidenceLimitsx_ray
1.00007.7321.58937.614grade1.00002.1410.4739.700stage1.00004.7781.04821.783age1.00000.9330.8331.045acid1.00001.0250.9991.051研究生医学统计中logi
stic回归47Obsnox_raygradestageageacidnodes_LEVEL_pred110116440010.25511220016340010.14633331006546010.2184244010674
7010.06459。。。。。。。。。。。。。。。。。50501016489110.8030251510105999110.29880525211168126110.94215535310061136110.76730研究生医学统计中lo
gistic回归48