【文档说明】医学科研中统计学方法绪论课件.ppt,共(77)页,2.607 MB,由小橙橙上传
转载请保留链接:https://www.ichengzhen.cn/view-256051.html
以下为本文档部分文字说明:
医学科研中的统计学方法(StatisticalMethodsinMedicalSciences)授课对象:硕士研究生(理论-1班上机-3班)授课教师:宋曼殳Email:Tel:83911497(阶平楼230)授课时间:
2016.09.09—2016.11.18考试形式、教材及参考资料形式:试卷(80%)+上机(20%)教材:孙振球、徐勇勇主编.医学统计学(第4版)罗家洪、郭秀花主编.医学统计学计算机操作教程参考书:1.方积乾主编.
生物医学研究的统计方法2.张文彤或宇传华主编.SPSS操作教程网络课程网址:周次日期星期节次讲课内容授课教师学时29月9日五1~5绪论,统计表和统计图宋曼殳549月23日五1~5计量资料统计描述、参数估计、t检验宋
曼殳559月30日五1~5方差分析宋曼殳5710月14日五1~5定性资料的统计描述与统计推断宋曼殳5810月21日五1~5非参数检验、直线相关与回归宋曼殳51011月4日五1~5多重线性回归与多元逐步回归、logistic回归王
友信51111月11日五1~4生存分析、cox回归、总复习宋曼殳4教学进度(理论课)地点:一教楼108教室周次日期星期节次讲课内容授课教师学时备注910月28日五1~5SPSS介绍及基本操作;网络课程介绍张凤、罗艳侠、宋曼殳51
0自行安排五1~10统计描述,t检验;方差分析卡方检验;秩和检验罗艳侠10网络1211月18日五1~5相关回归;其他方法回归;综合实习张凤、罗艳侠、祝慧萍5教学进度(上机课)地点:二教楼404、405教室(张凤)二教楼410、411教室(罗艳侠)二教楼409教室(宋曼殳、祝慧萍
)考试时间(暂定):11月25日或12月2日第一章绪论第一节概述一、定义1.统计学(Statistics):是关于数据(data)的学问,是从数据中提取信息、知识的一门科学与艺术,包括研究设计、数据搜集、数据整理、数据分析和结果报告等步骤。现代统计
学的新观念统计学是对不确定性问题做决策的科学。从哲学角度看,统计学是从个性中寻找共性,透过偶然现象看事物内部本质规律的一种方法和手段。“统计学既是一门科学也是一门哲学。”统计学理论基础研究对象概率论数理统计有变异的事物概率论和
数理统计是一门随机数学分支,它们是密切联系的同类学科。但是概率论、数理统计、统计方法又都各有它们自己所包含的不同内容。概率论——是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性作出一种客观的科学判断,对这种出现的可能性大小做出数量上的描述;比较这些可能
性的大小、研究它们之间的联系,从而形成一整套数学理论和方法。数理统计——是应用概率的理论来研究大量随机现象的规律性;对通过科学安排的一定数量的实验所得到的统计方法给出严格的理论证明;并判定各种方法应用的条件以及方法、公式、结论的可靠程度和局限性。使我们能从一组样本来判定是否能以相当大
的概率来保证某一判断是正确的,并可以控制发生错误的概率。统计方法——是以上提供的方法在各种具体问题中的应用,它不去注意这些方法的的理论根据、数学论证。进行统计设计,收集、整理资料对所收集资料进行统计描述和处理对统计处理的结果进行分析和解释统计学的任务基本任务和作用
基本任务1.结合专业知识和具体要求进行统计设计、搜集和整理资料;2、对所搜集的资料进行统计描述和处理;3、对统计处理的结果进行分析和解释;并做出科学的结论,以指导今后的实践。作用能帮助人们有计划、有目的进行调查研究和实验研究,合理的分析和解释实验数据,科学
地揭示数据之间隐含的内在规律性。2.医学统计学(MedicalStatistics)统计+医学——交叉学科是研究医学和生物学中数据的设计、收集、整理与分析推断的一门学科。医学科研中的统计学方法•医学数据收集、表达和分析方法。•是以医学理论为指导,用统计学的原理和方法研究医学,侧重于临床医学中
的数据的搜集、整理和分析。其主要内容为:医学统计学的基本原理和方法,及其在医学研究领域的应用。•临床常用的统计方法:生存分析•多因素分析:多元回归与相关、logistic回归、Cox比例风险回归•当研发了一种治疗高血压的新药,应该怎样评价该药的疗效?•最基本的方法——比较•临床试验:将患者随机分
为两组:一组服用该药,另一组服用对照药,观测并记录两者药物的疗效,最后统计分析该药物的有效性和安全性•其中,统计学扮演什么角色?为何开设医学统计课?医学统计学的地位和作用为何开设医学统计课?医学统计学的地位和作用•在这个临床试验中有诸多问题需要回答:–需要多少名患者
参加试验?–如何随机地将患者分为两组?–哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效因素在两组的分布是一致的?–如果两组疗效存在一定差别,怎样比较两种药物的疗效到底是否存在差别?–换言之,我们需要了解这种差别是机会造成的,还是真实存在的?•统计学可以回答上述问题2.阅读医
学科技书刊杂志和撰写论文1.发现不确定现象背后隐藏的规律性二、学习医学统计学的重要性3.为开展科研工作打下基础据调查,新英格兰医学杂志(NewEnglandJ.Medical)、美国医学杂志(JAMA)、英国医学杂志(BritishJ.Medi
cal)和Lancett等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。“统计学是现代医学大厦的一个重要支柱”。---美国医学会杂志(JAMA)主编二、学习医学统计学的重要性国外研究项目中,统计的工作量和资金的投入占总科研的比例为2
0%至30%。“统计学的地位不仅仅做‘配角’,做装饰,而是顾问、参谋,甚至是决策者。”---胡良平二、学习医学统计学的重要性3.为开展科研工作打下基础医学工作者在从事科研工作时经常要进行统计咨询和统计分析工作。医学院校中,要求硕士和博士毕业论文的开题报告有统计方面的
思考和统计学家参加,毕业论文答辩前要求请统计学家进行审阅。二、学习医学统计学的重要性科研工作中常见的统计学问题科研工作中常见的统计学问题Wang,etal.Medicine,2016Zhao,etal.OMICS,2014老师,您好,我是2010级*
*医院的研究生,学号****,名叫****。我老师假期让我做个随访,现在数据处理方面有些问题不是很有把握,想请教您一下。这个随访是关于乳腺癌生存预后的研究,目的是研究一种血浆蛋白sdf-1水平对乳腺癌患者生存预后的影
响和临床价值,现在要做COX回归。有下面几个问题问您:1、现在有一个变量乳腺癌的病理类型(导管内癌,浸润性导管癌,黏液腺癌,乳腺肉瘤),临床上恶性度是有差别的,预后是不同的,那么我如何赋值比较恰当,比如按恶性度分别赋值1、2、3、4是否可行,另外乳腺癌的受体状态
ER、PR等阴性预后差,那么阳性、阴性如赋值0、1,是否应该有一定方向,赋值的大小方向是否应该与前面病理类型赋值大小方向一致,如果赋值方向不同是否会影响回归方程的结果。2、还有一个问题,乳腺癌的肿瘤分期是由T(肿瘤)、N(淋巴结)、M(远处转移)三个变量决定的,那么我做COX回归时,是把T、N
、M以及分期四个变量都引人方程还是只把肿瘤分期这个变量引人方程分析更恰当呢,国外相关文献只引人了临床分期。3、有一个变量手术前病程,时间从几天到几年不等,大小相差悬殊,我做回归时是否应当进行转换,用哪种转换比较好
,比如用lg缩小数据间差异再做回归分析是否合理。PS.估计您年后这段时间也挺忙的,有时间就帮给看一下,谢谢您,祝您新年身体健康,万事如意!1.要有一定的数学基础2.注重理解统计学的基本概念、基本原理、基本方法。搞清各种统计方法、公式的适用条件和正确用法3.培养科学的统计思维方法4.结合专业
,联系实际,边学边用,在实践中学,强调应用三、怎样学好医学统计学三、怎样学好医学统计学授之以鱼不如授之以渔要想帮助他人解决难题,还不如传授给他人解决难题的方法。三、怎样学好医学统计学临床流行病学和询证医学微信号:bysyr
cce三、怎样学好医学统计学三、怎样学好医学统计学三、怎样学好医学统计学三、怎样学好医学统计学一般步骤统计设计收集资料整理资料分析资料第二节统计工作的步骤1、统计设计(design)统计设计是解决在科研中如何控制实验误差、改善实验有效性与正确分析实验结果的关键,它对专业设计布
局的合理性与实验结论成立的可靠性起着重要保证作用。科研设计专业设计调查设计实验设计统计设计主要涉及抽样方法、调查技术、质量控制等主要涉及实验设计类型、分组方法、样本含量估计等原则:对照、重复、随机、盲法
临床试验设计(药物等)统计研究设计•估计研究对象的数量(样本大小估计)•跟据研究目的确定对照的类型•保证随机化和双盲原则的贯彻•跟据研究目的确定主要和次要考核指标•如何收集和汇总数据以保证数据质量•如何进行统计分析原始记录经常性资料专门报告卡统计报表资料来源现场调查一
时性资料实验室做实验根据研究目的实验设计的要求收集准确的完整的充满信息的原始资料。2.收集资料(Collectionofdata)3.整理资料(Sortingdata)就是将收集来的资料有目的,有计划地进行科学加工(对原始数据进行归纳整理,通常要做
成一览表,如:频数表)。目前数据管理一般采用统计软件,如:EpiData、SPSS、SAS。4.分析资料(Analysisofdata)就是将经过统计整理的结果,作一系列统计描述和统计推断,阐明事物的规律性。采用统计分析软件,如:SAS、SP
SS、STATA。统计分析统计描述统计推断假设检验参数估计点估计区间估计4、分析资料(Analysisofdata)统计描述按照设计要求,正确选择统计指标并进行计算;以最适的统计指标表达收集资料的数量特征——集中性与离散性和/或变量变化规律。统计推断在正确统计描述的基础上,根据样本提供的信息推断总
体,对统计指标的差别和关联性在一定条件下(犯错误的概率很小)进行统计分析和推论,为专业结论提供统计学依据4、分析资料(Analysisofdata)总结与注意事项结论可靠的关键调查或实验设计是否周密完善、是否按设计要求进行实施所选用指标是否具有特异性和客观性强、灵敏度和精确度高数据是否真实
可靠、样本含量是否足够大所选用的统计方法是否妥当;结果的解释是否正确。第三节资料类型(typesofdata)统计资料的分类医学统计资料数值变量资料(定量变量资料)——计量资料分类变量资料无序分类变量资料(计数资料)二项分布资料多项分布资料有序分类变量资料(等级资料)1.计量资料(quanti
tativedata):对每个观察单位用定量方法测定某项指标的数值大小所得的资料。特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)资料类型有数值变量(numericalvariable)与分类变量(categoricalv
ariable):2.计数资料(Enumerationdata)按性质或类别进行分组,然后再清点各组数目所得的资料。特点:无固有计量单位,如肤色(黑、白),血型(ABO),职业(工人、医生、教师等),性别(男女)
3.等级资料(Rankeddata)将观察单位按某项指标的等级顺序分组,再清点各组观察单位的个数所得的资料。特点:半定性或半定量的观察结果。有序多分类(ordinalcategorydata)①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。③尿蛋白:−,,+,++,+++
及以上某妇产科医生为了调查住院天数、分娩方式、妊娠结局是否与年龄、身高、体重、职业、文化程度有关,该研究者利用常规保存的病案首页数据,在某医院搜集了2014-2015年共计1400名妊娠分娩妇女的资料,按住院号排序后排在前面的10名妇女的有关数据见表1-1。职业、文化程度、分娩方式、妊娠
结局等变量的分类见表1-2。表1-110名妊娠分娩妇女的有关数据住院号年龄(y)身高(cm)体重(kg)职业文化程度住院天数(d)分娩方式妊娠结局2516276.0其他中学9顺产其他3215360.0其他小学7剖宫产足月
2815864.0其他中学10顺产足月2916268.0工人大学8剖宫产足月2715868.0农民小学6顺产其他3915866.5工人中学8剖宫产其他2316268.0其他小学11剖宫产其他2016270.5管理人员大学4顺产足月2716071.5其他中学3顺产其他2216270.0工
人大学7剖宫产足月表1-2分类变量的类别变量类别职业工人、农民、管理人员、知识分子、商业服务、其他文化程度文盲、小学、中学、大学及以上分娩方式顺产、先兆早产、助产、剖宫产妊娠结局足月、其他资料的类型数值变量——计量资料分类变量——二分类变量——计数资料无序多
分类变量有序多分类变量——等级资料三类资料间关系例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数<8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料计数资料第四节基本概念一、同质与变异(homogeneityan
dvariation)在科学研究中,除了直接关注的研究因素外,其他非研究因素(如性别、年龄)也会影响研究结果,为了突出研究因素的作用,需要使各比较组之间的非研究因素尽可能相同,即同质。即使非研究因素控制在相同条件下,个体的观察值之间也会有所不同(如双胞胎的性格、身高、体重等),
这种在同质基础上个体之间的差异称为变异。变异是统计学研究的基础,没有变异就无需统计学,统计学正是处理数据变异的科学。例如:研究某新药治疗胃溃疡的效果,所有研究对象都必须是确诊为胃溃疡的病人且病情相似,在这种同质的基础上观察治疗效果,有的人
治愈,有的人未愈,这种差异就是变异。二、总体与样本(populationandsample):总体(population):根据研究的目的所划定范围内的同质的个体构成的全体。样本(sample):总体中随机抽取的一部分。样本要具有:代表性、随机性和可靠性。样本总体(popul
ation):根据研究目的所确定的被研究事物(同质的个体所组成)的全体,即同质的所有观察单位某种变量值的集合。例如:调查2015年某城市正常成年男性发铅含量。观察对象:某城市所有成年男性观察单位:每个人变量:发铅含量变量值:每个人测定的发铅值。总体:2015年某城市
所有正常成年男性的发铅值。同质基础:同一年份、同一地区、同为正常成年男性。2、样本(sample):是从总体中随机抽取一部分个体所组成的集合。特性可靠性是指样本中每一个观察单位是否确属于既定的同质的总体。代表性
是指样本是否能充分反映总体的真实情况。三.误差的种类(typesoferror)(1)随机误差(randomerror)随机误差是由不确定原因引起的,不可避免和消除。其偏离总体的方向不能确定。包括随机测量误差和抽样误差。•随机测量误差(randommeasurem
enterror):没有固定的倾向,可使多次观测结果有大有小。•抽样误差(sampleerror):由于抽样造成的样本指标与总体指标之间的差别。(2)系统误差(systematicerror)是由于偏倚(bias)使研究结果按照
一个方向偏离总体,产生的错误结果,可校正和消除。00.10.20.30.40.50.6-4-3-2-101234均数真实值实测值频数随机误差系统误差(3)过失误差(grosserror)是由于科研设计错误,或实验
者的主观片面、粗心大意引起的误差。必须避免和剔除!如:不遵守随机化分组原则、主观选取研究对象、记录错误、技术路线不清、计算错误等。这种差错纯属责任事故,是完全不应该发生的。四、概率与频率(probabilityandrelativefrequency)什么是概率(probability)?概
率是度量随机事件A发生可能性大小的一个数量,记为P(A)。(描述总体的特征)可以证明:若当试验次数n充分大以后,频率k/n稳定地在某一确定值P的附近摆动。可用事件A的频率作为所求概率的近似值:P(A)≈f(A)=k/n.
什么是频率(relativefrequency)?若在n次同样的随机试验,事件A发生了k次,则比值k/n称为频率。(描述样本的特征)频率与概率的关系•抛掷硬币的试验结果某试验者抛掷硬币的试验━━━━━━━━━━━━━━━━━━━━━抛掷次数(n)出现正面次
数(k)频率(k/n)─────────────────────540.801030.302070.3550260.52100520.52━━━━━━━━━━━━━━━━━━━━━━•历史上许多名家做过抛掷硬币的试验,抛掷硬币试验结果如表5表
54人抛掷硬币试验结果━━━━━━━━━━━━━━━━━━━━━━━━试验者抛掷次数(n)出现正面次数(k)频率(k/n)─────────────────────━━━DeMorgan204810610.5180Buffon4,0402
0480.5069Pearson12,00060190.5016Pearson24,000120120.5005━━━━━━━━━━━━━━━━━━━━━━━━频率与概率的关系1.样本频率总是围绕概率上下波动2.样本含量n越大,波动幅度越小,频率越接近
概率。频率与概率间的关系必然事件P=1随机事件0<P<1不可能事件P=0P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件1、参数(parameter)是根据总体
分布的特征而计算的总体指标。一般用小写的希腊字母表示总体参数。如总体均数(μ)、总体标准差(σ)、总体率(π)等。2、统计量(statisticalvariable):由总体中随机抽取样本而计算的相应指标,一般用拉丁字母代表。如样本均数(x)、样本标准差(s)、样本率(p)
等。五、参数与统计量DesignCollectionofdataSortingdataAnalysisofdata各种设计方法统计分析资料收集与控制过程数据的整理学习要点1、医学统计学的定义和主要内容2、医学统计学的地位和作用3、统计学中的几个基本概
念4、医学统计工作的基本步骤5、统计资料的类型6、学习医学统计学应注意的问题