【文档说明】社会调查研究方法.pptx,共(51)页,464.390 KB,由精品优选上传
转载请保留链接:https://www.ichengzhen.cn/view-280770.html
以下为本文档部分文字说明:
第4讲抽样❖抽样与抽样调查❖抽样的术语与程序❖概率抽样❖非概率抽样❖样本大小年份总统竞选人盖洛普预测实际选举结果1936罗斯福、蓝敦55.7:44.360.8:36.51940罗斯福、威尔基52:4854.7:4
4.81944罗斯福、杜威51.5:48.553.4:45.91848杜鲁门、杜威44.5:49.549.5:45.11952艾森豪威尔、史蒂文森51:4955.1:44.41956艾森豪威尔、史蒂文森59.5:40.557.4:42.01960肯尼迪、尼克松51:4949.7:49.6196
4约翰逊、戈德华特64:3661.1:38.51968尼克松、汉弗莱、华434215434427135第一节抽样与抽样调查❖抽样是一种选择调查对象的程序和方法;即由总体中选取一部分代表的过程。❖选取样本的方法分为两大类:一类是非概率抽样。另一类概率抽样。
❖抽样调查的成功首先要求所选取的样本能够代表总体。❖所谓代表,也就是抽取出来的样本从调查所要研究的总体特征来看,能够再现总体的结构。❖概率抽样最具科学性。第二节抽样的术语与程序一、抽样的术语1.总体是指调查研究对象
全体所构成的集合;2.样本是指按照一定方法从总体中抽取出来进行调查的那部分对象的集合;3.抽样指的是从某个总体的集合中,按一定的方式选择或抽取一部分元素的过程。4.抽样单位是指抽样过程中使用的基本单位。5.样本框
是指抽样过程中抽取样本的所有抽样单位的名单。6.参数值也称总体值,是关于总体中某一变量的综合描述。7.统计值也称样本值,样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。8.抽样误差在用样本的统计值去推论总体的参数值时,总会存在着偏差,
这种偏差就是抽样误差。9.置信水平是指总体参数值落在样本统计值某一正负区间内的概率;10.置信区间是指在某一置信水平下,样本统计值与总体参数值间的误差范围。二、抽样的基本程序1.界定总体是对从中抽取样本的总体范围和界限作明确的界定。2.制定抽样框在确定了总体范围和抽样单位以
后,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。3.设计和抽取样本4.对样本进行评估。就是对样本的质量、代表性、偏差等进行初步的检验和衡量。第三节概率抽样一、简单随机抽样二、等距
抽样三、分层随机抽样四、整群抽样五、多阶段抽样❖一、简单随机抽样❖按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。❖1、抽签法❖2、随机数码法随机数字表一部分行1234567801339
93412497612316507573997792236198802390410577974278753010177960768220238035601126839385010332143259731484361500407397958534S7644380376659577364480180
5749985333713860894309582S65893965728065957295893697e5435979057060909064798077464513940286400012704261
176503405080842765238553845111482326715212623800809665615613030356540345399698874780018105067013172314602022434293594582441
0811539710870138356361491089105178556538124717703085374329405387057618599694381341494892704806312253003839601041457814074
0932874035148484374421867084326781503097122124309346224144311506518267具体步骤❖(1)先取得抽样框;❖(2)将总体中所有元素按顺序编号;❖(3)确定随机数表中
选取得数码位数;❖(4)用随机方法抽取第一个号码;❖(5)按照任意规则逐个抽取与样本单位顺序号码相符的号码与个数;❖(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。•例:在某个5000人的企业中抽取1000人进行问卷调查,如何操作?如果是10人如何抽取?
优点:简单易行缺点:只适用于总体数量不大,而且抽样框容易定位的调查;样本代表性差,误差大。二、系统抽样❖把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。1、具体步骤•(1)制定出抽样框。•(2)计算抽样间距K=N/n•(3
)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下个体编号(A)。•(4)在抽样框中,自A开始,每隔K个个体抽取一个个体,编号分别为A,A+K,A+2K,…,A+(n-1)K。•(5)将这n个个体合起来,就构成一个样本。
2、课堂作业❖要在某大学总共3000名学生中,抽取一个容量为100的大学生样本。❖我们先将3000名学生的名单依次编上号码;❖然后按上述公式可求得抽样间距为:30;❖在1~30的数码中,采用简单随机抽样的方法抽取一个
数字,假如抽到12,就以12为第一个号码;❖每隔30名再抽一个。这样,我们便可得到12,42,72,…,2972总共100个号码。❖再根据这100个号码,从总体中对应地找出100名学生,这100名学生就构成本次的一个样本。❖3、注意两种情况4、评
价❖优点:样本的分布比较均匀,抽样误差小于简单随机抽样。❖缺点:总体不能太多,要有完整的登记册;三、分层抽样❖分层抽样:将总体按某种特征划分成若干类型,然后再根据各类型所包含的抽样单位数与总体单位数的比例,确定从各类型中抽取样本单位
的数量。然后按照简单随机和等距抽样的方法抽取样本。例如:•了解某市800个企业的生产经营,第一产业80个,第二产业320个,第三产业400个,需选择100个调查,如何做?•计算比率:第一产业:10%,第二产业:40%,第三产业:50%;下一步是多少?•相应的个数:第
一产业:10,第二产业:40,第三产业:50•然后抽取具体的样本2.分层抽样的优点❖总体单位数量较多,单位之间差异较大的对象。样本代表性大,误差较小。❖缺点:必须充分了解总体,否则无法分类;3.分层抽样的运用❖(1)分层的标准。❖第一,以所要分析和
研究的主要变量或相关的变量作为分层的标准。❖第二,以保证各层内部同质性强、各层之间异质性强的变量作为分层变量。❖第三,以那些已有明显层次区分的变量作为分层变量;(2)分层的比例问题。❖按比例分层抽样是指按各种
类型或层次中的单位数目同总体单位数目间的比例来抽取样本。❖例:某地区有百货商店1000个,其中大型百货商店100个,中型百货商店300个,小型百货商店600个。如果总样本数定为20个,则各层应抽取的样本数为多少?四、整群抽样❖先将总体各单位按一定标准分成若干群体
,并将每一个群体看作一个抽样单位,然后按照随机原则从这些群体中抽取若干群体作为样本。❖例如,某大学共有100个班级,每班都是30名学生,总共有3000名学生,抽300名学生作为样本,如何抽取?❖从全校100个班级中,采取简单随机抽样的方法(或是系统抽样,分层抽样的方法)抽取10个班级,然后由这10
个班级的全部学生(300名)构成样本;和以上几种相比较,在样本数量相同的情况下抽样误差较大课堂练习❖假设总体是全国所有城市的集合(600),我们要抽取一个规模为40的样本,按照前面所介绍的方法如何抽取?❖1、简单随机抽样或系统抽样?❖2、
分层抽样(特大、大、中等、小城市)❖3、整群抽样(以省为抽样单位)五、多段抽样❖多段抽样是按抽样元素的隶属关系或层次关系,把抽样过程分为两个或以上阶段进行。◼在社会研究中,当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多段抽样的方法
来抽取样本。具体步骤❖先从总体中随机抽取若干大群(组),再从这几个大群(组)内抽取几个小群(组),这样一层层抽下来,直至抽到最基本的抽样元素为止。❖例如:某市共有6万名员工,他们分布在全国20个城市的400个单位中。现在要抽取一个由12
00名员工组成样本。❖如果按照三阶段抽样的方法,我们就可以有下列各种不同的抽样选择(见表)。如何选择方案?2、研究者所拥有的人力和财力大的类别较少,每一类别的个体较多考虑因素调查方案例子课堂练习:❖例
如,假定某山区县有20个乡镇(该县20个乡镇经济发展状况较好的、一般的和较差的3类分别为4个、12个和4个),平均每个乡镇有10个行政村,每个行政村有10个自然村,每个自然村有50户。这样,全县共有200个行政村、200
0个自然村、10万户。现决定采用多段随机抽样方法对该县计划生育状况按户做5‰的抽样调查,共抽取样本500户.❖其具体做法如下:首先,确定抽样单位。根据该县社会组织的4个层次,即乡镇、行政村、自然村和户,应采取4段随机抽样方法抽取样本,并
确定乡镇为第1级单位,行政村为第2级单位,自然村为第3级单位,户为第4级单位然后,采取不同抽样方法,分4段逐步抽取样本:❖一段抽样,从县抽到乡镇。由于该县乡镇之间经济发展状况差异较大,因而应采用宜于这类抽样单位的
类型分层抽样。❖其具体做法是:首先,编制抽样框。以经济发展状况为标准,将该县20个乡镇分为经济发展状况较好的、一般的和较差的3类(即3个群体),它们分别为4个、12个和4个。❖其次,确定样本数量。假定在第1级单位中抽取25%的单位即5个乡镇作为样本。❖再
次,简单随机抽取和上述比例,在经济发展状况较好的4个乡镇中抽1个乡镇,一般的几个乡镇中抽3个乡镇,较差的4个乡镇中抽1个乡镇,共5个乡镇组成第1级样本。❖二段抽样,从乡镇抽到行政村。为了使样本分布比较均匀,可考虑采用等距抽样。具体做法是:❖首先,编制抽样框。
把第1级样本5个乡镇的50个行政村编号l~50。❖其次,计算抽样间隔。假定从第2级单位中抽取20%的单位即10个行政村作为第2级样本,这样抽样间隔就应该是50÷10=5。❖再次,抽取第2级样本。就是先在第1抽样问隔内随机抽取
第1个样本,假定是编号为2的行政村,然后按照抽样间隔就可确定编号为2,7,12,17,22,27,32,37,42,47的10个行政村为第2级样本。❖三段抽样,从行政村抽到自然村。为了便于集中调查,节约人财物力和时间,可考虑采
取整群抽样方法。其具体做法是:首先,划分群体,即将第2级样本10个行政村所属的100个自然村,按照地理位置把每两个相近自然村划为一个群体,共分为50个群体。其次,抽取第3级样本,即按照随机原则从50个群体中抽出10个群体作为第3级样本。❖四段抽样,从自然村抽到户。为了简便易行,可采取简单随
机抽样方法。其具体做法是:❖首先,编制抽样框,就是编制第3级样本10个群体、20个自然村、1000户的名单,并按照一定标准确定每户的编号。❖其次,抽取第4级样本,即按照简单随机抽样方法从每个群体(即相近的两个自然村1
00户)中抽取50户、10个群体中抽出500户作为第4级样本.即最后实施调查的具体对象。❖从上例可以看出,多段随机抽样方法的优点:❖把各种抽样方法的优点综合起来,达到以最小的人财物力消耗和最短时间获得最佳效果的目的。❖
特别适合于调查总体范围大、单位多、情况复杂的调查对象。❖主要缺点:抽样误差较大,是各阶段抽样误差之和。第四节户内抽样与PPS抽样❖一、户内抽样❖采取一种被称做“Kish选择法”方式。具体做法:❖先将调查表分为(编号为)A、B1
、B2、C、D、E1、,E2、F八种,每种表的数目分别占调查表总数的1/6、1/12、1/12、1/6、1/6、1/12、1/12、1/6。❖其次,印制若干套(一套八种)“选择卡”发给调查员,每人一套。“选择卡”的形式如表综合调查员首先对家庭中的成年人排序◼然后,调查员按照调查表上的编号找出相同
的“选◼择表”,确定该选的个体序号,最后对之进行访谈。❖当分子公司的规模大小不一时……❖比如说,甲分子公司比较大,有1000员工,乙分子公司比较小,只有200员工。那么,当它们在第一阶段都被抽中后,第二阶段分别从它们中抽取50员工。❖甲分子公司中员工被抽中的概率为(20/
80)×(50/1000)=1/80。❖乙分子公司中员工被抽中的概率为(20/80)×(50/200)=1/16。多段抽样中,假定:即每一个阶段抽样时,其元素的规模是相同的。二、PPS抽样不等概率抽样方法,叫“概率与元素
的规模大小成比例抽样”(SamplingwithProbabilityProportionaltoSize),简称PPS抽样。•步骤:•第一阶段,每个群按照其规模被给予大小不等的抽取概率。大群具有比小群更大一些的概率。•第二阶
段,从每个抽中群中都抽取同样多元素。)(**群的规模所要抽取的元素平均每个群中)总体的规模群的规模(所抽取的群数=每个元素被抽中的概率这个公司中员工最终被抽中的概率是:20×(1/40)×(1/20)=1/40。甲公司第一阶段被抽中的概率是:1000/40000=1/4
0;第二阶段群中每一员工被抽中的概率是:50/1000=1/20;所选择的分子公司数目乙子公司中员工最终的被抽中的概率是:20×(1/200)×(1/4)=1/40。乙公司乙分子公司第一阶段被抽中的概率是:200/40000=1/200;第
二阶段群中每一员工被抽中的概率是:50/200=1/4;所选择的分子公司数目课堂作业名称人数企业13000企业27000企业36000企业44000企业55000企业610000企业71000企业88000企业9
2000企业109000第五节非概率抽样方法❖一、偶遇抽样:研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象。基本理论依据:调查总体的每个单位都是相同的。第四节非概率抽样一、偶遇抽样二、主观抽样1.判断抽样或立意抽样2.目
的抽样三、定额抽样四、滚雪球抽样第五节样本大小❖样本规模一般取决于:第一,抽样的精确度。第二,总体的规模。第三,总体的异质性程度。第四,研究者所拥有的经费、人力、时间。经验确定样本数的范围