【文档说明】经济统计学第3章.pptx,共(79)页,475.953 KB,由精品优选上传
转载请保留链接:https://www.ichengzhen.cn/view-323429.html
以下为本文档部分文字说明:
第三章统计整理第一节统计整理的基本问题统计整理的意义统计整理是统计工作的第二阶段。它是根据统计研究的任务,对统计调查所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合
特征的资料的工作过程。整理的内容整理要依据事先拟定的整理纲要要求的项目确定。整理纲要的内容包括一整套空白的综合表和编制说明。综合表的基本内容包括两部分:一部分是分组,一部分是相应的统计指标。总产值增加值销售成本管理费用利润总额
利税总额国企225107381.518074.72122.3493.62573.5集体3794808.22754.2201.69100.37244.46股份2626630.21999.9191.56169.37322.61外商3298.4585.72404.3196.23221.393
97.25港澳台1942.6430.81445.590.55106.22188.05其他102.8464.894.2215.9-2.96-1.55全国大中型工业企业主要经济指标(1996)(万元)第二节统计分组一、统计分组的意义统计分
组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。保持各组内统计资料的一致性与组和组之间资料的差异性。统计分组的作用统计分组基本作用有以下三方面:(一)划分现象的类型(二)揭示现象内部结构(三)分析现象之间的
依存关系三、分组标志的选择分组标志是统计分组的依据。正确选择分组标志,须考虑以下三点:(一)根据研究问题的目的来选择。(二)要选择最能反映被研究对象本质特征的标志作为分组标志。(三)要结合现象所处的具体历史条件或经济条件来选择。分组标志也有品质标志与数量标志两种。品质标志一般
不能用数量表示,它表明事物的质量属性,有的比较简单,有的则比较复杂。数量标志一般是用数量表示的,按数量标志进行分组,可有两种情况:不同标志值较少,可作成单项式分组;数值较多,变动范围较大,则应作组距式分组。品质标志分组——反映事物属性差异-单项式数量分组——运用于变量变动幅度小、项目少的分
组。如:看管机器台数分组(0,1,2,3,4,…)-组距式分组——运用于变量变动幅度大、项目多的分组。如:按月工资(元)分组(600~650,650~700,700~750,…)数量标志分组——反映事物数量差异单项式分组:工人看管设备数(台)工人人数(人)120240
315415按计划完成程度分组(%)企业数(个)比重(%)90以下47.4190-100814.29100-1103257.14110以上1221.43合计56100.00某地区工业企业总产值计划完成情况四
、简单分组、复合分组和分组体系简单分组又称单一分组,即只按一个标志进行分组。特点是:只能反映现象在某一标志特征方面的差异情况,而不能反映现象在其他标志方面的差异。复合分组是按两个或两个以上标志进行层叠分组。特点是:第一,对总体选择两个或两个
以上标志进行层叠分组,可以从几个不同角度了解总体内部的差别和关系,因而比简单分组能更全面、更深入地研究问题;第二,复合分组的组数随着分组标志的增加而成倍地增加。第三节分配数列(次数分布)月工资分组(元)工人数(人)占总数比重(%)1000以下21039.61000-150018735.
31500以上13325.1合计530100.0组别(变量)次数(频数)频率(比率)一、分配数列的概念和种类在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配和分配数列。分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比
率,又称频率。按品质标志分组成为品质数列。按数量标志分组形成为变量数列。单项式分组:工人看管设备数(台)工人人数(人)120240315415组距式分组:月收入(元)家庭数(户)频率%80~100100~120120~
140140~160160~180180~200200~220220~24057101386329.2612.9618.5224.0714.8711.115.563.70合计54100.00二组距数列的编制组限组距两端的数值。分为
上限和下限。组距某一组的上限和下限的距离,分等距和异距。全距分组数列中最大值的上限与最小值的下限之差。组中值组的上限和下限的中间值。因数列两端组限形式不同分:开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。闭口式组距:例
40-60分,90-100分。组距=上限-下限(一)确定组距和组数组距某一组的上限和下限的距离,分等距和异距。组距=上限-下限全距分组数列中最大值的上限与最小值的下限之差。组数全距等距数列的组距R=斯特奇斯公式(
组距公式):数据的个数—lg21.31nnRd+=斯特奇斯公式(组距公式):例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列:某班学生统计学考试成绩表考试成绩(分)人数(人)56-60260-10038合计40若把上表改变为如下统计表,则基本上能准
确反映总体的分布特征。某班学生统计学考试成绩表(表2-10)考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.01.等距数列各组组距均相等。如:10—
2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。2.异距数列各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料
分布离差较大或者是为了满足特殊的研究目的的需要。(二)等距分组和异距分组1.组限组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:按连续变量分组和按离散变量分组。职工人数(人)99以下100—199200—
299300—399固定资产额(万元)50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量上组限不在内(三)组限和组中值2.组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中
值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75合理确定组中值例如:第一组:50人以下第二
组:50—200人按公式(不合理)组中值2525020050−=−−=252/500=+=)(组中值应定下限为0例:分配数列的编制1、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每
一种标志表现出现的次数即可。如下例:100250合计4032208100805020国有企业股份制企业合资企业独资企业比重(%)企业数经济类型2、变量分配数列的编制:其基本步骤为:第一步:将原始资料按数值大小依次排列。第二步:确
定变量的类型和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距÷组数全距=最大变量值-最小变量值第四步:确定组限。注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数,计
算频率,并编制统计表。注意不同方法确定的组限在汇总单位数时的区别间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。职工人数(人)499以下500—599600—699700—799重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总
。产值(万元)50—6060—7070—8080—90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。三累计次数分布1.次数分布的表示方法⑴表示法——即用统计表来表示次数分布。例考分次数向上累计(上限)向下累计(下限)人数
(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820
.040100.0820.0合计40100.0----某班统计学考试成绩次数分配向上累计:以下累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。向下累计:以上累计次数
(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。(一)钟型分布(1)对称分布yxo钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。次数分布的主要
类型(2)偏态分布yxo右偏分布yxo左偏分布(二)U型分布yxoU型分布:特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。(三)J型分布yxoJ正型分布yxoJ反型
分布J型分布:特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J。次数分布的主要类型1、钟型分布(1)对称的钟型分布0204060801009101112131415人数(人)日产量(件)(2)左
偏分布020406080100491011121314人数(人)日产量(件)(3)右偏分布02040608010010111213141519人数(人)日产量(件)2、U型分布01020304050婴幼儿青少年中年人老年人死亡率(%)3、J型分布(1)02
0406080100120需求量价格返回J型分布(2)020406080100供应量价格第四节统计表一、统计表的作用(1)能使大量的统计资料系统化、条理化、因而能更清晰地表述统计资料的内容。(2)利用统计表便于比较各项目(指标)之间的关系,而且也便于计算(如有些计算表比用公式更简易、明了);(3)
采用统计表格表述统计资料比用叙述的方法表述统计资料显得紧凑、简明、醒目,使人一目了然;(4)利用统计表易于检查数字的完整性(是否有遗漏)和正确性。二、统计表的结构从内容上看,统计表由主词和宾词两部分组成。
主词是统计表所要说明的总体及其分组;宾词是用来说明总体的统计指标。从构成要素看,统计表包括以下三个部分。(1)总标题。就是统计表的总称,简要说明全表的内容,一般都写在表的上端中央。(2)分标题(又叫做标目)。就是指总体名称或分类名称及说明总体的各种项目。分横行标题(横标目)写在表的左方,
纵栏标题(纵标目)写在表的上方。(3)纵、横栏组成的本身及表中的数字。例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计2003年某月某公司各企业劳动生产率统计表单位____横行标题主词宾词总标题纵栏标题数据资料(指标数
值)三、统计表的种类简单表总体未分组分组表总体按一个标志进行分组复合表总体按二个或二个以上标志进行复合分组简单表表2-15某年某公司所属两企业自行车合格品数量表厂别合格品数量(辆)甲厂5000乙厂7000合计12000例复合表表2-16某
年某地区工业增加值和职工人数项目增加值(万元)职工人数(人)内资企业大型975013800中型860045000小型420010050外商投资经营企业大型73007500中型520010400小型44004500例四、编制统计表应注意的问题(1)统计表的标题(包
括总标题和分标题)应十分简明地概括所要反映的内容。(2)表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总体。(3)表中必须注明数字资料的计量单位。(4)表中数字上下位置对齐。
(5)统计表的表式,一般是开口式,即表的左右两端不画纵线,表的上下通常用粗线封口。(6)必要时,统计表应加以注解,连同数字的资料来源等一般都写在表的下端。统计表示例某居民小区家庭按月收入简单分组表直方图(或次数分配曲线
图)04812考分次数0102030比率(%)405060708090100110若组距不等的话,用标准组距人数,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-205171
73.420-25528285.625-30540408.030-355707014.035-45106532.56.545-50510102.0合计-230--直方图例010203040506070年龄人数02468101214频数密度
10152025303540455055统计图示例折线图——将直方图的各条形中点用线连接起来而得到。统计图示例圆形图/饼图:是以圆形的分割来表示总体的分组及结构。(某居民小区家庭按月收入分组情况)折线图在直方图的基础上连接各条
形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:04812考分次数0102030比率(%)405060708090100110折线图还可用来表示累计次数分布(仍以上例数据):累计次数分布折线图0102030405060708090100考分人数0255075100比率(%
)曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计❖1.全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。()❖2.对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。()❖3.重
点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。()❖4.我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。()❖5.采用重点调查搜集资料时,选择的调查单位是标志值较大的
单位。()❖6.与普查相比,抽样调查调查的范围小,组织方便,省时省力,所以调查项目可以多一些。()❖7.普查一般用来调查属于一定时点上社会经济现象的数量,它并不排斥对属于时期现象的项目的调查。()❖1.(×)❖2.(×)❖3.(×)❖4.(∨)❖5.(×)❖6.(∨)❖7.(∨)❖1.调查几个
重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于()。❖A、普查B、重点调查C、典型调查D、抽样调查❖2.重点调查中重点单位是指()。❖A、标志总量在总体中占有很大比重的单位B、具有重要意义或代表性的单
位❖C、那些具有反映事物属性差异的品质标志的单位D、能用以推算总体标志总量的单位❖3.下列调查中,调查单位与填报单位一致的是()。❖A、企业设备调查B、人口普查C、农村耕地调查D、工业企业现状调查❖4.下述各项调查中属于全面调查的是()。❖A、对某种连续生产的
产品质量进行检验❖B、对某地区对工业企业设备进行普查❖C、对全面钢铁生产中的重点单位进行调查❖D、抽选部分地块进行农产量调查❖1.(B)。❖❖2.(A)。❖❖3.(D)。❖❖4.(B)。❖1.统计分组
的关键问题是确定组距和组数。()❖2.组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。()❖3.分配数列的实质是把总体单位总量按照总体所分的组进行分配。()❖4.连续型变量和离散型变量在进行组距式分组时,均可采用
相邻组组距重叠的方法确定组限。()❖5.对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。()❖6.统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。()❖7.分组以后,各组的频数越大,则组的标志
值对于全体标志水平所起的作用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。()❖1.(×)❖2.(×)❖3.(∨)❖4.(∨)❖5.(∨)❖6.(∨)❖7.(×)❖1.普查是一种()❖A、专门组织的调查B、一次性调查C、经常性调查D、非全面调查E
、全面调查❖2.我国第四次人口普查的标准时间是1990年7月1日零时,下列情况应统计人口数的有()❖A、1990年7月2日出生的婴儿B、1990年6月29日出生的婴儿❖C、1990年6月29日晚死亡的人D、1990年7月1日1时死亡的人❖E、1990年6月26出生,7月1日6
时死亡的的婴儿❖1.(ABE)❖2.(BDE)❖1.在组距分组时,对于连续型变量,相邻两组的组限()。❖A、必须是重叠的B、必须是间断的❖C、可以是重叠的,也可以是间断的D、必须取整数❖2.下列分组中属于按品质标志分组的是
()。❖A、学生按考试分数分组B、产品按品种分组❖C、企业按计划完成程度分组D、家庭按年收入分组❖3.有一个学生考试成绩为70分,在统计分组中,这个变量值应归入()。❖A、60---70分这一组B、70---80分这一组❖C、
60—70或70—80两组都可以D、作为上限的那一组❖4.次数分配数列是()❖A.按数量标志分组形成的数列B.按品质标志分组形成的数列C.按统计指标分组所形成的数列D.按数量标志和品质标志分组所形成的数列❖5.将某地区国有企业按利润计划完成程度分为以下四组,正确的是()。❖A
:第一种B:第二种C:第三种D:第四种❖80%-89%80%以下80%以下85%以下❖90%-99%80.1%-90%80%-90%85%-95%❖100%-109%90.1%-100%90%-100%95%-105%❖110%以上100.1%-110%
100%-110%105%-115%❖110.1%以上110%以上115%以上❖6.复合分组是()。❖A、用同一标志对两个或两个以上的总体层叠起来进行分组❖B、对某一总体选择一个复杂的标志进行分组❖C、对同一总体选择两个或两个以上的标志层叠起来进行分组❖D、对同一总体选择两
个或两个以上的标志并列起来进行分组❖1.(A)。❖2.(B)。❖3.(B)。❖4.(D)❖5.(C)❖6.(C)❖1.统计分组的作用是()❖A、划分社会经济类型B、说明总体的基本情况❖C、研究同质总体的结构D、说明总体单位的特征❖E、研究现象之间的依存关系❖2.在组距数列中,组中值(
)❖A、上限和下限之间的中点数值B、用来代表各组标志值的平均水平❖C、在开放式分组中无法确定D、就是组平均数❖E、在开放式分组中,可以参照相邻组的组距来确定❖3.下列分组哪些是按品质标志分组()❖A、职工按工龄分组B、科技人员按职称分组C
、人口按民族分组D、企业按经济类型分组E、人口按地区分组❖1.(ACE)❖2.(ABDE)❖3.(B、C、D、E)