【文档说明】高考理数考前20天终极冲刺攻略: 统计 含答案解析.doc,共(12)页,707.000 KB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-75587.html
以下为本文档部分文字说明:
核心考点解读——统计抽样方法(I)用样本估计总体(II)两个变量的线性相关(II)1.从考查题型来看,选择题、填空题与解答题并重,并各有侧重,选择题、填空题中以考查抽样方法和用样本估计总体为主,兼顾两个变量的线性相关;解答题中则重点考查求回
归直线方程及独立性检验.2.从考查内容来看,主要考查抽样方法的选择,利用频率分布直方图、茎叶图等图表分析众数、中位数、平均数等数字特征,两个变量之间的线性相关等.3.从考查热点来看,用样本估计总体是高考命题的热点,频率分布直方图、茎叶图、众数、中位数、平均数等是考查的重点,
要能够对数据进行分析,然后对总体作简单、准确的评价.1.抽样方法(1)抽样方法包括:简单随机抽样、系统抽样、分层抽样.它们的共同点是抽样过程中每个个体被抽到的可能性相等,都是nN(N:个体总数,n:抽取的样本个体数);每次抽出个体后不再将其放回
,即是不放回地逐个抽样.不同点是简单随机抽样是从总体中逐个抽取个体,适用于总体个数较少的情况;系统抽样是总体个数较多,将总体分成几部分,按预先制定的规则在各部分中抽取,其中起始部分抽样采用简单随机抽样;
分层抽样是指总体由差异比较明显的几部分组成,则在这几部分中分层进行抽样,各层抽样采用简单随机抽样.简单随机抽样常采用的方法有抽签法与随机数法.2.用样本估计总体(1)用样本的频率分布估计总体的频率分布主要的图表:频率
分布表、频率分布直方图、茎叶图.优缺点:频率分布表:在数量表示上比较确切,但不够直观、形象,分析数据分布的主体趋势不太方便;频率分布直方图:能够很容易表示大量数据,非常直观地表明分布的形状,但得不出原始的数据内容;茎叶图:所有的数据信息都可以从茎叶图中得到,同时便于记录和读取,能够展示数据的
分布情况,但当样本数据较多或数据位数较多时,就显得不太方便.(2)用样本的数字特征估计总体的数字特征主要的数字特征:众数、中位数、平均数、极差、标准差和方差,要能从样本数据中找到众数与中位数,能够利用公式计算平均数、极差、标准差.平均数:12nxxxxn,极差:样本数据的最大
值与最小值的差,标准差:222121[()()()nsxxxxxxn.(3)由频率分布直方图进行相关计算时,需掌握这些公式:=频率组距频率组距,=频数频率样本容量.注意频率分布直方图的纵坐标是频率组距,而不是频率.3.两个变量
的线性相关(1)相关关系:正相关、负相关.正相关:因变量随自变量的增大而增大;负相关:因变量随自变量的增大而减小.(2)若两个变量之间具有线性相关关系,则点散布在一条直线附近,该直线为回归直线,能够用最
小二乘法求回归直线方程,能够利用相关系数来表明两个变量的线性相关性的强弱.求回归直线方程的步骤:先依据样本数据画出散点图,确定两个变量具有线性相关关系;然后计算出211,,,nniiiiixyxxy的值;再计算回归系数,ab,由此写出回归直线方程:ybxa.(3)能够进行独立性检
验独立性检验的一般步骤:i)根据样本数据列出22列联表;ii)计算随机变量2K的观测值k,查下表确定临界值0k:20()PKk0.500.400.250.150.100k0.4550.7081.3232.0722.70620()PKk0.050.0250.0100.005
0.0010k3.8415.0246.6357.87910.828iii)如果0kk,就推断“X与Y有关系”,这种推断犯错误的概率不超过20()PKk;否则,就认为在犯错误的概率不超过20()PKk的前提下不能推断
“X与Y有关系”.1.(2017高考新课标III,理3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论
错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳2.(2016高考新课标III,理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高
气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15oC,B点表示四月的平均最低气温约为5oC.下面叙述不正确的是A.各月的平均最低气温都在0oC以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20o
C的月份有5个3.(2015高考新课标II,理3)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论中不正确的是A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国
二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关4.(2017高考新课标II,理18)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各
箱水产品的产量(单位:kg).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并
根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,22()()()()()nadbcKabcdacbd5.(2016高考新课标III,
理18)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(I)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(II)建立y关于t的回归方程(系数精确到0.01),预测2016
年我国生活垃圾无害化处理量.附注:参考数据:719.32iiy,7140.17iiity,721()0.55iiyy,7≈2.646.参考公式:相关系数12211()()()()niiinniiiittyyrttyy
,回归方程yabt中斜率和截距的最小二乘估计公式分别为:121()()()niiiniittyybtt,=.aybt6.(2015高考新课标II,理18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区
:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算
出具体值,得出结论即可);(II)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结
果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.7.(2015高考新课标I,理19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费ix和年销售量1,2,,
8iyi数据作了初步处理,得到下面的散点图及一些统计量的值.xyw821()iixx821()iiww81()()iiixxyy81()()iiiwwyy46.65636.8289.81.61469108.8表中iw=ix,w=1881iiw.
(I)根据散点图判断,yabx与ycdx,哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);(II)根据(I)的判断结果及表中数据,建立y关于x的回归方程;(III)已知这种产品的年利润z与x,y的关系
为0.2zyx,根据(II)的结果回答下列问题:(i)年宣传费49x时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据11(,)uv,22(,)uv,…,(,)nnuv,其回归直线vu的斜率和
截距的最小二乘估计分别为:121()()=()niiiniiuuvvuu,=vu.1.某学校在高一新生入学后的一次体检后,为了解学生的体质情况,决定从该校的1000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的
第10个学生的编号为A.107B.097C.207D.1872.已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为A.30B.31C.32D.333.为了迎接2017年高考,了解
学生的成绩状况,在一次省质检中,某省教育部门随机抽取了500名学生的数学考试成绩,统计如下表所示:成绩X[75,85)[85,95)[95,105)[105,115)[115,125]人数Y301202101
0040(1)计算各组成绩的频率,并填写在表中;成绩X[75,85)[85,95)[95,105)[105,115)[115,125]人数Y3012021010040频率(2)已知本次质检数学测试的成绩2(,)XN:,其中近似为样本的平均数,2近似为样本方差2s,若该省
有10万考生,试估计数学成绩在(110,120]的人数;(以各组区间的中点值代表该组的取值)(3)将频率视为概率,若从该省所有考生中随机抽取4人,记这4人中成绩在[105,115)的人数为,求的分布列以及数学期望.参考数据:若2(,)ZN:,则()0.6826PZ
,(2PZ2)0.9544,(33)0.9974PZ.1.在一次数学测试中,唐老师对班上7名同学(记为,1,2,iGi„,7)第20题(满分12分)和第21题(满分12分)的得分情况进行统计,得分比(学生得分与满分的比值)如下图所示,其
中第20题的得分比为图中虚线部分,第21题的得分比为图中实线部分.记第20题,第21题的平均得分分别为12,xx,第20题,第21题得分的标准差分别为12,ss,则A.1212,xxssB.1212,xxssC.1212,xxss
D.1212,xxss2.近年来随着我国在教育科研上的投入不断加大,科学技术得到迅猛发展,国内企业的国际竞争力得到大幅提升.伴随着国内市场增速放缓,国内有实力的企业纷纷进行海外布局,第二轮企业出海潮到来.如在智能手机行业,国产品牌已在赶超国外巨头,某品牌手机公司一直默默
拓展海外市场,在海外共设有30多个分支机构,需要国内公司外派大量70后、80后中青年员工.该企业为了了解这两个年龄层的员工是否愿意被外派工作的态度,按分层抽样的方式从70后和80后的员工中随机调查了100位,得到数据如下表:愿意被外派不愿意被外派合计70后
20204080后402060合计6040100(1)根据调查的数据,能否在犯错误的概率不超过0.1的前提下认为“是否愿意被外派与年龄有关”,并说明理由;(2)该公司举行参观驻海外分支机构的交流体验活动,拟安排6名参与调查的70后、80后员工
参加.70后员工中有愿意被外派的3人和不愿意被外派的3人报名参加,从中随机选出3人,记选到愿意被外派的人数为x;80后员工中有愿意被外派的4人和不愿意被外派的2人报名参加,从中随机选出3人,记选到愿意被外派的人数为y,求xy的概率.参考数据:20()PKk0.150.1
00.050.0250.0100.0050k2.0722.7063.8415.0246.6357.879参考公式:22()()()()()nadbcKabcdacbd,其中nabcd.
真题回顾:1.A【解析】观察折线图,每年7月到8月折线图呈下降趋势,月接待游客量减少,选项A说法错误;折线图整体呈现出增长的趋势,年接待游客量逐年增加,选项B说法正确;每年的接待游客量7,8月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,选项C说
法正确;每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,选项D说法正确.2.D【解析】由题图可知各月的平均最低气温都在0oC以上,A正确;由题图可知七月的平均温差大于7.5oC,而一月的平均温差小于7.5oC,
所以七月的平均温差比一月的平均温差大,B正确;由题图可知三月和十一月的平均最高气温都大约在10oC,基本相同,C正确;由题图可知平均最高气温高于20℃的月份有3个,所以不正确.故选D.3.D4.(1)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖
法的箱产量不低于50kg”,由题意知PAPBCPBPC,旧养殖法的箱产量低于50kg的频率为0.0120.0140.0240.0340.04050.62,故PB的估
计值为0.62.新养殖法的箱产量不低于50kg的频率为0.0680.0460.0100.00850.66,故PC的估计值为0.66.因此,事件A的概率估计值为0.620.660.4092.(2)根据箱产量
的频率分布直方图得列联表:箱产量50kg箱产量50kg≥旧养殖法6238新养殖法34662K的观测值22006266343815.70510010096104k,由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养
殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图面积为0.0040.0200.04450.340.5,箱产量低于55kg的直方图面积为0.0040.0200.0440.06850.680.5,故新养殖法箱产量的中位数的估计值为0.50.
345052.35(kg)0.068.5.(I)由折线图中数据和附注中参考数据得4t,721()28iitt,721()0.55iiyy,777111()()40.1749.322.89iiiiiiiitt
yytyty,99.0646.2255.089.2r.因为y与t的相关系数近似为0.99,说明y与t的线性相关相当高,从而可以用线性回归模型拟合y与t的关系.(II)由9.321.3317y及(
I)得71721()()2.89ˆ0.10328()iiiiittyybtt,ˆˆ1.3310.10340.92aybt.所以,y关于t的回归方程为:ty10.092.0ˆ.将2016年对应的9t代入回归方程得:82.19
10.092.0ˆy.所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.6.(I)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散
.(II)记A1C表示事件:“A地区用户的满意度等级为满意或非常满意”;A2C表示事件:“A地区用户的满意度等级为非常满意”;B1C表示事件:“B地区用户的满意度的等级为不满意”;B2C表示事件:“B地区用户的满意度的等级为满意”.则A1C与B1C独立,A2C与B2C独立,B1C与B2C互斥,
B1A1B2A2CCCCC.B1A1B2A2()()PCPCCCCB1A1B2A2()()PCCPCCB1A1B2A2()()()()PCPCPCPC.由所给数据得A1C,A2C,B1C,B2C发生的频率分别为1620,420,1020,820.故A1()PC
16=20,A2()=PC420,B1()=PC1020,B2()PC8=20,故101684()=+0.4820202020PC.7.(I)由散点图可以判断,ycdx适宜作为年销售量y关于年宣传费x的回归方程类型.(II)令wx,先建立y关于w的线性回归方程
,由于81821()()()iiiiiwwyydww=108.81.6=68,∴cydw=563−68×6.8=100.6,∴y关于w的线性回归方程为100.668yw,因此y关于x的回归方程为100.668yx.(III)(
ⅰ)由(II)知,当x=49时,年销售量y的预报值100.66849y=576.6,年利润z的预报值为576.60.24966.32z.(ⅱ)根据(II)的结果知,年利润z的预报值ˆ0.2(100.668)13.620
.12zxxxx,所以当13.66.82x,即46.24x时,ˆz取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.名校预测1.【答案】D【解析】由题意知组距为100020,50则抽取学生的编号组成以7为首项,20为公差的等差数列,其通项公式为1072
01,720101187.nana故选D.2.【答案】B【解析】由茎叶图可知乙组数据的中位数为:,结合题意可知甲组数据的中位数为33,即,则甲组数据的平均数为:.故选B.3.【解析】(1)填表如下:成绩X[
75,85)[85,95)[95,105)[105,115)[115,125]人数Y3012021010040频率0.060.240.420.20.08(2)依题意,800.06900.241000.421100.21200.08100x
,故224000.061000.2400.421000.24000.08100s,故2(100,10)XN:,故0.95440.6826(110120)0.13592PX,故所求人数为0.1359
10000013590=(人).(3)依题意,任取1人,成绩在[105,115)的概率为15,1(4,)5B:,44256(0)()5625P,13414256(1)C()55625P,22241496(2)C()()55625P,334
1416(3)C()55625P,411(4)()5625P,所以的分布列为01234P25662525662596625166251625故14455E.专家押题1.【答案】C【解析】第20题,第21题的满分分值相同,由题图可知,7名同学第20题的得
分比均高于第21题的得分比,所以第20题的平均得分高于第21题的平均得分,故12xx;又由题图可知,第20题的得分比离散程度相对较小,所以第20题得分的标准差小于第21题得分的标准差,故12ss.故选C.2.【解析】(1)计算得2K的观测值为2()()(
)()()nadbckabcdacbd2100(20204020)406060404004001002.7782.7065760000,所以能在犯错误的概率不超过0.1的前提下认为“是否愿意被外派
与年龄有关”.(2)“xy”包含“0,1xy”、“0,2xy”、“0,3xy”、“1,2xy”、“1,3xy”、“2,3xy”,共6个互斥事件,且031233423366CCCC144(
0,1)2020400CCPxy,032133423366CCCC11212(0,2)2020400CCPxy,033033423366CCCC144(0,3)2020400CCP
xy,122133423366CCCC912108(1,2)2020400CCPxy,123033423366CCCC9436(1,3)2020400CCPxy,213033423366CCCC9436(2,3)2020400CCPxy,所
以412410836362001()4004002Pxy.即xy的概率为12.