【文档说明】高考数学(文)刷题小卷练:35 Word版含解析(含答案).doc,共(11)页,201.000 KB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-75596.html
以下为本文档部分文字说明:
刷题小卷练35统计案例小题基础练○35一、选择题1.一个年级有12个班,每个班有50名同学,随机编号为1~50,为了了解他们的课外兴趣,要求每班编号为40的同学留下来进行问卷调查,这里运用的抽样方法是()A.抽签法B.分层抽
样C.随机数法D.系统抽样答案:D解析:根据系统抽样的定义知选D.2.[2019·云南玉溪一中模拟]总体由编号为01,02,03,„,49,50的50个个体组成,利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机
数表第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编号为()66674067146405719586110564096876832037905716001166149084451175738805905227411486A.05B.09C.11D.20答案
:B解析:从随机数表第1行的第9列和第10列数字开始,依次是14,05,11,09,则第四个数字是09,故选B.3.[2019·贵州遵义联考]某校高三年级有1000名学生,随机编号为0001,0002,„,1000.现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是(
)A.0927B.0834C.0726D.0116答案:A解析:系统抽样就是等距抽样,被抽到的编号满足0122+5k,k∈Z.因为0927=0122+5×161,故选A.4.[2019·江西九校联考(一)]一组数据共有7个数,其中有10,2,5,2,4,2,还有一个数没记清,但
知道这组数据的平均数、中位数、众数依次成等差数列,则这个数的所有可能值的和为()A.3B.17C.-11D.9答案:D解析:设这个数是x,则平均数为25+x7,众数为2,若x≤2,则中位数为2,此时x=-11,若2<x<4,则中位数为x,此时2x=2
5+x7+2,所以x=3,若x≥4,则中位数为4,此时8=25+x7+2,所以x=17,所以这个数的所有可能值的和为(-11)+3+17=9.5.[2019·江西宜春模拟]某中学高一年级560人,高二年级540人,高三年级520人,用分层抽样的方法抽取容量为81的样本,则在高一、高二、高三三个年
级抽取的人数分别为()A.28,27,26B.28,26,24C.26,27,28D.27,26,25答案:A解析:根据题意得用分层抽样在各层中的抽样比为81560+540+520=120.则在高一年级抽取的人数是560×120=28,在高二年级抽取的人数是540×1
20=27,在高三年级抽取的人数是520×120=26.故选A.6.如表提供了某厂节能降耗改造后生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为y^=0.7x+0.35,则下
列结论错误的是()x3456y2.5t44.5A.回归直线一定过点(4.5,3.5)B.产品的生产能耗与产量成正相关C.t的取值必定是3.15D.A产品每多生产1吨,相应的生产能耗约增加0.7吨答案:C解析:由题意知,x-=14×(3+4+5+6)=184=4.5,则y-=0.7×4.5+0.3
5=3.5,即回归直线一定过点(4.5,3.5),故A正确;∵0.7>0,∴产品的生产能耗与产量成正相关,故B正确;∵y-=14×(2.5+t+4+4.5)=3.5,∴t=3,故C错误;A产品每多生产1吨,相应的生产能耗约增加0.7吨,故D正确.故选C.7.[2019·山西太原模拟]
已知某产品的广告费用x(单位:万元)与销售额y(单位:万元)具有线性相关关系,其统计数据如下表:x3456y25304045由上表可得线性回归方程y^=b^x+a^,据此模型预测广告费用为8万元时的销售额是()参考公式:b^=i=1nxi-x-·yi-y-i=
1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y--b^x-.A.59.5万元B.52.5万元C.56万元D.63.5万元答案:A解析:由表可知x-=4.5,y-=35,所以计算得b^=7,a^=3.5,所以线性回
归方程为y^=7x+3.5,所以广告费用为8万元时销售额的预测值为59.5万元,故选A.8.[2019·武汉调研]某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据
模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为()A.1169B.367C.6D.30答案:C解析:由茎叶图知,最低分为87分,最高分为99分.依题意得,15×(87+93+90+9×10+x
+91)=91,解得x=4.则剩余5个得分的方差s2=15×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=15×(16+4+1+9)=6.故选C.二、非选择题9.[2018·全国卷Ⅲ]某公司有大量客户,且不同年龄段客户对其服务的
评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.答案:分层抽样解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的
抽样方法是分层抽样.10.[2019·山西实验中学模拟]某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:产品数x个1020304050产品总成本(元)62a758189由
最小二乘法得到回归方程y^=0.67x+54.9,则a=________.答案:68解析:计算可得,x-=30,y-=307+a5,所以307+a5=0.67×30+54.9,解得a=68.11.[2019·江苏南京调研]为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆
汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案:80解析:时速在区间[40,60)内的汽车有200×(0.01+0.03)×10=80辆.12.[2019·广东东莞模拟]某班收集了50位同
学的身高数据,每一个学生的性别与其身高是否高于或低于中位数的列联表如下:高于中位数低于中位数总计男20727女101323总计302050为了检验性别是否与身高有关系,根据表中的数据,得到K2的观测值k=5
0×20×13-10×7227×23×30×20≈4.84,因为K2≥3.841,所以在犯错误的概率不超过________的前提下认为性别与身高有关系.答案:0.05解析:由于K2的观测值k=50×20×13-10×7227×23×30×20≈4.84,P(K2≥3.8
41)=0.05,在犯错误的概率不超过0.05的情况下认为性别与身高有关系.课时增分练○35一、选择题1.[2019·桂林月考]完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100
户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是()A.①简单随机抽样,②系统抽样B.①分层抽样,②简单随机抽样C.①系统抽样,②分层抽样D.①②都用分层抽样答案:B解析:因为社会购买能力的某项指标受到家庭收入的影响,而
社区中各个家庭收入差别明显,所以①用分层抽样法;从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样法,故选B.2.[2019·山西长治四校联考]某班组织学生参加数学测试,成绩的频率分布直方图如图
,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60答案:B解析:由题图可知,数据落在[20,40),[40,60)内的频率为(0.
005+0.010)×20=0.3,∴该班的学生人数是150.3=50.3.[2019·吉林长春质检]下面四个残差图中反映出回归模型的拟合精度较高的为()A.图①B.图②C.图③D.图④答案:A解析:根据残差图显示的分布情况即可看出,图①显示的残差点比较均匀地落在水平的带
状区域中,且带状区域的宽度最窄,所以拟合精度较高,故选A.4.[2019·长春质检]某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:同意限定区域
停车不同意限定区域停车合计男20525女101525合计302050则认为“是否同意限定区域停车与家长的性别有关”的把握约为()A.0.1%B.0.5%C.99.5%D.99.9%附:K2=nad-bc2a+bc+da+cb+d,其
中n=a+b+c+d.P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828答案:C解析:因为K2=50×20×15-5×10225×25×30×20≈8.3
33>7.879,所以约有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.5.[2019·吉林长春质检]已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为()A.95,94B.92,86C.99,86D.
95,91答案:B解析:由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现
次数最多的为众数,故众数为86,故选B.6.[2019·云南曲靖一中月考]下表是x,y的对应数据,由表中数据得线性回归方程为y^=0.8x-a^.那么,当x=60时,相应的y^为()x1520253035y612
142023A.38B.43C.48D.52答案:B解析:由表中数据,得x=25,y=15.∵回归直线必过点(x,y),∴15=0.8×25-a^,解得a^=5,∴线性回归方程为y^=0.8x-5.∴当x=60时,相应的y^=0.8×
60-5=43.7.某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如右图:根据右图,对这两名运动员的成绩进行比较,下列四个结论中不正确的是()A.甲运动员得分的极差大于乙运动员得分的极差B.甲运
动员得分的中位数大于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定答案:D解析:根据茎叶图可知,甲运动员的13场比赛得分分别为19,18,18,26,21,20,35,33,32,30,47,41,40;乙运动员的
13场比赛得分分别为17,17,19,19,22,25,26,27,29,29,30,32,33.对于A,极差是数据中最大值与最小值的差,由茎叶图中的数据可得甲运动员得分的极差为47-18=29,乙运动员得分的极差为33-17=16,故甲运动员得分的极差大于乙运动员得分的极差,因
此A正确;对于B,甲运动员的得分从低到高依次为18,18,19,20,21,26,30,32,33,35,40,41,47,处于中间的数是30,所以甲运动员得分的中位数是30,同理得乙运动员得分的中位数是26
,因此甲运动员得分的中位数大于乙运动员得分的中位数,故B正确;对于C,不难得出甲运动员得分的平均值约为29.2,乙运动员得分的平均值为25,因此甲运动员得分的平均值大于乙运动员得分的平均值,故C正确;对于D
,甲的方差s2甲≈113×[(19-29.2)2+(18-29.2)2+„+(40-29.2)2]≈88.18,同理,得乙的方差s2乙≈29.54,因为乙的方差小于甲的方差,所以乙运动员的成绩比甲运动员
的成绩稳定,故D不正确.故选D.8.[2019·河北石家庄二中模拟]下列说法正确的个数为()①在回归分析中,可用指数系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好.②在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好.③在回归分析中,可用相关
系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好.④在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.A.1B.2C.3D.4答案:B解析:用指数系数R2的值判断模型的拟合效果,R
2越大,模型的拟合效果越好,故(1)正确;可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确;可用相关系数r的值判断两个变量的相关性,|r|越大,说明相关性越强,故(3)不正确;残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明
模型的拟合精度越高,故(4)正确.综上可知有2个命题正确,故选B.二、非选择题9.某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50,并分组,第一组1~5号,第二组6~10号,„,第十组46~50号,若在第三组中抽得号码为12的学生,则
在第八组中抽得号码为________的学生.答案:37解析:组距为5,(8-3)×5+12=37.10.[2019·济南模拟]2017年2月20日,摩拜单车在某市推出“做文明骑士,周一摩拜单车免费骑”活动,为了解单车使用
情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为________.答案:4解析:由茎叶图得,该组数据分别是87,89,90,91,93,平均数是87+89+90+91+935=90,故方差s2=15
×(9+1+0+1+9)=4.11.[2018·全国卷Ⅱ]下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根
据2000年至2016年的数据(时间变量t的值依次为1,2,„,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,„,7)建立模型②:y^=99+17.5
t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解析:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y^=-
30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从
折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投
资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因
此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种
或其他合理理由均可)