【文档说明】(新高考)高考数学一轮 数学单元复习 过关检测卷第09章《统计与统计案例》(解析版).doc,共(38)页,1.464 MB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-29189.html
以下为本文档部分文字说明:
01卷第九章统计与统计案例《过关检测卷》-2022年高考一轮数学单元复习(新高考专用)第I卷(选择题)一、单选题1.(2021·重庆巴蜀中学高三月考)城市道路由于通勤造成道路交通的早晚高峰.一般地,工作日早高峰时段通常在7:00-9:00,晚高峰时段通常在17:00-19:00.为了衡量
某路段在某一段时间内的拥堵程度,通常采用的指标之一是路段的汽车平均行程速度,即在该时间段通过该路段的汽车的平均速度.路段通常可分为快速路、主干路、次干路、支路,根据不同路段与汽车平均行程速度,可将拥堵程度分为1到5级.等级划分如表(单位:km/h):等级12345快速路>6550,65
35,5020,35≤20主干路>4535,4525,3515,25≤15次干路>3525,3515,2510,15≤10支路>3525,3515,2510,15≤10重庆市的黄花园大桥横跨嘉陵江之上,是连接渝中区和江北区的
主干路.今在某高峰时段监测黄花园大桥的汽车平均行程速度,将得到的数据绘制成频率分布直方图如图,根据统计学知识估计该时段黄花园大桥拥堵程度的等级为()A.2级B.3级C.4级D.5级【答案】B【分析】结合频率
分布直方图求出平均速度,然后根据表格中的信息即可得出结论.【详解】解:由题意可知,组距为10,共6组,由六个矩形面积之和为1,可得速度在[50,60]内的频率为0.05,因此平均速度为5×0.1+15×0.15+25×0.2+35×0.3+45×0.2+55×0.05=30(km/h),根据表
格中的信息可知,其拥堵等级为3.故选:B.2.(2021·江苏泰州市·泰州中学高一期末)在一组样本数据中,1,3,5,7出现的频率分别为p1,p2,p3,p4且411iip,若这组数据的中位数为6,则p4=()A.0.5B.0.4C.0.2D.0.1【答案
】A【分析】由样本数据中只有1,3,5,7,没有6知样本数据一共有偶数个数,且从小到大排序后中间两个数为5,7,从而求得.【详解】∵样本数据中只有1,3,5,7,没有6,∴样本数据一共有偶数个数,且从小到大排序后中间两个数为5,7,∴样本数据中有一半是7,
∴p4=0.5,故选:A.3.(2021·湖南长沙市·长郡中学高二期末)已知数据122000,,,xxx的方差为4,若12(1,2,,2020)iyxi,则新数据122000,,,yyy的方差为()A.2B.4C.8D.16【答案】D【分析】利用方差的定义求解即可【详解】解
:由题意可得2221220001[()()()]42000xxxxxx,因为12(1,2,,2020)iyxi,所以2yx,所以新数据122000,,,yyy的方差为2221220001[()()()]2000yyyyyy2221220001[
(22)(22)(22)]2000xxxxxx2221220001[4()4()4()]2000xxxxxx22212200014[()()()]2000xxxxxx4416,故选:D4.(
2021·上海市大同中学高二期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增病例数据,一定符
合该标志的是()A.甲地:总体均值为2,总体方差为3B.乙地:总体均值为3,中位数为4C.丙地:总体均值为1,总体方差大于0D.中位数为2,总体方差为3【答案】A【分析】利用平均数、中位数、方差的计算公式以及含义,对
四个选项逐一分析判断即可;【详解】解:对于A:假设至少有一天的疑似病例超过7人,此时方差221823.6310s,这与题设矛盾,所以假设不成立,故A正确.对于B:平均数和中位数不能限制某一天的病例不超过7人,故B不正确,对于C:当总体方差大于0,不知道总体方差的具体数
值,因此不能确定数据的波动大小,故C不正确,对于D:中位数为2,总体方差为3,如2,2,2,2,2,3,3,3,3,8,平均数为12222233338310,方差2222152343383310s,满足题意,但是存在大
于7的数,故D错误;故选:A5.(2021·宁夏长庆高级中学高二期末(理))通过随机询问110名不同的我校学生是否爱好某项运动,得到如下的列联表:经计算2K的观测值7.8k.参照附表,得到的正确结论是
()附表:男女总计爱好402060不爱好203050总计60501102PKk0.0500.0100.001k3.8416.63510.828A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过
0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【答案】A【分析】根据表格中的数据,求得2K的值,结合附表,即可得到结论.【详解】由表格中的数据,可得22110403020207.860506050K
,因为27.86.635K,所以有99%以上的把握认为“爱好体育运动与性别有关”.故选:A.6.(2021·福建泉州市·泉州五中高二期末)第24届冬季奥林匹克运动会将于2022年在北京举办,为了解某
城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计得到如下2×2列联表男女合计关注冰雪运动352560不关注冰雪运动152540合计5050100根据列联表可知()参考公式:22()()()()()nadbcKabcdacbd,其中nabcd.附表:20PK
k0.1000.0500.0100.0010k2.7063.8416.63510.828A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性届民中大约有95%的人关注冰雪运动C.有95%的把握认为该市居民是否关注冰雪运动与性别有关D.有99%的把握认为该市居民是否关注冰
雪运动与性别无关【答案】C【分析】根据列联表中数据计算2K,对照临界值得出结论.【详解】解:根据22列联表中数据,计算22100(35252515)254.167505060406K,经查对临界值表知2(3.841)0.05PK….所以有95%的
把握认为该市居民是否关注冰雪运动与性别有关,选项C正确.故选:C.7.(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文))下列说法错误的是()A.回归直线过样本点的中心,xyB.在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高C.线性回
归方程对应的直线ˆˆˆybxa至少经过其样本数据点11,xy,22,xy,…,,nnxy中的一个点D.在回归分析中,20.98R的模型比20.80R的模型拟合的效果好【答案】C【分析】利用线性回归的相关定义即可得出答案【详
解】样本中心点一定在线性回归方程上,则A正确;残差点分布越窄越均匀,拟合程度越高,则B正确;样本点不一定在线性回归直线上,则C错误;2R越接近于1,模拟程度越好,则D正确.故选:C.二、多选题8.(2021·江苏省锡山高级中学高二期末)在发生公共卫生事件期间,有专业机构认为该事件
在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:中位数为2,极差为5;乙地:总体平均数为2,众数为2;丙地:总体平均数为1,总体方差
大于0;丁地:总体平均数为2,总体方差为3.则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的有()A.甲地B.乙地C.丙地D.丁地【答案】AD【分析】假设最多一天疑似病例超过7人,根据极差可判断AD;根据平均数可算出10天疑似病例总人数,可判断
BC.【详解】解:假设甲地最多一天疑似病例超过7人,甲地中位数为2,说明有一天疑似病例小于2,极差会超过5,甲地每天疑似病例不会超过7,选A.根据乙、丙两地疑似病例平均数可算出10天疑似病例总人数,可推断最多一天疑似病例可能超过
7人,由此不能断定一定没有发生大规模群体感染,不选BC;假设丁地最多一天疑似病例超过7人,丁地总体平均数为2,说明极差会超过3,丁地每天疑似病例不会超过7,选D.故选:AD.9.(2021·湖南长沙一中高一月考)从某小学随机
抽取100名学生,将他们的身高(单位:厘米)按照区间[100,110),[110,120),[120,130),[130,140),[140,150),进行分组,得到频率分布直方图(如图),下列说法正确的有()A.若要从身高在[120,1
30),[130,140),[140,150]三组内的学生中.用等比例分层抽样的方法选取18人参加一项活动.则从身高在[140,150]内的学生中应选取3人;B.估计这100名学生的平均身高是128.5(厘米)C.估计这100名学生的第80百分位数为135(厘米)D.估计这100名学生的众
数是115(厘米)【答案】ACD【分析】首先求得n的值,然后利用比例关系可求得身高在[140,150]内的学生中应选取的人数,由平均数公式可求得平均身高,由直方图可求得第80百分位数和众数.【详解】由题意可得:
0.0050.0350.0200.010101n,解得:0.030n,则身高在[120,130),[130,140),[140,150]三组内的学生的比例关系为:0.030:0.020:0.0103:2:1,故从身高在[140,150]内的学生中应选取11833
21人,选项A正确;估计这100名学生的平均身高是:1050.0051150.0351250.0301350.0201450.01010124.5(厘米),选项B错误;由于0.010100.10.2,0.0200.010100.30.2
,故设这100名学生的第80百分位数为x厘米,则:1400.020100.0100.2x,解得:135x,即这100名学生的第80百分位数为135(厘米),选项C正确;由频率分布直方图可估计这100名学生的众数是110120115(2厘米),选
项D正确.故选:ACD.10.(2021·海南华侨中学高一期末)若一组数据:1236,,,xxxxL的平均值为2,方差为3,则关于数据123623,23,23,,23xxxx说法正确的是()A.平均值为-2B.方差为6C.平
均值为4D.方差为12【答案】AD【分析】利用平均数、方差的概念进行求解即可.【详解】1236,,,xxxxL的平均值为2,方差为3,即11236222223622222,366xxxxxxxx
LL,则1236232323236xxxx12362366xxxx1236266xxxx2262,
故A正确;222236212322322322326xxxx22223621222222226xxxx
22222136422226xxxx22222316222246xxxx4312
故D正确,故选:AD.11.(2021·重庆西南大学附中高一期末)在一次测验中共有500名同学参赛,经过评判,这500名考生的得分都在40,90之间,其得分的频率分布直方图如图,则下列结论正确的是()A.可求得0.005aB.这500名参赛者得分的平均数为65C.得分在60,80之间
的频率为0.5D.得分在40,60之间的共有200人【答案】ACD【分析】首先根据频率和为1可求得a的值,进而可求其它量,逐项分析即可得解.【详解】根据评率分布直方图可得10.350.30.20.10.00510a,A正确;平均数450.
05550.35650.3750.2850.164.5,B错误;得分在60,80之间的频率为0.30.20.5,C正确;得分在40,60之间的共有0.4500200,D正确;故选
:ACD12.(2021·广东高二期中)下列说法正确的是()A.对于独立性检验,随机变量2K的观测值k值越小,判定“两变量有关系”犯错误的概率越小B.在回归分析中,相关指数2R越大,说明回归模型拟合的效果越
好C.随机变量~,Bnp,若30E,20D,则45nD.甲、乙、丙、丁4个人到4个景点旅游,每人只去一个景点且每个景点都有人去,设事件M为“4个人去的景点各不相同”,事件N为“甲不去其中的A景点”,则34PMN【答案】BD
【分析】利用独立性检验可判断A选项;利用相关指数与回归模型的拟合效果可判断B选项;利用二项分布的期望和方差公式可判断C选项;利用分步计数原理结合古典概型的概率公式可判断D选项.【详解】对于A选项,对于独立性检验,随机
变量2K的观测值k值越小,判定“两变量有关系”犯错误的概率越大,A选项错误;对于B选项,在回归分析中,相关指数2R越大,说明回归模型拟合的效果越好,B选项正确;对于C选项,随机变量~,Bnp,则30120EnpDnpp,解得9013np
,C选项错误;对于D选项,利用分步计数原理结合古典概型的概率公式可得3344334APMNA,D选项正确.故选:BD.13.(2021·辽宁大连二十四中高二期中)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖
音的人数占男生人数的45,女生喜欢抖音的人数占女生人数的35,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生有可能()附:22nadbcKabcdacbd20PK
k0.0500.0100k3.8416.635A.25B.45C.60D.40【答案】BC【分析】先设男生人数为5n,*nN,列出列联表,利用独立性检验计算观测值,再结合观测值列关系即得答案.【详解】解:由题意被调查的男女生人数相同,设男生的人数为:5n,*nN
,由题意可列出22列联表:男生女生合计喜欢锻炼4n3n7n不喜欢锻炼n2n3n合计5n5n10n222()10(423)10()()()()557321nadbcnnnnnnKabcdacbdnnnn
.由于有95%的把握认为是否喜欢抖音和性别有关,所以103.8416.63521n„;解得:8.066113.9335n„,因为*nN,故n的可能取值为:9、10、11、12、13
,即男生的人数可以是45,50,55,60,65.则选项中被调查学生中男生的人数可能45或60.故选:BC.14.(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点1122,,,
,...,,nnxyxyxy及其线性回归方程ˆˆˆybxa,下列说法正确的有()A.相关系数r的绝对值r越接近0,表示x,y的线性相关程度越强B.相关系数r的绝对值r越接近1,表示x,y的线性相关程
度越强C.残差平方和越大,表示线性回归方程拟合效果越好D.若1111,nniiiixxyynn,则点,xy一定在线性回归方程ˆˆˆybxa上【答案】BD【分析】根据相关系数绝对值大小,判断向量,xy相关性强弱,可判定选项A,B;根
据残差分析,判断线性回归方程的拟合效果,可判定选项C;根据样本中心点与线性回归直线的关系,即可判定选项D.【详解】当相关系数r的绝对值r越接近1,表示x,y的线性相关程度越强,选项A错误,选项B正确;残差平方和越小,表示线性回归方程拟合效果越好,选项C错误;样本中心点,xy一定在线
性回归直线ˆˆˆybxa上,选项D正确.故选:BD.15.(2021·河南高二期中(文))某校为了解学生对餐厅食品质量的态度(满意或不满意),对在餐厅就餐的学生随机做了一次调查,其中被调查的男、女生人数相同,有16的男生态度是“不满意”,有13的女生态
度是“不满意”,若有99%的把握认为男生和女生对餐厅食品质量的态度有差异,则调查的总人数可能为()22nadbcKabcdacbd,其中nabcd.临界值表:P(20Kk)0.1000.0500.0100.0010k2.7063.8416.63
510.828A.120B.160C.240D.360【答案】C【分析】设总人数为2n,写出列联表,利用公式计算2K的值,由题意应当在0.01和0.001的临界值之间,解不等式得到2n的取值范围,从而做出选择.【详解】设总人数为
2n,则列联表为:男女合计满意56n23n32n不满意6n3n2n合计nn2n2252226363,32722nnnnnnKnnnn由题意得26.63510.82827n,解
得179.1452292.36n,nQ为整数,所以调查的总人数至少为180人,至多为292人,故选:C.第II卷(非选择题)三、填空题16.(2021·重庆高二期末)某同学对变量,xy进行回归分析时收集了几组观测
数据如表所示,x1234y0.60.8m1.5但他不小心丟失了一个数据(用m代替),在数据丢失之前该同学根据散点图判断出y与x线性相关,并计算出线性回归方程为ˆ0.30.25yx,则m的值为___________.【答案】1.1【分析】求出,xy,利用样本点中心的性
质得出m的值.【详解】12340.60.81.52.92.5,444mmxy因为2.90.32.50.254m,所以1.1m故答案为:1.117.(2021·焦作市第一中学高一期末)某单位年龄(单位:岁)在20,30的员
工有40人,年龄在30,50的员工有60人,年龄在50,60的员工有20人.现准备用分层抽样的方法从这些员工中选拔18人代表单位参加技术比武活动,则选拔出的员工中,年龄小于50岁的员工人数为______.【答案】15【分析】利用分
层抽样的性质直接求解.【详解】解:总人数为:406020120人,年龄小于50岁的员工人数为:4060100人,则用分层抽样的方法从这些员工中选拔18人代表单位参加技术比武活动,则选拔出的员工中,
年龄小于50岁的员工人数为1001815120人.故答案为:15.18.(2021·哈尔滨工业大学附属中学校高一期末)某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻炼时间(单位:h),数据如下,甲66.577.58乙678
9101112丙34.567.5910.51213.5估计这个学校高一年级学生一周的平均锻炼时间___________【答案】8.2h【分析】利用甲,乙,丙的平均数计算总体平均数.【详解】样本中甲、乙、丙三个班级的平均锻炼时间分别为66.577.5875h
,678910111297h34.567.5910.51213.58.258h则样本平均数为577988.258.2578.估计该校高一年级学生一周的平均锻炼时间为8.2h.故答案为:8.2h19.(2021·重庆江北
区·字水中学高二期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据(,)xy,如下表所示.(残差=观测值-预测值)x3456y2.534m根据表中数据,得出y关于x的经验回归方程为0.7yxa.据此计算出在样本(
4,3)处的残差为0.15,则表中m的值为______.【答案】4.5【分析】首先由已知条件求出a的值,再由回归直线过样本中心点即可求解.【详解】因为样本(4,3)处的残差为0.15,即30.740.15yya
,所以0.35a,所以回归方程为:0.70.35yx,因为34564.54x,2.5349.544mmy,因为样本中心点,xy在回归直线上,所以9.50.74.50.354m,解得:4.5m,故答案为:4.5.20.(2021·河南高二期
中(文))某企业计划通过广告宣传来提高销售额,经统计,产品的广告费x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x01234y14.830.436.239.651由表中的数据得线性回归方程为ˆˆ8yxa.投入的广
告费6x时,销售额的预报值为______百万元.【答案】66.4【分析】先求平均值,再代入线性回归方程得a,最后利用线性回归方程估计结果.【详解】因为0123425x;14.830.436.239.65134.45y所以ˆ34.
482a,∴ˆ18.4a因此6x时,ˆ8618.466.4y故答案为:66.421.(2021·天津西青区·高二期末)对两个变量x,y进行回归分析.①残差的平方和越小,模型的拟合效果越好;②相关系数r的
绝对值接近于0,两个随机变量的线性相关性越强;③在经验回归方程ˆ0.30.8yx中,当解释变量x每增加1个单位时,相应变量y平均增加0.3个单位;④某人研究儿子身高cmy与父亲身高cmx的关系,得到经验回归方程ˆ0.83928.957yx
,当176cmx时,ˆ177cmy,即:如果一个父亲的身高为176cm,则儿子的升高一定为177cm.则以上结论中正确的序号为__________.【答案】①③【分析】根据残差和相关系数的意义判定①②;根据线性回归方程的意义判定③④.【详
解】根据残差的定义,可知①正确;相关系数绝对值越接近于1,线性相关性越强,故②错误;由回归方程的意义,根据回归方程的解释变量的系数为0.3,变量y平均增加0.3个单位,故③正确;回归方程是表示一种统计规律,具有
随机的不确定性,不能说一定是,故④错误;故答案为:①③.22.(【新教材精创】8.2一元线性回归模型及其应用-A基础练)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第x天12345使用人数(y)151734578421333由表中数据可得y关于
x的回归方程为255ˆyxm,则据此回归模型相应于点(2,173)的残差为________.【答案】6【分析】先计算样本中心点坐标,可得回归方程,计算出m的值,然后求出估计值,最后计算残差即可.【详解】令2tx,则ˆ55ytm,由题意可得,149162511
5t,1517345784213335645y,则样本中心为(11,564),故ˆ55ytm经过点(11,564),所以5645511m,解得41m,则2ˆ5541yx,当2x时,2ˆ55241
179y,所以残差为1731796.故答案为:6.四、双空题23.(2021·上海市实验学校高二期末)如果数据1x、2x、、nx的平均值为10,方差为3,则135x、235x、、35nx的平均值为______,方差为______.【答案】3527【分析】根据
平均数的计算公式与方差的计算公式即可求解.【详解】解:因为1x,2x,,nx的平均值为10,所以135x、235x、、35nx的平均值123(...)535nxxxn,其方差为222121[(330)(330)...(330)]9327nx
xxn.故答案为:35;27.24.(2021·绥化市第二中学高一期末)数据12,,,nxxx的平均数为2,方差为3,则数据1221,21,,21nxxx的平均数为__________;方差为__________.【答案】512【分析】根据两类数据的
线性关系可得它们的均值关系和方差关系.【详解】因为数据12,,,nxxx的平均数为2,方差为3,故数据1221,21,,21nxxx的平均数为2215,方差为22312,故答案为:5,12.25.(2021·湖北高二
学业考试)某校足球俱乐部有男运动员60人,女运动员40人,为了了解运动员的身体素质,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则应抽取的(1)男运动员人数为_______;(2)女运动员人数为_______
.【答案】1812【分析】先由已知计算出抽样比,进而可得答案.【详解】解:足球俱乐部有男运动员60人,女运动员40人,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则抽样比为303604010,故抽取的
男运动员人数3601810人,抽取的女运动员人数3401210人,故答案为:18;1226.(9.2.1总体取值规律的估计(分层练习)-2020-2021学年高一数学新教材配套练习(人教A版2019必修第二册))一个容量为n
的样本,分成若干组,已知甲组的频数和频率分别为36和14,则容量n=____,频率为16的乙组的频数x=____.【答案】14424【分析】利用频率公式求解.【详解】由题意得1364n,所以144n,同理16144x,解得24x.故答案为:144,2427.(2021·天津高二期末)生活
经验告诉我们,儿子的身高与父亲的身高具有较强的正相关性,某体育老师调查了大学三年级某班所有男生的身高和父亲的身高(单位:cm),利用最小二乘法计算出ˆ0.84b,ˆ29a,则儿子的身高y与父亲的身高x的线性回归方程是___________,据此估计其它班级,如果父亲的身高增加10cm,儿
子的身高平均增加___________cm.【答案】0.8429yx8.4【分析】(1)根据ybxa即可得出答案;(2)bx即为增加量,将x=10代入即可解得.【详解】(1)由题意0.8429yx;(2)若父亲身高增加10厘米时,孩子身高增加0.8410=8.4厘米.故答
案为:①0.8429yx,②8.4.28.(2021·天津高一期末)某市供电部门为了解节能减排以来本市居民的用电量情况,通过抽样,获得了1000户居民月平均用电量(单位:度),将数据按照[50,100),[100
,150),…,[300,350]分成六组,制成了如图所示的频率分布直方图.则频率分布直方图中m的值为___________;根据频率分布直方图近似估计抽取的这1000户居民月用电量的中位数为___________.(精确到0.1)【答案】0.0044183.3【分析】由频率和为1可求出
图中m的值,由于前2组的频率和为0.3,前3组的频率和为0.6,所以可判断中位数在第3组,设中位数为x,则500.0024500.00360.0060(150)0.5x,从而可求出中位数【详解】解:由频率分布直方图可得500.0024500.0036500.006050500.
0024500.00121m,解得0.0044m,由于前2组的频率和为500.0024500.00360.30.5,前3组的频率和为500.0024500.0036500.00
600.60.5,所以可知中位数在第3组,设中位数为x,则500.0024500.00360.0060(150)0.5x,解得183.3x,故答案为:0.0044,183.329.(2021·北京高二
期末)判断对错,并在相应横线处划“√”或“×”.①样本相关系数0r时,称成对数据正相关,0r时,称成对数据负相关___________.②样本相关系数的绝对值r越接近于1,线性相关程度越弱,r越接近于0,线性相关程度越强___________.【答案】√×【分析】根据样本相关系数的
意义及性质即可判断作答.【详解】由成对数据正负相关与相关系数的对应关系知,①正确,在横线处划“√”;因样本相关系数的绝对值r越接近于1,线性相关程度越强,r越接近于0,线性相关程度越弱,则②不正确,在横线处划“×”.故答案为:√;×30.(202
1·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23时11分降落在月球表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品的上升器送入到预定环月轨道,这是我国首次实现月球无人采样和地外天体起飞,对我国航天事业具有重大而深
远的影响,为进一步培养中学生对航空航天的兴趣爱好,某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第1天3人,第2天6人,第3天10人,第4天13人,第5天18人,通过数据分析已知,报名人数与报名时间具有线性相关关系.已知第x天的报名人数为y
,则y关于x的线性回归方程为___________,该社团为了解中学生对航空航天的兴趣爱好和性别是否有关系,随机调查了100名学生,并得到如下22列联表:有兴趣无兴趣合计男生45550女生302050
合计7525100请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别_______(填“有”或”无”)关系参考公式及数据:回归方程ˆˆˆyabx中斜率的最小二乘估计公式为:1122211ˆnniiiiiinniiiixx
yyxynxybxxxnx,ˆˆaybx;22nadbcKabcdacbd,其中nabcd.2()PKk0.100.050.0100.0050.001k2.7063.8
416.6357.87910.828【答案】ˆ3.71.1yx有【分析】由题意计算x、y,求出回归系数,写出线性回归方程,利用回归方程求出8x时ˆy的值即可,再由列联表求出2K,与观测值比较即可;.【详解】解:由题意,计算1(12345
)35x,136101318105y,所以51522151875310373.75559105ˆiiiiixyxybxx,ˆˆ103.731.1aybx,所以y关于x的线性回归方程为ˆ3.71.1yx,由
列联表数据可得2210045205301275255050K因为1210.828,所以,在犯错误的概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别有关系”.故答案为:(1)ˆ3.71.1yx;(2)
有31.(2021·浙江高二课时练习)某学生对其30名亲属的饮食习惯进行了一次调查,依据统计所得数据可得到如下的22列联表:喜欢吃蔬菜喜欢吃肉类总计50岁以下d8c50岁以上16218总计ab30根据以上列联表中的数据,可得2K的观测值k__________,__________(填“有”或
“没有”)99%的把握认为其亲属的饮食习惯与年龄有关.参考公式:22()()()()()nadbcKabcdacbd,其中nabcd.参考数据:20()PKk0.100.050.0250.0100.0050.0010k
2.7063.8415.0246.6357.87910.828【答案】10有【分析】根据列联表,求得abcd,,,的值,利用公式,求得2K的值,结合附表,即可得到结论.【详解】由列联表可得20a,10b,12c,4d,可得22
30(8128)106.63512182010K,所以有99%的把握认为其亲属的饮食习惯与年龄有关.故答案为:10;有.32.(2018·北京全国·高二单元测试(理))关于x与y,有如下数据有如
下的两个模型:(1)ˆ6.517.5yx;(2)ˆ717yx.通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则21R________22R,1Q______2Q(用大于,小于号填空,,RQ是相关指数和残差平方和)x24568y3040605070【答案】【分析】直接利用
残差的性质以及相关指数的性质求解即可.【详解】由相关指数2R的的性质可得,2R越大模型的拟合效果越好,所以2212RR,由残差的性质可得,残差平方和越小模型的拟合效果越好,所以12QQ,故答案为,
.【点睛】本题主要考查残差的性质以及相关指数的性质,属于中档题.残差平方和越小越好,带状区域的宽度越窄,说明模型的拟合精度越高,相关指数2R越大,模型的拟合效果越好.五、解答题33.(2021·北京市第十二
中学高一期末)某公司为了解用户对其产品的满意程度,采用分层抽样的方法从A,B两个地区共抽取了500名用户,请用户根据满意程度对该公司品评分,该公司将收集到的数据按照20,40,40,60,60,80
,80,100分组,绘制成评分频率分布直方图如下:已知A地区用户约为40000人,B地区用户约为10000人.(1)求该公司采用分层抽样的方法从A,B两个地区分别抽取的用户人数;(2)根据频率分布直分图,估计B地区所有用户中,对该产品评分不低
于80分的用户的人数;(3)根据频率分布直方图,估计A地区抽取的400名用户对该公司产品的评分的平均值为1,B地区抽取的100名用户对该公司产品的评分的平均值为2,以及A,B两个地区抽取的500名用户对该公司产品的评
分的平均值为0,试比较0和122的大小.(结论不要求证明)【答案】(1)A地区抽取400户,B地区抽取100户;(2)10;(3)当12时,1202,12时,1202
,12时,1202.【分析】(1)根据分层抽样,样本比等于总体比求得抽取的用户人数;(2)由频率分布图得出频率后可得所求人数;(3)根据均值的定义求出0,作差比较.【详解】(1)设A,B两个地区抽取的用户人数分别为,xy,则
400005004000010000x,所以400x,500400100y;(2)由频率分布图知,B地区所有用户中,对该产品评分不低于80分的用户频率为0.005200.1,人数0.1
10010;(3)由题意1212040010045005,12121212043()25210,所以当12时,1202,12时,1202,12时,12
02.34.(2021·绥化市第二中学高一期末)某部门计划对某路段进行限速,为调查限速60km/h是否合理,对通过该路段的500辆汽车的车速进行检测,将所得数据按40,50,50,60,60,70,70,80分组,绘制成如图所示的频率分布直方图.(1)求直方图中
a的值及车速落在60,70的汽车数;(2)求这500辆汽车车速的平均数、中位数和众数.【答案】(1)0.025a,150辆;(2)平均数为57.5,中位数为57.14,众数为55.【分析】(1)由频率分布直方图的性质,列出方程,求得a的值,求得车速落在60,70的频率,进而
求得汽车数.(2)根据频率分布直方图的平均数,中位数和众数的定义,即可求解.【详解】(1)由频率分布直方图的性质,可得0.0350.0300.010101a,解得0.025a,其中车速落在60
,70的频率为0.030100.3,所以该路段500辆汽车中车速落在60,70的汽车数为5000.3150辆.(2)根据频率分布直方图的平均数的计算公式,可得这500辆汽车车速的平均数为:(450.025550.035650.03
0750.010)1057.5x,由中位数的计算方法,可得中位数为:0.025501057.140.035,根据众数的定义,可得众数为5060525.35.(云南省部分名校
2020-2021学年高二下学期期末联考数学(文)试题)某重点中学调查了100位学生在市统考中的理科综合分数,以[160,180),[180,200),[200,220),[220,240),[240,260),[2
60,280),[280,300]分组的频率分布直方图如图.将理科综合分数不低于240分的学生称为成绩“优秀”(1)估计某学生的成绩为“优秀”的概率;(2)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把
握认为成绩“优秀”与性别有关.成绩“非优秀”成绩“优秀”合计男女1545合计附:22()()()()()nadbcKabcdacbd,nabcd.2PKk0.0500.0100.001k3.8416.63510.828【答案】(1)
0.3;(2)列联表答案见解析,没有95%的把握认为成绩“优秀”与性别有关.【分析】(1)根据频率分布直方图求出“非优秀”的概率,再利用概率和为1求出“优秀”的概率;(2)先求出优秀的人数,再逐一填其他量,代入公式计算2K得出结论.【详解】解:(1)根据频率分布
直方图可得某学生的成绩为“优秀”的概率为10.0020.00950.0110.0125200.3.(2)由频率分布直方图可知,在抽取的100人中,成绩“优秀”的有30人,从而2×2列联表如下:成绩“非优秀”成绩“优秀”合计男401555女30
1545合计7030100将2×2列联表中的数据代入公式计算,得22100(40153015)1000.43355457030231K因为0.4333.841,所以没有95%的把握认为成绩“优秀”与性别有关.36.(2021·黎川县第一中学高二期末(文))某网站的调查显示,健
身操类、跑步类、拉伸运动类等健身项目在大众健康项目中比较火热,但是大多数人对健身科学类的知识相对缺乏,尤其是健身指导方面.现从某健身房随机抽取50名会员,其中男生有20人,对其平均每天健身的时间进行调查,并根据日均健身时间分为30,
40,40,50,50,60,60,70,70,80五组,得到如图所示的男生日均健身时间频数表与女生日均健身时间频率分布直方图.规定日均健身时间不少于60分钟的人为“喜欢健身”.男生日均健身时间频数表:日均健身时间(
分钟)30,4040,5050,6060,7070,80人数26642女生日均健身时间频率分布直方图:(1)请完成下面的22列联表.喜欢健身不喜欢健身总计男生女生总计根据以上的22列联表,能否有95%的把握认为喜欢健身与性别有关?(2)
现从日均健身时间在70,80的学员中选取3人进行表彰,求选取的3人中至少有1名男生的概率.附:22nadbcxabcdacbd,其中nabcd.20Pxk0.050.0250.010.0050k3.8415.0246.6357.829【答案】(1)
22列联表见解析,没有95%的把握认为喜欢健身与性别有关;(2)910.【分析】(1)根据已知条件可直接得到22列联表,由列联表计算得到20.663.841x,由此可得结论;(2)采用列举法可得基本事件总数和满足题意的基本事件个数,由古典概型概率公式可计算得到结果.【详解】(1
)由题意可得22列联表如下:喜欢健身不喜欢健身总计男生61420女生62430总计12385022501462460.663.84138122030x,没有95%的把握认为喜欢健身与性别有关.(2)记3
名女生为,,ABC,2名男生为,ab,则从5人中抽取3人的所有可能情况为,,ABC,,,ABa,,,ABb,,,ACa,,,ACb,,,Aab,,,BCa,,,BCb,,,Bab,,,Cab,共10种,其中
3人中至少有1名男生的情况有9种,所求概率910P.37.(2021·河南新乡县一中高二期末(文))华为HarmonyOS系统是一款面向未来、面向全场景的分布式操作系统,预计该系统将会成为继Android、IOS
系统之后的全球第三大手机操作系统.为了了解手机用户对HarmonyOS系统的期待程度,某公司随机在20000人中抽取了100名被调查者,记录他们的期待值,将数据分成0,15,15,30,…,75,906组
,其中期待值不低于60的称为非常期待HarmonyOS系统,现整理数据得到如下频率分布直方图.(1)已知样本中期待值小于15的有4人,试估计总体中期待值在区间[15,30)内的人数;(2)已知样本中的男生有一半非常期待HarmonyOS系统,且样本中
非常期待HarmonyOS系统的男、女生人数相等.请根据所提供的数据,完成下面的22列联表,并判断是否有99%的把握认为是否非常期待HarmonyOS系统与性别有关.非常期待不非常期待合计男女合计100附:22()()()()()nadbcKa
bcdacbd,其中nabcd.20PKk0.050.0250.0100.0050.0010k3.8415.0246.6357.87910.828【答案】(1)1200;(2)列联表答案见解析,没有99%的把握认为是否非常期待Harmon
yOS系统与性别有关.【分析】(1)利用频率分布直方图的性质直接计算即可;(2)根据频率分布直方图列联表,计算2K,并对照临界值表确定是否有关.【详解】解:(1)因为样本中期待值不小于30的频率为1242150.9150150150150,所以样本中期待值小于30的频率为
0.1,所以样本中期待值在区间15,30内的人数为1000.146,故总体中期待值在区间15,30内的人数约为6200001200100.(2)因为样本中非常期待HarmonyOS系统的人数为421510060150150,所以样本
中非常期待HarmonyOS系统的男生人数为160302,所以样本中的男生人数为30260,女生人数为1006040.非常期待不非常期待合计男303060女301040合计604010023100(30103030)256.256.63560406040
4K所以没有99%的把握认为是否非常期待HarmonyOS系统与性别有关.38.(2021·安徽黄山市·屯溪一中高二期末(文))黄山市一直践行“节能环保、绿色出行”的基本理念,现越来越多的市民购置新能源电动车替代传统的燃油汽车.如表是近五年我
市新能源电动车的年销量与年份的统计表(其中第1年表示2016年,第2年表示2017年,依此类推).第x年12345年销售量y(万台)58142231高二(1)班家委会组织了一次本班家庭购车调查,调查对象与内容近五年购
车的20个家庭及购车的类型,得到的部分数据如表22列联表.购置传统燃油汽车购置新能源电动车总计车主为父亲3车主为母亲26总计20(1)求新能源电动车的年销售量y关于x的线性相关系数r,并判断y与x是否
线性相关?若是,预测2021年新能源电动车的年销售量;若不是,请说明理由;(2)完成22列联表,并判断是否有90%的把握认为购车车主是否购置新能源电动车与性别有关?参考公式:12211niiinniiiixxyyrxxyy,若0.9r,可判断y与
x线性相关.1122211nniiiiiinniiiixxyyxynxybxxxnx,aybx,22nadbcKabcdacbd,其中
nabcd.临界值表供参考:2PKk0.150.100.050.0100.001k2.0722.7063.8416.63510.828参考数据:1niiixxyy21niiyy56
664502.2362.449【答案】(1)0.98r,y与x线性相关;35.8万台;(2)列联表见解析,有90%的把握认为购车车主是否购置新能源电动车与性别有关.【分析】(1)由公式计算出线性相关系数,即可判断是否线性相关;
求出线性回归方程后代入6x即可预测2021年新能源电动车的年销售量;(2)由题意完成列联表,代入公式求出2K,与2.706比较即可得解.【详解】(1)1234535x,5222222
12101210iixx,∵51552211661150.980.92510450iiiiiiixxyyrxxyy,∴y与x线性相关,又5
1521666.610iiiiixxyybxx,158142231165y.∴166.633.8aybx.∴y关于x的线性回归方程为6.63.8yx,取
6x,可得6.663.835.8y.即预测2021年新能源电动车的年销售量是35.8万台;(2)22列联表如下:购置传统燃油汽车购置新能源电动车总计车主为父亲11314车主为母亲246总计13720则2220114233.7
78137146K,∵3.7782.706,∴有90%的把握认为购车车主是否购置新能源电动车与性别有关.39.(2021·江西景德镇一中高二期末(文))为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从
该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要3050不需要270150(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.附:P(2Kk)
0.0500.0100.001k3.8416.63510.82822nadbcKabcdacbd【答案】(1)16%;(2)有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关【分析】(
1)利用表中的数据直接求解即可;(2)直接用公式22nadbcKabcdacbd求解,然后与临界值表比较可得结论【详解】解:(1)被调查的500位老年人中有80位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例
的估计值为800.16500,所以该地区老年人中,需要志愿者提供帮助的老年人的比例为16%.(2)由题知225003015027050254520.16.6353002008042056K所以有99%的把握认为该地区的老年人是否需要志
愿者提供帮助与性别有关40.(2021·四川省成都市玉林中学高二(文))某企业在开展“质量安全周”活动中,某种产品被检测出其中一项质量指标存在问题,该企业对甲、乙两条流水线生产该产品情况进行统计,表1是甲流水线样本的频
数分布表,如图是乙流水线样本的频率分布直方图.表1质量指标数频数(190,195]10(195,200]9(200,205]18(205,210]7(210,215]6(1)某个月内甲、乙两条流水线各生产了3500件和1500件产品,现按照分
层抽样的方法,从中抽出100件产品进行检测,问甲、乙两条生产线各抽出多少件产品?(2)随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值.若该项质量指标值落在(195,210]内,则为合格品,否则为不合格品.根据已知条件完成表2的22列联表
,并回答能否有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”?表2甲流水线乙流水线合计合格品不合格品合计附:22()()()()()nadbcKabcdacbd(其中nabcd).20PKk0.150.100.
050.0250.0100.0050.0010k2.0722.7063.8415.0246.6357.87910.828【答案】(1)70,30;(2)表见解析,没有85%的把握.【分析】(1)由分层抽样的性质运算
即可得解;(2)由题干数据分别求出甲、乙合格及不合格的数量,完成列联表,代入公式计算2K,与2.072比较即可得解.【详解】(1)按照分层抽样抽出100件产品中,甲有1003500705000件,
乙有1001500305000件;(2)甲、乙两条生产线各抽出50件产品,甲流水线生产的不合格产品有16件,合格产品有34件,∵乙流水线生产的不合格产品的概率为1(0.0120.028)55,∴乙流水线生产的不合格产品有10件,合格产品有40件,则22列联表如下,
甲流水线乙流水线合计合格品344074不合格品161026合计505010022100(340640)1.872.07250507426K,∴没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”
.41.(2021·重庆一中高二期中)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,(1,2,,20)iixyi,其中ix和iy分别表
示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得2020202020221111180,4000,80,8000,700iiiiiiiiiiixyxxyyxxyy.(1)请用相关系数r说明该组数据中y与x之间的关系可
用线性回归模型进行拟合;(当||0.75r时,认为两变量的线性相关性很强)(2)求y关于x的线性回归方程,并用所求回归方程预测该市100万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数12211niiinniiii
xxyyrxxyy,对于一组具有线性相关关系的数据,(1,2,3,,)iixyin,其回归直线ˆˆˆybxa的斜率和截距的最小二乘法估计分别为121ˆˆˆ,niii
niixxyybaybxxx.【答案】(1)因为y与x的相关系数大于0.75,所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合;(2)8.75165yx,1040吨.【分析】(1)将所给数据代
入相关系数公式计算并与0.75比较即得解;(2)由最小二乘法计算斜率ˆb,进而求出截距ˆa可得回归直线方程并进行估计作答.【详解】(1)由题意知,相关系数1220211202070070.8758808000iiiiiiixxyyrxxyy
.因为y与x的相关系数大于0.75,所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合;(2)由题意可得,2012021700ˆ8.7580iiiiixxyybxx,400080ˆˆ8.75
2008.7541652020aybx,所以8.75165yx,当100x时,ˆ8.751001651040y,所以该市100万人口的县城年垃圾产生总量约为1040吨.