【文档说明】(新高考)高考数学一轮单元复习真题模拟卷第09章《统计与统计案例》(解析版).doc,共(45)页,1.363 MB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-29305.html
以下为本文档部分文字说明:
02卷第九章统计与统计案例《真题模拟卷》-2022年高考一轮数学单元复习(新高考专用)第I卷(选择题)一、单选题1.(2021·天津高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分分数据,将所得400个评分数据分为8组:66,70、70,74、、94,98,并整理
得到如下的费率分布直方图,则评分在区间82,86内的影视作品数量是()A.20B.40C.64D.80【答案】D【分析】利用频率分布直方图可计算出评分在区间82,86内的影视作品数量.【详解】由频率分布直
方图可知,评分在区间82,86内的影视作品数量为4000.05480.故选:D.2.(2021·全国高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方
图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入
介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频
率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.101
0%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%,故D正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1
060.1470.2080.2090.10100.10110.04120.02130.02140.027.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率
直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于频率组距组距.3.(2008·山东高考真题(文))从某项综合能力测试中抽取100人的成绩,统计如
表,则这100人成绩的标准差为()分数54321人数2010303010A.3B.2105C.3D.85【答案】B【详解】试题分析:根据平均数、方差、标准差的概念直接运算即可.解:∵,∴2222121nSxxxxxxn
==,.故选B.4.(2020·天津高考真题)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,
直径落在区间[5.43,5.47)内的个数为()A.10B.18C.20D.36【答案】B【分析】根据直方图确定直径落在区间5.43,5.47之间的零件频率,然后结合样本总数计算其个数即可.【详解】根据直方图,直径落在区间5.43,5.47之间的零件频率为:6.255.000
.020.225,则区间5.43,5.47内零件的个数为:800.22518.故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.5.(2020·全国高考真题(文))设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x
1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.10【答案】C【分析】根据新数据与原数据关系确定方差关系,即得结果.【详解】因为数据(1,2,,)iaxbinL,的方差是数据(1,2,,)ixinL,的方差的2a倍,
所以所求数据方差为2100.01=1故选:C【点睛】本题考查方差,考查基本分析求解能力,属基础题.6.(2019·全国高考真题(理))演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去
掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差【答案】A【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为
123489xxxxxx.则①原始中位数为5x,去掉最低分1x,最高分9x,后剩余2348xxxx,中位数仍为5x,A正确.②原始平均数1234891()9xxxxxxx,后来平均数234817xxxxx()平均数受极端值影响较大,x与x不一定相同,B不
正确③222219119Sxxxxxx222223817sxxxxxx由②易知,C不正确.④原极差91=x-x,后来极差82=x-x可能相等可能变小,D不正确.【点睛】本题旨在考查学
生对中位数、平均数、方差、极差本质的理解.7.(重庆市第八中学2020-2021学年高二下学期期中数学试题)随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络
课程与性别有关,则被调查的男、女学生总数量可能为()附:22nadbcKabcdacbd,其中nabcd.20PKk0.150.100.050.0250.0100.0050.0010k2.0722.7063.8415.0246.6357.8
7910.828A.100B.200C.300D.400【答案】B【分析】设被调查的男、女学生总数量为Nnn,列出22列联表,计算出2K关于n的表达式,结合临界值表可得出26.63510.828K,求出n的取值范围,即可得解.【详解】设被调查的男、女学生总数量为Nnn,
根据题意可得出22列联表如下表所示:喜欢网络课程不喜欢网络课程合计男生0.4n0.1n0.5n女生0.3n0.2n0.5n合计0.7n0.3nn22220.080.030.50.50.70.321nnn
nKnnnn,由题意可得26.63510.828K,即6.63510.82821n,可得139.335227.388n.故n的可能取值为200.故选:B.8.(2021·云南高二期末(文))由数据
11,xy,22,xy,…,66,xy可得y关于x的线性回归方程为ˆ32yx,若6112iix,则6112iiy()A.48B.52C.56D.80【答案】A【分析】根据回归直线方程
必过样本中心,xy即可求出结果.【详解】因为6112iix,所以1226x,所以628y,所以516848iiy.故选:A.9.(2021·重庆西南大学附中高二期末)下列说法中正确的个数是()①某校共有女生20
21人,用简单随机抽样的方法先剔除21人,再按简单随机抽样的方法抽取为200人,则每个女生被抽到的概率为110;②设有一个回归方程35yx,变量x增加1个单位时,y平均增加5个单位;③将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;④具有线性相关关系的两个
变量x,y的相关系数为r.则r越接近于0,x,y之间的线性相关程度越高;⑤在一个22列联表中,由计算得出220.21K,而210.8280.001PK,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系A.1B.2C.3D.4【答案】B【分析】利用系统抽样,回归
直线的方程,方差,拟合效果,22列联表的应用,逐个判断,即可得出答案.【详解】解:对于①,某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,古典概率中,每个个体被抽的概率都是一样的,都等于2002021,故①错误;对于②,一个回
归方程ˆ35yx,变量x增加1个单位时,y平均减小5个单位,故②不正确;对于③:方差的计算公式2222121[()()...()]nSxxxxxxn,一组数据中的每一个数据都加上或减去同一个常数后,它的平均数也
会都加上或减去同一个常数,故方差不变,故③正确;对于④:设具有线性相关关系的两个变量x,y的相关系数为r.则||r越接近于0,x,y之间的线性相关程度越低,故④不正确;对于⑤,在一个22列联表中,由计算得出220.21K
,而2(10.828)0.001PK…,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系,故⑤正确.故选:B.10.(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文))下列说法错误的是()A.
回归直线过样本点的中心,xyB.在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高C.线性回归方程对应的直线ˆˆˆybxa至少经过其样本数据点11,xy,22,xy,…,,nnxy中的一个点D.在
回归分析中,20.98R的模型比20.80R的模型拟合的效果好【答案】C【分析】利用线性回归的相关定义即可得出答案【详解】样本中心点一定在线性回归方程上,则A正确;残差点分布越窄越均匀,拟合程度越高,则B正确;样本点不一定在线性回归直线上,则C错
误;2R越接近于1,模拟程度越好,则D正确.故选:C.11.(2021·重庆南开中学高二期末)“绿水青山就是金山银山”,某城市发起了“减少碳排放行动”,通过增加植树面积,逐步实现碳中和,为调查民众对减碳行动的参与情况,在某社区随机调查了90位市民,每位市民对减碳行动给出认可或不认可的评价
,得到如图所示的列联表、经计算2K的观测值9k,则可以推断出()认可不认可40岁以下202040岁以上(含40岁)4010附:20PKk0.0100.0050.0010k6.6357.87910.828A.该社区居民中约有99%的人认可“减碳行动”B.该社区居
民中约有99.5%的人认可“减碳行动C.在犯错率不超过0.005的前提下,认为“减碳行动"的认可情况与年龄有关D.在犯错率不超过0.001的前提下,认为“减碳行动"的认可情况与年龄有关【答案】C【分析】直接用2
K观测值与临界值表中的数据比较可得答案【详解】解:该社区居民中认可“减碳行动”的比例为2040100%66.7%20204010,所以AB错误,因为2K的观测值9k,97.879,910.828,所以在犯错率不超过0.005的前提下,认为“
减碳行动"的认可情况与年龄有关,所以C正确,D错误,故选:C二、多选题12.(2021·全国高考真题)下列统计量中,能度量样本12,,,nxxx的离散程度的是()A.样本12,,,nxxx的标准差B.样本12,,,nxxx的中位数C.样本12,,,nx
xx的极差D.样本12,,,nxxx的平均数【答案】AC【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的
离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.13.(2021·全国高考真题)有一组样本数据1x,2x,…,nx,由这组数据得到新样本数据1y,2y,…,ny,其中iiyxc(1,2,,),inc为非零常数,则(
)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样数据的样本极差相同【答案】CD【分析】A、C利用两组数据的线性关系有()()EyExc、()(
)DyDx,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.【详解】A:()()()EyExcExc且0c,故平均数不相同,错误;B:若第一组中位数为ix,则第二组的中位数为iiyxc,显然不相同,错误;C:()()()()Dy
DxDcDx,故方差相同,正确;D:由极差的定义知:若第一组的极差为maxminxx,则第二组的极差为maxminmaxminmaxmin()()yyxcxcxx,故极差相同,正确;故选:CD14.(2021·广东高二期中)下列说法正确的是()A.对于独立性检验,随机变
量2K的观测值k值越小,判定“两变量有关系”犯错误的概率越小B.在回归分析中,相关指数2R越大,说明回归模型拟合的效果越好C.随机变量~,Bnp,若30E,20D,则45nD.
甲、乙、丙、丁4个人到4个景点旅游,每人只去一个景点且每个景点都有人去,设事件M为“4个人去的景点各不相同”,事件N为“甲不去其中的A景点”,则34PMN【答案】BD【分析】利用独立性检验可判断A选项;利用相关指数与回归模型的拟
合效果可判断B选项;利用二项分布的期望和方差公式可判断C选项;利用分步计数原理结合古典概型的概率公式可判断D选项.【详解】对于A选项,对于独立性检验,随机变量2K的观测值k值越小,判定“两变量有关系”犯错误的概率越大,A选项错误;对于B选项,在回归分析中,相关指数2R越大,说
明回归模型拟合的效果越好,B选项正确;对于C选项,随机变量~,Bnp,则30120EnpDnpp,解得9013np,C选项错误;对于D选项,利用分步计数原理结合古典概型的概率公式可得3344334APMNA
,D选项正确.故选:BD.15.(2021·江苏省天一中学高二期末)晚上睡眠充足是提高学习效率的必要条件.某高中高二的学生分为寄宿生和走读生两类,其中寄宿生晚上9:50必须休息,睡眠能得到充分的保证;走读生晚上大多10:30休息,甚至更晚.为了了解这两类学生的学习效率情况,该校有关
部门分别对这两类学生学习总成绩的前50名进行问卷调查,得到如下表所示的统计数据,则()寄宿生走读生学习效率高3010学习效率低2040附:22nadbcxabacbdcd,20Pxx0.0500.0100.0050.0010x3.8416.635
7.87910.828A.走读生前50名学生中有40%的学生学习效率高B.寄宿生前50名学生中有60%的学生学习效率高C.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05D.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”【答案】BD【分析】根据
频数除以总数得到频率,即可判断A、B,完善列联表,计算观测值,对照附表得出结论,判断C、D是否正确.【详解】解:依题意走读生前50名学生中有10人学习效率高,即10100%20%50,所以A错误;寄宿生前50名学生中有30人学习效率高,即30100%60%50,故B正确;
依题意得到如下列联表:寄宿生走读生合计学习效率高301040学习效率低204060合计5050100则221003040102016.66710.82840605050K所以有99.9%的把握认为
“学生学习效率高低与晚上睡眠是否充足有关”,D正确;认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率不超过0.05,所以C错误.故选:BD.16.(2021·沙坪坝区·重庆一中高二期中)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了
一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若在犯错误概率不超过0.05的前提下认为是否喜欢抖音和性别有关,则调查人数中男生可能有()人20PKk0.0500.010k3.8416.63
5附:22()()()()()nadbcKabcdacbdA.25B.40C.45D.60【答案】CD【分析】设男生的人数为5nnN,列出22列联表,计算出2K的观测值,结合题中条件可得出关于n的不等式,解出n的取
值范围,即可得出男生人数的可能值.【详解】设男生的人数为5nnN,根据题意列出22列联表如下表所示:男生女生合计喜欢抖音4n3n7n不喜欢抖音n2n3n合计5n5n10n则221042310557321nnn
nnnKnnnn,由于在犯错误概率不超过0.05的前提下认为是否喜欢抖音和性别有关,则23.8416.632K,即103.8416.63221n,得8.066113.9272n,nN,则n的可能取值有9、10、11、12,因此,调查人数中男生
人数的可能值为45、50、55、60.故选:CD.17.(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点1122,,,,...,,nnxyxyxy及其线性回归方程ˆˆˆybxa,下列说法正确的有
()A.相关系数r的绝对值r越接近0,表示x,y的线性相关程度越强B.相关系数r的绝对值r越接近1,表示x,y的线性相关程度越强C.残差平方和越大,表示线性回归方程拟合效果越好D.若1111,nniiiixxyynn,
则点,xy一定在线性回归方程ˆˆˆybxa上【答案】BD【分析】根据相关系数绝对值大小,判断向量,xy相关性强弱,可判定选项A,B;根据残差分析,判断线性回归方程的拟合效果,可判定选项C;根据样本中心点与线性
回归直线的关系,即可判定选项D.【详解】当相关系数r的绝对值r越接近1,表示x,y的线性相关程度越强,选项A错误,选项B正确;残差平方和越小,表示线性回归方程拟合效果越好,选项C错误;样本中心点,xy一定在线性回归直线ˆˆˆybxa上,选项D正确.故选:BD.
18.(2021·河南高二期中(文))有一散点图如图所示,在5个,xy数据中去掉3,10D后,下列说法不正确的是()A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量
y的相关性变弱【答案】BCD【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况.【详解】解:从散点图可分析得出:只有D点偏离直线远,若去掉D点,则变量x与变量y的线性相关性变强,相关系数r变大,相关指
数2R变大,残差的平方和变小,解释变量x与预报变量y的相关性变强;故选:BCD.19.(2021·全国高二专题练习)(多选题)对相关系数r来说,下列说法错误的有()A.|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小B.|r|≥1,|r|越接近1,相关程度
越大;|r|越大,相关程度越小C.|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小D.|r|≥1,|r|越接近1,相关程度越小;|r|越大,相关程度越大【答案】ABD【分析】利用相关系数的取值范围以及衡量两个变量之间的强弱规律即可判断作答.【详解】相关系数r的取值范围是[
1,1],即选项B,D都是错误的;相关系数r衡量两个变量之间的相关关系的强弱时,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在相关关系,所以“对于相关系数r来说,|r|≤1,|r|越接近1,
相关程度越大;|r|越接近0,相关程度越小”,选项A是错误的,选项C正确.故选:ABD20.(【新教材精创】8.2一元线性回归模型及其应用-A基础练)(多选题)在用最小二乘法进行线性回归分析时,下列说法中正确的
是()A.由样本数据得到的线性回归方程ybxa$$$必过样本点的中心,xy;B.由样本点11,xy,22,xy,…,,nnxy得到回归直线,则这些样本点都在回归直线上;C.利用221211niiin
iiyyRyy来刻画回归的效果,20.75R比20.64R的模型回归效果好;D.残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越低;【答案】AC【分析】样本点未必在回归直线上,
所以A正确,B错误;相关指数2R越大,拟合效果越好,所以C正确;残差图宽度越窄,说明模型拟合精度越高,所以D错误.【详解】线性回归直线必过样本点的中心,而样本点未必在回归直线上,所以A正确,B错误;相关指数2R越大,拟合效果越好,所以C正确;残差图中的残差点比较
均匀地落在水平的带状区域中,宽度越窄,说明模型拟合精度越高,所以D错误.故选:AC第II卷(非选择题)三、填空题21.(2012·浙江高考真题(文))某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为_
___________.【答案】160【详解】∵某个年级共有980人,要从中抽取280人,∴抽取比例为28029807,∴此样本中男生人数为25601607,故答案为160.考点:本题考查了分层抽样的应用点评:掌握分层抽样的概念是解决此类问题的关键,属基础
题22.(2020·江苏高考真题)已知一组数据4,2,3,5,6aa的平均数为4,则a的值是_____.【答案】2【分析】根据平均数的公式进行求解即可.【详解】∵数据4,2,3,5,6aa的平均数为4∴4235620aa,即2a.故答案为
:2.【点睛】本题主要考查平均数的计算和应用,比较基础.23.(2019·全国高考真题(文))我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,
则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.
2,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.9840.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.
易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.24.(2010·安徽高考真题(文))某地有居民100000户,其中普通家庭99000户,高收入家庭1000户
.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认
为该地拥有3套或3套以上住房的家庭所占比例的合理估计是.【答案】5.7%【分析】首先根据拥有3套或3套以上住房的家庭所占的比例,得出100000户中居民中拥有3套或3套以上住房的户数,它除以100000得到的值,为该地拥有3套或3套以上住房的家庭所占比例的合理估计.【
详解】该地拥有3套或3套以上住房的家庭可以估计有:50709900010005700990100则该地拥有3套或3套以上住房的家庭所占比例的合理估计为57005.7%100000故答案为5.7%【点睛】本题考查了分层抽样问题的运用,首先要注意分层抽
样的方法与特点,进而根据合理估计的计算方法,得到答案.25.(2009·浙江高考真题(文))某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数为_________.【答案】30【解析】试题分析:区间4,5对应的频
率为10.400.150.100.050.30,所以在区间4,5上数据的频数为1000.3030.考点:频率分布直方图.26.(2011·辽宁高考真题(文))调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x
与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:^y=0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.【答案】0.245【详解】当x变为1x时,y=0.245(x+1)+0.321=0.245
x+0.321+0.245,而0.245x+0.321+0.245-(0.245x+0.321)=0.245.因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元,本题填写0.245.27.(2014·天津高考真题(文))某大学为了解在校本科生对参加某项社会实
践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.【答案】60【分析】采用分层抽样的方法,从
该校四个年级的本科生中抽取一个容量为300的样本进行调查的.【详解】∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,∴应从一年级本科生中抽取学生人数为:4300604556.故答案为60
.28.(2021·重庆字水中学高二期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据(,)xy,如下表所示.(残差=观测值-预测值)x3456y2.534m根据表中数据,得出y关于x的经验回归
方程为0.7yxa.据此计算出在样本(4,3)处的残差为0.15,则表中m的值为______.【答案】4.5【分析】首先由已知条件求出a的值,再由回归直线过样本中心点即可求解.【详解】因为样本(4,3)
处的残差为0.15,即30.740.15yya,所以0.35a,所以回归方程为:0.70.35yx,因为34564.54x,2.5349.544mmy,因为样本中心点,xy在回归直线上,所以9.50.74.50.354m
,解得:4.5m,故答案为:4.5.29.(2021·四川高三零模(文))有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据:近视不近视总计少看手机154560多看手机15520总计305080则在犯错误的概
率不超过__________的前提下认为近视与多看手机有关系.附表:2PKk0.150.100.050.0100.0250.0050.001k2.0722.7063.8415.0246.6357.87
910.828参考公式:22nadbcKabcdacbd,其中nabcd.【答案】0.001【分析】根据列联表计算得21610.828K,进而得答案.【详解】解:根据列联表计算228015515451610.8283
0502060K,所以在犯错误的概率不超过0.001的前提下认为近视与多看手机有关系.故答案为:0.00130.(2021·河南高二期中(文))某企业计划通过广告宣传来提高销售额,经统计,产品的广告费x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x0123
4y14.830.436.239.651由表中的数据得线性回归方程为ˆˆ8yxa.投入的广告费6x时,销售额的预报值为______百万元.【答案】66.4【分析】先求平均值,再代入线性回归方程得a,最后利用线性回归方
程估计结果.【详解】因为0123425x;14.830.436.239.65134.45y所以ˆ34.482a,∴ˆ18.4a因此6x时,ˆ8618.466.4y故答案为:66.431.(2021·天津高二期末)对两个变量x,y进行回归分析.①残差的平方和
越小,模型的拟合效果越好;②相关系数r的绝对值接近于0,两个随机变量的线性相关性越强;③在经验回归方程ˆ0.30.8yx中,当解释变量x每增加1个单位时,相应变量y平均增加0.3个单位;④某人研究儿子身高cmy与父亲身高cmx的关系,得到经验回归方程
ˆ0.83928.957yx,当176cmx时,ˆ177cmy,即:如果一个父亲的身高为176cm,则儿子的升高一定为177cm.则以上结论中正确的序号为__________.【答案】①③【分析】根据残差和相关系数的意义判定①②;根据线性回归
方程的意义判定③④.【详解】根据残差的定义,可知①正确;相关系数绝对值越接近于1,线性相关性越强,故②错误;由回归方程的意义,根据回归方程的解释变量的系数为0.3,变量y平均增加0.3个单位,故③正确;回归方程
是表示一种统计规律,具有随机的不确定性,不能说一定是,故④错误;故答案为:①③.32.(2021·全国高二专题练习)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第x天12345使用人数(y)151734578421333由表中数据可得y关于x的
回归方程为255ˆyxm,则据此回归模型相应于点(2,173)的残差为________.【答案】6【分析】先计算样本中心点坐标,可得回归方程,计算出m的值,然后求出估计值,最后计算残差即可.【详解】令
2tx,则ˆ55ytm,由题意可得,1491625115t,1517345784213335645y,则样本中心为(11,564),故ˆ55ytm经过点(11,564),所以5645511m,解得41m,则2ˆ5541yx,当2x时,2ˆ55
241179y,所以残差为1731796.故答案为:6.33.(2021·全国高二专题练习)甲、乙、丙、丁四位同学各自对,AB两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表
:甲乙丙丁r-0.82-0.78-0.69-0.85则____________同学的试验结果体现A,B两变量有更强的线性相关性.【答案】丁【分析】根据相关系数的特点,相关系数的绝对值越接近1,则两个变量的线性相关性
越强,即可得到答案.【详解】0.850.820.780.69,且相关系数的绝对值越接近1,则两个变量的线性相关性越强,所以能体现出A,B两变量有更强的线性相关性的是丁.故答案为:丁四、双空题34.(2017·北京高考真题(理))三
名工人加工同一种零件,他们在一天中的工作情况如图所示,其中点Ai的横、纵坐标分别为第i名工人上午的工作时间和加工的零件数,点Bi的横、纵坐标分别为第i名工人下午的工作时间和加工的零件数,i=1,2,3.①记Qi为第i名工人在这一天中加工的零件总数,则Q1,Q2,Q3中最大的是_________
.②记pi为第i名工人在这一天中平均每小时加工的零件数,则p1,p2,p3中最大的是_________.【答案】Q1p2【详解】试题分析:作图可得11AB中点的纵坐标比2233,ABAB中点的纵坐标大,所以Q
1,Q2,Q3中最大的是1Q,分别作123,,BBB关于原点的对称点123,,BBB,比较直线112233,,ABABAB的斜率(即为第i名工人在这一天中平均每小时加工的零件数),可得22AB最大,所以p1,p2,p3中
最大的是2.p【考点】图象的应用,实际应用问题【名师点睛】本题考查了根据实际问题分析和解决问题的能力,以及转化与化归的能力,因为第i名工人加工总的零件数是iiAB,比较总的零件数的大小,即可转化为比较2iiAB的大小,而2iiAB表示ii
AB中点连线的纵坐标,第二问也可转化为iiAB中点与原点连线的斜率.35.(2009·广东高考真题(文))某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,
并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是____.若用分层抽样方法,则40岁以下年龄段应抽取_____人.【答案】3720【解析】由系统抽样知识可知,将总体分成均等的若干部分指的是将总体分段,且分段的间隔相等.在第1段
内采用简单随机抽样的方法确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号.由题意,第5组抽出的号码为22,因为2+(5-1)×5=22,则第1组抽出的号码应该为2,第8组抽出的号码应该为2+(8-1)×5=37.由分层抽样知识可知,40岁以
下年龄段的职工占50%,按比例应抽取40×50%=20(人).36.(2021·北京朝阳区·高二期末)判断对错,并在相应横线处划“√”或“×”.①样本相关系数0r时,称成对数据正相关,0r时,称成对数据负相关__
_________.②样本相关系数的绝对值r越接近于1,线性相关程度越弱,r越接近于0,线性相关程度越强___________.【答案】√×【分析】根据样本相关系数的意义及性质即可判断作答.【详解】由成对数据正负相关与相关系数的对应关系知,①正确,
在横线处划“√”;因样本相关系数的绝对值r越接近于1,线性相关程度越强,r越接近于0,线性相关程度越弱,则②不正确,在横线处划“×”.故答案为:√;×37.(2021·浙江高二课时练习)某产品的广告费用x(万元)与销售额y(万元)的
统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程ˆˆˆybxa中的ˆb为9.4,则:①回归方程ˆˆˆybxa中ˆa___________;②据此模型预报广告费用
为6万元时销售额为___________万元.【答案】9.165.5【分析】利用线性回归直线必定经过样本中心点求出ˆa,再将6x代入回归方程可得据此模型预报广告费用为6万元时销售额.【详解】∵回归方程ˆˆˆybxa中的ˆb为9.4,根据线性回归直线过样本中心
点,42353.54x,49263954424y,∴ˆ9.43.542a,得ˆ9.1a,即回归方程为ˆ9.49.1yx,据此模型预报广告费用为6万元时,销售额为9.469..5ˆ165y.故答案为:9.1,65.5.
38.(2021·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23时11分降落在月球表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品的上升器送入到预定环月轨道,这是我国首次实现
月球无人采样和地外天体起飞,对我国航天事业具有重大而深远的影响,为进一步培养中学生对航空航天的兴趣爱好,某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第1天3人,第2天6人,第3天10人
,第4天13人,第5天18人,通过数据分析已知,报名人数与报名时间具有线性相关关系.已知第x天的报名人数为y,则y关于x的线性回归方程为___________,该社团为了解中学生对航空航天的兴趣爱好和性别是否有关系,随机调查了100名学生,并
得到如下22列联表:有兴趣无兴趣合计男生45550女生302050合计7525100请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别_______(填“有”或”无”)关系参考公式及数据:回归方程ˆˆˆyab
x中斜率的最小二乘估计公式为:1122211ˆnniiiiiinniiiixxyyxynxybxxxnx,ˆˆaybx;22nadbcKabcdacbd
,其中nabcd.2()PKk0.100.050.0100.0050.001k2.7063.8416.6357.87910.828【答案】ˆ3.71.1yx有【分析】由题意计算x、y,求出回归系数,写出线性回归方程,利用
回归方程求出8x时ˆy的值即可,再由列联表求出2K,与观测值比较即可;.【详解】解:由题意,计算1(12345)35x,136101318105y,所以51522151875310373.75559105ˆiiiiixyxybxx
,ˆˆ103.731.1aybx,所以y关于x的线性回归方程为ˆ3.71.1yx,由列联表数据可得2210045205301275255050K因为1210.828,所以,在犯错误的概率
不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别有关系”.故答案为:(1)ˆ3.71.1yx;(2)有39.(2018·北京全国·高二单元测试(理))关于x与y,有如下数据有如下的两个模型:(1)ˆ
6.517.5yx;(2)ˆ717yx.通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则21R________22R,1Q______2Q(用大于,小于号填空,,RQ是相关指数和残差平方和
)x24568y3040605070【答案】【分析】直接利用残差的性质以及相关指数的性质求解即可.【详解】由相关指数2R的的性质可得,2R越大模型的拟合效果越好,所以2212RR,由残差的性质可得,残差平方和越小模型的拟合
效果越好,所以12QQ,故答案为,.【点睛】本题主要考查残差的性质以及相关指数的性质,属于中档题.残差平方和越小越好,带状区域的宽度越窄,说明模型的拟合精度越高,相关指数2R越大,模型的拟合效果越好.40.(2018·全国)某医疗机构为了了解肝病与酗酒是否有
关,对成年人进行了一次随机抽样抽查,结果如下表:患肝病未患肝病合计酗酒30170200不酗酒20280300合计50450500从直观上你能得到的结论是_________,得到患肝病与酗酒有关系的判断有_____的把握.【答案】患肝病与酗酒有关系的可能性很大99.5%【详解】分析:通过列
联表,利用公式求得2K,与临界值比较,即可得到结论.详解:由已知数据可求得2250030280201709.2650450200300K,由于9.267.879,所以得到患肝病与酗酒有关系的判断有99.5%的把握.故答案为患肝病与酗酒有关系的可能性很大;99.5%.点睛
:解决独立性检验应用问题的方法解决一般的独立性检验问题,首先由所给2×2列联表确定a,b,c,d,n的值,然后根据统计量2K的计算公式确定2K的值,最后根据所求值确定有多大的把握判定两个变量有关联.41.(2021·全国高二单元测
试)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到K2=_____
___(保留三位小数),所以判定________(填“能”或“不能”)在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.【答案】4.844能【详解】根据提供的表格得2250(1320710)4.8443.8412
3272030K.∴所以可以在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.故答案为(1)4.844;(2)能.42.(2018·全国)对196个接受心脏搭桥手术的病人和196
个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据计算K2≈_____
___,能否作出这两种手术对病人又发作心脏病的影响有差别的结论________(填“能”或“不能”).【答案】1.779不能【详解】根据列联表中的数据,可以求得K2的观测值k=2392(3916729157)68324196196≈1.779.K2<
2.072的概率为0.85.不能作出这两种手术对病人又发作心脏病的影响有差别的结论.五、解答题43.(2021·全国高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9
.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分
别记为x和y,样本方差分别记为21s和22s.(1)求x,y,21s,22s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果2212210ssyx,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为
有显著提高).【答案】(1)221210,10.3,0.036,0.04xyss;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结
论进行判断.【详解】(1)9.810.31010.29.99.81010.110.29.71010x,10.110.410.11010.110.310.610.510.410.51
0.310y,22222222210.20.300.20.10.200.10.20.30.03610s,222222222220.20.10.20.30.200.30.20.10.20.0410s
.(2)依题意,20.320.1520.1520.0225yx,0.0360.04220.007610,2212210ssyx,所以新设备生产产品的该项指标的均值较旧设备有显著提高.44.(2014·广东
高考真题(理))随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30、42、41、36、44、40、37、37、25、45、29、43、31、36、49、34、33、43、38、42、32、34、46、39、36,根据上述数据得到样本的频
率分布表如下:分组频数频率25,3030.1230,3550.2035,4080.3240,451n1f45,502n2f(1)确定样本频率分布表中1n、2n、1f和2f的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方
图,求在该厂任取4人,至少有1人的日加工零件数落在区间30,35的概率.【答案】(1)17n,22n,10.28f,20.08f;(2)详见解析;(3)0.5904.【详解】试题分析:(1)根据题干中的数据以及频率分布表中的信息求出1n、2n、1f和2f的值;(2)根据频率分布表中
的信息求出各组的频率组距的值,以此为相应组的纵坐标画出频率分布直方图;(3)先确定所取的4人中日加工零件数了落在区间30,35的人数所服从的相应的概率分布(二项分布),然后利用独立重复试验与对立事件求出题中事件的概率.试题解
析:(1)由题意知17n,22n,170.2825f,220.0825f;(2)样本频率分布直方图为:(3)根据样本频率分布直方图,每人的日加工零件数落在区间30,35的概率0.2,设所取的4人中
,日加工零件数落在区间30,35的人数为,则~4,0.2B,,所以4人中,至少有1人的日加工零件数落在区间30,50的概率约为0.5904.【考点定位】本题考查频率分布直方图以及独立性重复试验,考查频率分布直方图的绘制与应用,以及
解决相关事件概率的计算,属于中等题.45.(2016·全国高考真题(文))某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果
备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时
购买的易损零件数.(Ⅰ)若n=19,求y与x的函数解析式;(Ⅱ)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购
买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?【答案】(1)3800,19,y5005700,19,xxNxx;(2)19;(3)购买1台
机器的同时应购买19个易损零件.【详解】试题分析:(Ⅰ)分x19及x>19,分别求解析式;(Ⅱ)通过频率大小进行比较;(Ⅲ)分别求出n=19,n=20时所需费用的平均数来确定.试题解析:(Ⅰ)当时,3800y;当时,3800500(19)5005700yxx,所以与的函数解析
式为3800,19,{()5005700,19,xyxNxx.(Ⅱ)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故的最小值为19.(Ⅲ)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800,2
0台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为1(380070430020480010)4000100.若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零
件上的费用为4000,10台的费用为4500,因此这100台机器在购买易损零件上所需费用的平均数为1(400090450010)4050100.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.【考点】函数解析式、概率与统计【名师点睛
】本题把统计与函数结合在一起进行考查,有综合性但难度不大,求解的关键是读懂题意,所以提醒考生要重视数学中的阅读理解问题.46.(2017·北京高考真题(文))某学校艺术专业300名学生参加某次测评,根据男女学生人数比例,使用分层抽样的
方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的300名学生中随机抽取一人,估计其分数小于
70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(1)0.4(2)15人(3)3∶2【分
析】(1)根据频率分布直方图求出样本中分数小于70的频率,用频率估计概率值;(2)计算样本中分数小于50的频率和频数,估计总体中分数在区间[40,50)内的人数;(3)由题意计算样本中分数不小于70的学生人数以及男生、女生人数,求男生和女生人数的比例
.【详解】解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的300名学生中随机抽取一人,其分数小于70的概率估计值为0.4.(2)根据题意,样本中分数不小于5
0的频率为(0.01+0.02+0.04+0.02)×10=0.9,故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5.所以总体中分数在区间[40,50)内
的人数估计为530015100.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为160302.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶
2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.【点睛】本题考查了频率分布直方图的应用问题,也考查了分层抽样原理应用问题,属于中档题.47.(2019·全国高考真题(理))为了解甲、乙两种离子在小鼠体
内的残留程度,进行如下试验:将200只小鼠随机分成,AB两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根
据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到PC的估计值为0.70.(1)求乙离子残留百分比直方图中,ab的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)0.35a,0.10b
;(2)4.05,6.【分析】(1)由()0.70PC及频率和为1可解得a和b的值;(2)根据公式求平均数.【详解】(1)由题得0.200.150.70a,解得0.35a,由0.050.151()10.7
0bPC,解得0.10b.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为0.1520.2030.3040.2050.1060.0574.05,乙离子残留百分比的平均值为0.0530.1040.1550.3560.
2070.1586【点睛】本题考查频率分布直方图和平均数,属于基础题.48.(2011·辽宁高考真题(理))某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块
地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙.(I)假设n=4,在第一大块地中,种植品种甲的小块地的数目记为X,求X的分布列和数学期望;(II)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在个小块地上的
每公顷产量(单位:kg/hm2)如下表:分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据x1,x2,…,xa的样本方差2222111nsxxxxxxn,其中x为样本平均数.【答案】解析:(I)X
可能的取值为0,1,2,3,4,且48110,70PXC13444881,35CCPXC224448182,35CCPXC31444883,35CCPXC48110,70PXC
即X的分布列为X01234P1708351835835170X的数学期望是:1818810123427035353570EX.(II)品种甲的每公顷产量的样本平均数和样本方差分别是:14033973904043884004124064008x甲,
22222222213310412012657.258s甲.品种乙的每公顷产量的样本平均数和样本方差分别是:14194034124184084234004134128x
乙,,由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.【详解】略49.(2013·全国高考真题(文))经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利
润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如右图所示.经销商为下一个销售季度购进了130t该农产品.以x(单位:t,100≤x≤150)表示下一个销售季度内的市场需求量,
T(单位:元)表示下一个销售季度内经销该农产品的利润.(Ⅰ)将T表示为x的函数;(Ⅱ)根据直方图估计利润T不少于57000元的概率.【答案】(Ⅰ)80039000,100130{65000,130150xxT
x(Ⅱ)0.7【详解】试题分析:(I)由题意先分段写出,当X∈[100,130)时,当X∈[130,150)时,和利润值,最后利用分段函数的形式进行综合即可.(II)由(I)知,利润T不少于57000元,当且仅当120≤X≤150.再由直方图知需
求量X∈[120,150]的频率为0.7,利用样本估计总体的方法得出下一个销售季度的利润T不少于57000元的概率的估计值.解:(I)由题意得,当X∈[100,130)时,T=500X﹣300(130﹣X)=800X﹣39000,当X∈[130,150]时,T=500×130=
65000,∴T=.(II)由(I)知,利润T不少于57000元,当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度的利润T不少于57000元的概率的估计值为0.7.考点:频率分布直方图.50.(2010·全国高考真题(文))为
调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3
)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:【答案】(1),(2)有99%的把握(3)见解析【详解】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需
要帮助的老年人的比例的估算值为(2).由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老
年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.51.(2021·渭南市杜桥中学高一期末)下表提供了某厂生产甲产品过程中记录的产量x(吨)与相应的生产能耗(y吨标准煤)的几组对照数据:x246810y565910(1)请根据上表提供的
数据,用最小二乘法求出y与x的线性回归方程ybxa;(2)根据(1)求出的线性回归方程,预测生产20吨甲产品的生产能耗是多少吨标准煤.(附1221,niiiniixynxybaybxxnx)【答案】(1)0.653.1yx;(2)16.1吨.【分析】(1)根据参考
公式计算出b和a,即可求出回归直线方程;(2)将20x=,带入(1)中所求回归直线方程即可得出结果.【详解】(1)由题意,2468106.5x56591075y1525466589101
0236iiixy15241636+64100220iix则1215552365670.65,2205365iiiiixyxybxx70.6563.1.aybx
故线性回归方程为0.653.1yx(2)根据(1)中线性回归方程预测,当20x=吨时,生产能耗0.65203.116.1y(吨)故测生产20吨甲产品的生产能耗是16.1吨标准煤.52.(福建省福州第一中
学2020-2021学年高二下学期期中考试数学试题)福州市风景秀丽,是著名的旅游城巿,很多人慕名而来旅游,牛角梳是我市的著名土特产,在我市重要景点三坊七巷有一家牛角梳店,通过在店面随机询问60名购买牛角梳的游客之前是否
知道牛角梳是本市特产,得到如下列联表:男女总计事先知道牛角梳81624事先不知道牛角梳32436总计402060(1)由以上列联表判断,能否在犯错误的概率不超过0.001的前提下认为购买牛角梳和是否事先知道牛角梳为本市特产有关系?(2)从被询问的24名事先知道
牛角梳为本市特产的顾客中随机选取2名顾客,求抽到的女顾客人数的分布列及其数学期望.附:22nadbcKabcdacbd.20PKk0.0100.0050.0010k6.6357.87910.
828【答案】(1)答案见解析;(2)答案见解析.【分析】(1)根据2×2列联表,计算K2的值,再与临界值比较,即可得到结论;(2)设抽到女顾客的人数为ξ,则ξ的可能取值为0,1,2,根据古典概型的概率公式求出相
应的概率,得到的分布列,进而求出的数学期望即可.【详解】(1)22260841632=20.00010.82840202436nadbcKabcdacbd
所以在犯错误的概率不超过0.001的前提下认为购买牛角梳和是否事先知道牛角梳为本市特产有关系.(2)设抽到女顾客的人数为ξ,则的可能取值为0,1,2所以282247069CPC,118
16224·32169CCPC,21622430269CPC,所以ξ的分布列为:ξ012P76932691023所以ξ的数学期望为:732109201269692369E.53.(重庆市第八中学2020-2021学年高二下学
期期中数学试题)为了研究黏虫孵化的平均温度x(单位:C)与孵化天数y之间的关系,重庆八中高2022级某课外兴趣小组通过试验得到如下6组数据:组号123456平均温度15.316.817.41819.521孵化天数16.714.813.
913.58.46.2他们分别用两种模型①ybxa,②dxyce分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图:模型①模型②经计算得18x,12.25y,611283.01iiixy,6211964.34
iix,(Ⅰ)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)(Ⅱ)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立y关于x的线性回归方程.(系数精确到0.1)参考公式:回归方程ˆˆˆybxa中斜率和截距
的最小二乘法估计公式分别为:1221ˆniiiniixynxybxnx,ˆˆaybx.【答案】(Ⅰ)模型①;(Ⅱ)2.04.5ˆ7yx.【分析】(Ⅰ)比较两个残差图的波动情况,即可做出判断;(Ⅱ)首先根据
残差图剔除第四组数据,再根据参考公式求回归直线方程.【详解】解:(Ⅰ)根据残差图分析,得出模型①残差波动小,应该选择模型①;(Ⅱ)剔除异常数据,即组号为4的数据,剩下数据的平均数为1(18618)185x,1(12.25613.5)125y;511283
.011813.51040.01iiixy,52211964.34181640.34iix;1221ˆniiiniixynxybxnx1040.01518121.971640.345182
,121.971847.5ˆˆaybx,所以y关于x的线性回归方程为:2.04.5ˆ7yx.54.(2021·江苏姜堰中学高二期末)随着节能减排意识深入人心以及共享单车的大范围推广,越来越多的
市民在出行时喜欢选择共享单车,为了研究广大市民在共享单车上的使用情况,某公司在我市随机抽取了100民用户进行调查,得到如下数据:每周使用次数1次2次3次4次5次6次及以上男4337830女6544620合计1087111450(1)如果认为每周使用超过3次的用户为“喜欢骑行共享
单车”,请设计22列联表,并判断是否有95%的把握认为“是否喜欢骑行共享单车与性别有关”?(2)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,将频率看作概率,在我市所有“骑行达人”中,随机抽取4名用户,对抽出的女性“骑行达人”每人奖励5
00元,记奖励金额为X,求X的分布列及均值.附:下面的临界值表仅供参考:20()Px0.0500.0100.001x03.8416.63510.828(参考公式:22()()()()()nadbcabcdacbd
,其中)nabcd【答案】(1)列联表见解析,没有;(2)分布列见解析,800元.【分析】(1)根据表格数据,求得22列联表,然后根据卡方公式计算2的值,然后查对临界值,作出判断即可;(2)求出随机抽取1名用户,该用户是男“骑车达人”和女“骑车达人”的概率,然后确定奖
励金额X的所有可能取值,求出X的分布列,再根据均值公式求出()EX.【详解】(1)由图中表格可得22列联表如下:不喜欢骑行共享单车喜欢骑行共享单车合计男104555女153045合计2575100222()100(10304515)1003.0
33.841()()()()5545257533nadbcabcdacbd所以没有95%的把握认为“是否喜欢骑行共享单车与性别有关”.(2)在我市所有“骑车达人”中,随机抽取1名用户,该用户是男“骑车达人”的概率为35,是女“骑
车达人”的概率为25,随机变量X的可能取值为0,500,1000,1500,2000,4381(0)()5625PX,13423216(500)()55625PXC,222423216(1000)()()55625PXC,
3342396(1500)()55625PXC,4216(2000)()5625PX.所以X的分布列如下:X0500100015002000P816252166252166259662516625812162169616()0500100
015002000800625625625625625EX所以奖励金额X的均值为800元.55.(2021·云南高二期末(文))某重点中学调查了100位学生在市统考中的理科综合分数,以[160,180),[180,200)
,[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.将理科综合分数不低于240分的学生称为成绩“优秀”(1)估计某学生的成绩为“优秀”的概率;(2)根据已知条件完成下面的2×2列联表,并
据此资料判断是否有95%的把握认为成绩“优秀”与性别有关.成绩“非优秀”成绩“优秀”合计男女1545合计附:22()()()()()nadbcKabcdacbd,nabcd.2PKk
0.0500.0100.001k3.8416.63510.828【答案】(1)0.3;(2)列联表答案见解析,没有95%的把握认为成绩“优秀”与性别有关.【分析】(1)根据频率分布直方图求出“非优秀”的概率,再
利用概率和为1求出“优秀”的概率;(2)先求出优秀的人数,再逐一填其他量,代入公式计算2K得出结论.【详解】解:(1)根据频率分布直方图可得某学生的成绩为“优秀”的概率为10.0020.00950.0110.0125200.3
.(2)由频率分布直方图可知,在抽取的100人中,成绩“优秀”的有30人,从而2×2列联表如下:成绩“非优秀”成绩“优秀”合计男401555女301545合计7030100将2×2列联表中的数据代入公式计算,得22100(40153015)1000.43355457030231
K因为0.4333.841,所以没有95%的把握认为成绩“优秀”与性别有关.