【文档说明】人教版高中数学选择性必修第三册学案:8.1.2《样本相关系数》(含解析).doc,共(14)页,264.000 KB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-37614.html
以下为本文档部分文字说明:
8.1.2样本相关系数课标要求素养要求1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系.通过学习样本相关系数,提升数学抽象及数据分析素养.新知探究散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大
小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?问题若样本系数r=0.97,则成对样本数据的相关程度如何?提示r=0.97,表明成对样
本数据正线性相关程度很强.1.相关系数r的计算注意:相关系数是研究变量之间线性相关程度的量假设两个随机变量的数据分别为(x1,y1),(x2,y2),„,(xn,yn),对数据作进一步的“标准化处理”处理,用sx=1
n∑ni=1(xi-x-)2,sy=1n∑ni=1(yi-y-)2分别除xi-x-和yi-y-(i=1,2,„,n,x-和y-分别为x1,x2,„,xn和y1,y2,„,yn的均值),得x1-x-sx,y1-y-sy,x2-x-sx,y2-y-sy,„,
xn-x-sx,yn-y-sy,为简单起见,把上述“标准化”处理后的成对数据分别记为(x1′,y1′),(x2′,y2′),„,(xn′,yn′),则变量x和变量y的样本相关系数r的计算公式如下:r=1n(x1′y1′+x2
′y2′+„+xn′yn′)=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2∑ni=1(yi-y-)2.2.相关系数r的性质(1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.(2)
样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.样本相关系数与标准化数据向量夹角的关系r=1nx′·y′=1n|x′||y′|cosθ=cosθ(其中x′=(x1′,x
2′,„,xn′),y′=(y1′,y2′,„,yn′),|x′|=|y′|=n,θ为向量x′和向量y′的夹角).拓展深化[微判断]1.回归分析中,若r=±1说明x,y之间具有完全的线性关系.(√)2.若r=0,则说明成对样本数据间是函数关系.(×)提示若r
=0,则说明成对样本数据间没有线性相关关系.3.样本相关系数r的范围是r∈(-∞,+∞).(×)提示样本相关系数的范围是[-1,1].[微训练]1.下面对相关系数r描述正确的是()A.r>0表明两个变量负相关B.r>1表明两个变量正相关C.r只能大于零D
.||r越接近于0,两个变量相关关系越弱解析因r>0表明两个变量正相关,故A错误;又因r∈[-1,1],故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故D正确.答案D2.
(多选题)下面的各图中,散点图与相关系数r符合的是()解析因为相关系数r的绝对值越接近1,线性相关程度越高,且r>0时正相关,r<0时负相关,故观察各选项,易知B不符合,A,C,D均符合.故选ACD.答案ACD[微思考]当r=1或-1时,两个变量的相关性如何?提示当r=1时
,两个变量完全正相关;当r=-1时,两个变量完全负相关.题型一线性相关性的检验【例1】现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:学生号12345678910x12010811710410311010
410599108y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性相关关系?解x-=110(120+108+„+99+108)=107.8,y-=110(84+64+„+57+71)=6
8,∑10i=1x2i=1202+1082+„+992+1082=116584,∑10i=1y2i=842+642+„+572+712=47384,∑10i=1xiyi=120×84+108×64+„+99×57+108×71=73796.所以相关系数
为r=73796-10×107.8×68(116584-10×107.82)(47384-10×682)≈0.7506.由此可看出这10名学生的两次数学成绩具有线性相关关系.规律方法利用相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器.【训练1】假设关于某种设备
的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:x23456y2.23.85.56.57.0已知∑5i=1x2i=90,∑5i=1y2i=140.78,∑5i=1xiyi=112.3.(1)求x-,y-;(2)对x,y进行线性相关性检验.解(1)x-
=2+3+4+5+65=4.y-=2.2+3.8+5.5+6.5+7.05=5.(2)∑5i=1xiyi-5x-y-=112.3-5×4×5=12.3,∑5i=1x2i-5x-2=90-5×42=10,∑5i=1y2i-5y-2=140.78-125=15.78,所以r=12
.310×15.78≈0.979.所以x与y之间具有很强的线性相关关系.题型二判断线性相关的强弱【例2】维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素
,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.甲醛浓度x18202224262830缩醛化度(y)26.8628.3528.7528.8729.7530.0030.36求样本相关系数r并判断它们的相
关程度.解列表如下ixiyix2iy2ixiyi11826.86324721.4596483.4822028.35400803.722556732228.75484826.5625632.542428.87576833.4769692.8852629.75676885.062577
3.562830.0078490084073030.36900921.7296910.80∑168202.9441445892.01364900.16x-=1687=24,y-=202.947,r=∑7i=1xiyi-7x-y-∑7i=1x2i-7x-2∑7i
=1y2i-7y-2=4900.16-7×24×202.9474144-7×2425892.0136-7×202.9472≈0.96.由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.规律方法当相关系数|r|越接近1时,两个变量的相关关系越强
,当相关系数|r|越接近0时,两个变量的相关关系越弱.【训练2】以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.房屋大小x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据的散点图;(2)求相关系数r,并作出评价.解(1)图
略.(2)列表如下:ixiyix2iy2ixiyi111524.813225615.042852211021.612100466.56237638018.46400338.561472413529.218225852.6
43942510522110254842310∑545116609752756.812952x-=5455=109,y-=1165=23.2,r=∑5i=1xiyi-5x-y-∑5i=1x2i-5x-2∑5i=1y2i-5y-2=12952-5×109×23.260975-5×1092
2756.8-5×23.22=3081570×65.6≈0.96,由此可知,新房屋的销售价格和房屋的大小之间有很强的正线性相关关系.一、素养落地1.通过本节课的学习,进一步提升数学抽象及数据分析素养.2.判断
变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就可利用线性相关系数来判断.3.|r|越接近1,它们的散点图越接近一条直线,两个变量之间的相关关系越强.二、素养训练1.
两个变量之间的相关程度越低,则其线性相关系数的数值()A.越小B.越接近1C.越接近0D.越接近-1解析由相关系数的性质知选C.答案C2.给定y与x的一组样本数据,求得相关系数r=-0.690,则()A.y与x线性不相关B.y与x正线性相关C.y与x负线性相关D.以
上都不对解析因为r=-0.690<0,所以y与x负线性相关.答案C3.(多选题)下列说法正确的是()A.变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.如果r=±1,说明x与y之间完全线性相关D.线性
相关系数r∈(-1,1)解析∵相关系数|r|≤1,∴D错误.答案ABC4.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356已知记忆力x和判断力y是线性相关的,求相关系数r.解列表如下ixiyix2iy2i
xiyi16236412283649243105100255041261443672∑361634474158x-=364=9,y-=164=4,∴r=∑4i=1xiyi-4x-y-∑4i=1x2i-4x-2∑4i=
1y2i-4y-2=158-4×9×4344-4×8174-4×16≈0.99.基础达标一、选择题1.已知某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着()A.高度相关B.
中度相关C.弱度相关D.极弱相关解析由|-0.97|比较接近1知选A.答案A2.关于两个变量x,y与其线性相关系数r,有下列说法:①若r>0,则x增大时,y也相应增大;②若|r|越趋近于1,则x与y的线性相关程度越强;③若r=1或r=-1,则x与y
的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A.①②B.②③C.①③D.①②③解析根据相关系数的定义,变量之间的相关关系可利用相关系数r进行判断:当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;|r|越接近于1,相关程度越
强;|r|越接近于0,相关程度越弱.故可知①②③正确.答案D3.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并分别求得相关系数r如表:甲乙丙丁r0.820.780.690.85则这四位同学的试验结果能体现出A,B两
变量有更强的线性相关性的是()A.甲B.乙C.丙D.丁解析由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性最强,故选D.答案D4.对于相关系数r,下列结论正确的个数为()①r∈[-1,-0.75]时,两变量负相关很强②r∈[0.75,1]时,两变量
正相关很强③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般④r=0.1时,两变量相关性很弱A.1B.2C.3D.4解析由相关系数的性质可知4个结论都正确.答案D5.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数
,且已知:①n=7,r=0.9533;②n=15,r=0.3012;③n=17,r=0.4991;④n=13,r=0.9950.则变量y和x线性相关程度最高的两组是()A.①②B.①④C.②④D.③④解析相关系数r的绝对值越接近于1,变量x,y的线性相关程度
越高.答案B二、填空题6.已知某个样本点中的变量x,y线性相关,相关系数r>0,平移坐标系,则在以(x-,y-)为坐标原点的坐标系下的散点图中,大多数的点都落在第__________象限.解析因为r>0,所以大多
数的点都落在第一、三象限.答案一、三7.若已知∑ni=1(yi-y-)2是∑ni=1(xi-x-)2的4倍,∑ni=1(xi-x-)(yi-y-)是∑ni=1(xi-x-)2的1.5倍,则相关系数r的值为
__________.解析由r=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2∑ni=1(yi-y-)2,得r=34.答案348.部门所属的10个工业企业生产性固定资产价值x与工业增加值y资料如下表(单位:百万元):固定资产价值33566789910工业增加
值15172528303637424045根据上表资料计算的相关系数为__________.解析x-=3+3+5+6+6+7+8+9+9+1010=6.6.y-=15+17+25+28+30+36+37+42+40+4510=31.5.∴r=∑10i=1(xi-x-)(yi-y-)∑10i=1
(xi-x-)2∑10i=1(yi-y-)2≈0.9918.答案0.9918三、解答题9.5个学生的数学和物理成绩如表:学生学科ABCDE数学8075706560物理7066686462试用散点图和相关系数r判断它们是否有线性相关关系,若有,是正相关还是负相关?解散点图法:涉及两个变量:数
学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.由散点图可见,两者之间具有线性相关关系且是正相关.(相关系数r法)列表:ixiyix2
iy2ixiyi1807064004900560027566562543564950370684900462447604656442254096416056062360038443720∑35033024750
2182023190∴r=∑5i=1xiyi-5x-y-∑5i=1x2i-5x-2∑5i=1y2i-5y-2=23190-23100250×40=0.9>0.∴两变量具有相关关系且正相关.10.某火锅店
为了了解营业额y(百元)与气温x(℃)之间的关系,随机统计并制作了某6天当天营业额与当天气温的对比表.气温/℃261813104-1营业额/百元202434385064画出散点图并判断营业额与气温之间是否具有线
性相关关系.解画出散点图如图所示.x-=16(26+18+13+10+4-1)≈11.7,y-=16(20+24+34+38+50+64)≈38.3,∑6i=1xiyi=26×20+18×24+13×34+10×38+4×50-1×64=1910,∑6i=1x2i=262+182+132+
102+42+(-1)2=1286,∑6i=1y2i=202+242+342+382+502+642=10172,由r=∑6i=1xiyi-6x-y-∑6i=1x2i-nx-2∑6i=1y2i-6y-2,可得r≈-0
.98.由于|r|的值较接近1,所以x与y具有很强的线性相关关系.能力提升11.为考察两个变量x,y的相关性,搜集数据如下表,则两个变量的线性相关程度()x510152025y103105110111114A.很强B.很弱C.无相关D.
不确定解析∑5i=1xi=75,∑5i=1y=543,∑5i=1x2i=1375,∑5i=1xiyi=8285,∑5i=1y2i=59051,x-=15,y-=108.6,r=∑5i=1xiyi-5x-y-∑5i=1x2i-5x-2∑5i=1y2i-5y-2=8285-5×
15×108.61375-5×152×59051-5×108.62≈0.9826,故相关程度很强.答案A12.下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2012~2018.由折线图看出,y与t有线性相关关系,
请用相关系数加以说明.附注:参考数据:∑7i=1yi=9.32,∑7i=1tiyi=40.17,∑7i=1(yi-y-)2=0.55,7≈2.646.参考公式:相关系数r=∑ni=1(ti-t-)(yi-y-)∑ni=1(ti-t-)2∑ni=1(yi-y-)2.解由折线
图中数据和附注中参考数据得t-=4,∑7i=1(ti-t-)2=28,∑7i=1(yi-y-)2=0.55.∑7i=1(ti-t-)(yi-y-)=∑7i=1tiyi-t-∑7i=1yi=40.17-4×9.3
2=2.89,r≈2.890.55×2×2.646≈0.99.因为y与t的相关系数近似为0.99,所以y与t的线性相关程度相当高.创新猜想13.(多选题)对于线性相关系数r,以下说法错误的是()A.r只能是正值,不能为负值B.||r≤1,且||r越接近于1,相关
程度越大;相反则越小C.||r≤1,且||r越接近于1,相关程度越小;相反则越大D.r<0时表示两个变量无相关解析由相关系数的性质知B正确,其余均错误.答案ACD