2022届高考数学二轮复习 第二部分 突破热点 分层教学 专项二 专题六 2 第2讲 统计与统计案例学案

2022届高考数学二轮复习 第二部分 突破热点 分层教学 专项二 专题六 2 第2讲 统计与统计案例学案年份卷别考查内容及考题位置命题分析2018卷Ⅰ扇形统计图的应用·T31.统计与统计案例在选择或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在3~4题的位置.2.统计解答题多在第18题的位置,且多以频率分布直方图或茎叶图与线性回归分析或独立性检验相交汇的形式考查,难度中等.卷Ⅱ回归分析及其应用·T18卷Ⅲ统计案例·T182017卷Ⅱ频率分布直方图、独立性检验·T18卷Ⅲ折线图的识别及应用·T32016卷Ⅲ统计图表的应用·T4折线图、相关性检验、线性回归方程及其应用·T18 抽样方法(基础型)] 系统抽样总体容量为N,样本容量为n,则要将总体均分成n组,每组个(有零头时要先去掉).若第一组抽到编号为k的个体,则以后各组中抽取的个体编号依次为k+,…,k+(n-1). 分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.[考法全练]1.福利彩票“双色球”中红色球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为( )81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 8506 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49A.12 B.33C.06 D.16解析:选C.被选中的红色球号码依次为17,12,33,06,32,22.所以第四个被选中的红色球号码为06,故选C.2.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )A.73 B.78C.77 D.76解析:选B.样本的分段间隔为=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.3.某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:最喜爱喜爱一般不喜欢4 8007 2006 4001 600电视台为了了解观众的具体想法和意见,打算从中抽选出100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为( )A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8解析:选D.法一:因为抽样比为=,所以每类人中应抽选出的人数分别为4 800×=24,7 200×=36,6 400×=32,1 600×=8.故选D.法二:最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,所以每类人中应抽选出的人数分别为×100=24,×100=36,×100=32,×100=8,故选D. “双图”“五数”估计总体(基础型) 统计中的5个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即=(x1+x2+…+xn).(4)方差与标准差:s2=[(x1-)2+(x2-)2+…+(xn-x)2];s=. 从频率分布直方图中得出有关数据的技巧(1)频率:频率分布直方图中横轴表示组数,纵轴表示,频率=组距×.(2)频率比:频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有关值.(3)众数:最高小长方形底边中点的横坐标.(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.(6)性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和×组距=1,列方程即可求得参数值.[考法全练]1.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数23582则这20户家庭该月用电量的众数和中位数分别是( )A.180,170 B.160,180C.160,170 D.180,160解析:选A.用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.2.(2018·贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A.15 B.18C.20 D.25解析:选A.根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.故选A.3.(2018·武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为( )A. B.C.6 D.30解析:选C.由茎叶图知,最低分为87分,最高分为99分.依题意得,×(87+93+90+9×10+x+91)=91,解得x=4.则剩余5个得分的方差s2=×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=×(16+4+1+9)=6.故选C.4.“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的.某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并进一定量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.(1)求在这40名读书者中年龄分布在[40,70)的人数;(2)求这40名读书者的年龄的平均数和中位数.解:(1)由频率分布直方图知年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75,故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.(2)这40名读书者年龄的平均数为25×0.05+35×0.10+45×0.20+55×0.30+65×0.25+75×0.10=54.设中位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55,故这40名读书者年龄的中位数为55. 回归分析(综合型)[典型例题]命题角度一 线性回归分析 (2018·广州模拟)某地1~10岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i=1,2,…,10)如下表:x/岁12345678910y/cm76.588.596.8104.1111.3117.7124.0130.0135.4140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值. (xi-)2 (yi-)2 (xi-)(yi-)5.5112.4582.503 947.71566.85(1)求y关于x的线性回归方程(线性回归方程系数精确到0.01);(2)某同学认为y=px2+qx+r更适宜作为y关于x的回归方程类型,他求得的回归方程是=-0.30x2+10.17x+68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程=+x中的斜率和截距的最小二乘估计公式分别为:=,=-.【解】 (1)==≈6.871≈6.87,=-=112.45-6.871×5.5≈74.66,所以y关于x的线性回归方程为=6.87x+74.66.(2)若回归方程为=6.87x+74.66,当x=11时,=150.23.若回归方程为=-0.30x2+10.17x+68.07,当x=11时,y=143.64.|143.64-145.3|=1.66<|150.23-145.3|=4.93,所以回归方程=-0.30x2+10.17x+68.07对该地11岁男童身高中位数的拟合效果更好.求回归直线方程的关键及实际应用(1)关键:正确理解计算,的公式和准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 命题角度二 非线性回归分析 (2018·潍坊模拟)某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值. (xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.253.630.2692 085.5-230.30.7877.049表中ui=,=ui.(1)根据散点图判断:y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01);(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出.结果精确到1)附:对于一组数据(w1,v1),(w2,v2),…,(wn,vn),其回归直线=+w的斜率和截距的最小二乘估计分别为=,=v-.【解】 (1)由散点图判断,y=c+更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程.(2)令u=,先建立y关于u的线性回归方程,由于==≈8.957≈8.96,所以=-·=3.63-8.957×0.269≈1.22,所以y关于u的线性回归方程为=1.22+8.96u,所以y关于x的回归方程为=1.22+.(3)假设印刷x千册,依题意得10x-x≥78.840,所以x≥10,所以至少印刷10 000册才能使销售利润不低于78 840元.求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数. (3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.命题角度三 回归分析与正态分布的综合问题 (2018·兰州模拟)某地一商场记录了12月份某5天当中某商品的销售量y(单位:kg)与该地当日最高气温x(单位:℃)的相关数据,如下表:x119852y7881012(1)试求y与x的回归方程=x+;(2)判断y与x之间是正相关还是负相关;若该地12月某日的最高气温是6 ℃,试用所求回归方程预测这天该商品的销售量;(3)假定该地12月份的日最高气温X~N(μ,σ2),其中μ近似取样本平均数,σ2近似取样本方差s2,试求P(3.8 12.6,P(X=k-1)>P(X=k).又==<1,所以当k=12时,P(X=k)最大.所以k的值为12.11.(2018·石家庄质量检测(二))随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.下表是某购物网站2017年1~8月促销费用(单位:万元)和产品销量(单位:万件)的具体数据.月份12345678促销费用x2361013211518产品销量y11233.5544.5(1)根据数据可知y与x具有线性相关关系,请建立y关于x的回归方程=x+(系数精确到0.01);(2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以z(单位:件)表示日销量,z∈[1 800,2 000),则每位员工每日奖励100元;z∈[2 000,2 100),则每位员工每日奖励150元;z∈[2 100,+∞),则每位员工每日奖励200元.现已知该网站6月份日销量z服从正态分布N(0.2,0.000 1),请你计算某位员工当月奖励金额总数大约多少元.(当月奖励金额总数精确到百分位).参考数据:xiyi=338.5,x=1 308,其中xi,yi分别为第i个月的促销费用和产品销量,i=1,2,3,…,8.若随机变量z服从正态分布N(μ,σ2),则P(μ-σ