当前位置:蚂蚁文档网 > 作文范文 > 创新引领,前瞻,概率与统计热点问题

创新引领,前瞻,概率与统计热点问题

时间:2022-07-05 19:50:03 浏览次数:

 概率与统计热点问题

  三年真题考情

 核心热点 真题印证 核心素养 统计图表 2019·Ⅱ,19;2018·Ⅰ,19;2017·Ⅲ,18;2016·Ⅰ,19 数据分析 变量间的相关关系 2018·Ⅱ,18;2017·Ⅰ,19 数据分析、直观想象 独立性检验 2019·Ⅰ,17;2018·Ⅲ,18;2017·Ⅱ,19 数据分析 回归分析 2016·Ⅲ,18 直观想象、数据分析

 热点聚焦突破 教材链接高考——频率分布直方图

 [教材探究](引自人教 A 版必修 3P72 频率分布直方图)在调查了 100 位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数的估计值是 2.25 t(最高的矩形的中点)(如图),它告诉我们,该市的月均用水量为 2.25 t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们多多少.

  图 1

 图 2 那么,如何从频率分布直方图中估计中位数呢?在样本中,有 50%的个体小于或等于中位数,也有 50%的个体 大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.图中的虚线代表居民月均用水量的中位数的估计值,其左边的直方图的面积代表着 50 个单位,右边的直方图也是 50 个单位.虚线处的数据值为 2.02.同样地,可以从频率分布直方图中估计平均数.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由图估计可知,居民月用水量的平均数的估计值是 2.02 t. [试题评析] 统计的基本思想是由样本估计总体,根据频率分布直方图能推出样本的数字特征,进而估计总体的数字特征,从而作出统计推断. 【教材拓展】

 德化瓷器是泉州的一张名片,已知瓷器产品 T 的质量采用综合指标值 M 进行衡量,M∈[8,10]为一等品;M∈[4,8)为二等品;M∈[0,4)为三等品.某瓷器厂准备购进新型窑炉以提高生产效益,在某供应商提供的窑炉中任选一个试用,烧制了一批产品并统计相关数据,得到下面的频率分布直方图.

  (1)估计该新型窑炉烧制的产品 T 为二等品的概率; (2)根据陶瓷厂的记录,产品各等次的销售率(某等次产品销量与其对应产量的比值)及单件售价情况如下:

  一等品 二等品 三等品 销售率 89

 23

 25

 单件售价 20 元 16 元 12 元 根据以往的销售方案,未售出的产品统一按原售价的 50%全部处理完.已知该瓷器厂认购该窑炉的前提条件是,该窑炉烧制的产品同时满足下列两个条件:

 ①综合指标值的平均数(同一组中的数据用该组区间的中点值作代表)不小于 6; ②单件平均利润不低于 4 元. 若该新型窑炉烧制产品 T 的成本为 10 元/件,月产量为 2 000 件,在销售方案不变的情况下,根据以上图表数据,分析该新型窑炉是否达到瓷器厂的认购条件. 解 (1)记 A 为事件“该新型窑炉烧制的产品 T 为二等品”. 由直方图可知,该新型窑炉烧制的产品 T 为二等品的频率为(0.11+0.16)×2=0.54, 故该新型窑炉烧制的产品 T 为二等品的概率估计值为 0.54. (2)①先分析该窑炉烧制出的产品 T 的综合指标值的平均数:

 由频率分布直方图可知,综合指标值的平均数 x-=(1×0.01+3×0.04+5×0.11+7×0.16+9×0.18)×2=6.84. 该窑炉烧制出的产品 T 的综合指标值的平均数的估计值 6.84>6, 故满足认购条件①. ②再分析该窑炉烧制的单件平均利润值:

 由频率分布直方图可知,该新型窑炉烧制的产品 T 为一、二、三等品的概率估计值分别为 0.36,0.54,0.1. 故 2 000 件产品中,一、二、三等品的件数估计值分别为 720,1 080,200. 一等品的销售总利润为 720× 89 ×(20-10)=6 400 元; 二等品的销售总利润为 1 080× 23 ×(16-10)-1 080×13 ×(10-16×50%)=3 600元; 三等品的销售总利润为 200× 25 ×(12-10)-200×35 ×(10-12×50%)=-320 元. 故 2 000 件产品的单件平均利润值的估计值为(6 400+3 600-320)÷2 000=4.84元, 满足认购条件②, 综上所述,该新型窑炉达到认购条件. 【链接高考】

 (2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:

  记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C)的估计值为 0.70. (1)求乙离子残留百分比直方图中 a,b 的值;

 (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 解 (1)由已知得 0.70=a+0.20+0.15, 故 a=0.35, b=1-0.05-0.15-0.70=0.10. (2)甲离子残留百分比的平均值的估计值为 2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为 3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00. 教你如何审题——回归分析问题 【例题】

 如图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.

 注:年份代码 1~7 分别对应年份 2008~2014. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2020 年我国生活垃圾无害化处理量. 附注:

 参考数据:∑7i = 1 y i =9.32,∑7i = 1 t i y i =40.17,∑7i = 1

 (y i -y-)

 2 =0.55, 7≈2.646. 参考公式:相关系数 r=∑ni = 1

 (t i -t-)(y i -y-)∑ni = 1

 (t i -t-)

 2 ∑ni = 1

 (y i -y-)

 2, 回归方程y=a+bt 中斜率和截距的最小二乘估计公式分别为:

 b=∑ni = 1

 (t i -t-)(y i -y-)∑ni = 1

 (t i -t-)

 2,a=y--b t-. [审题路线]

  [自主解答] 解 (1)由折线图中数据和附注中参考数据得 t-=4,∑7i = 1

 (t i -t-) 2 =28, ∑7i = 1

 (y i -y-)

 2 =0.55. ∑7i = 1

 (t i -t-)(y i -y-)=∑7i = 1 t i y i -t-∑7i = 1 y i =40.17-4×9.32=2.89, r≈2.892×2.646×0.55 ≈0.99. 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系. (2)由y-= 9.327≈1.331 及(1)得b=∑7i = 1

 (t i -t-)(y i -y-)∑7i = 1

 (t i -t-)

 2= 2.8928≈0.10, a=y--b t-≈1.331-0.10×4≈0.93. 所以 y 关于 t 的回归方程为y=0.93+0.10t. 将 2020 年对应的 t=13 代入回归方程得y=0.93+0.10×13=2.23. 所以预测 2020 年我国生活垃圾无害化处理量将约为 2.23 亿吨. 探究提高 在两个变量的回归分析中要注意以下两点:

 (1)求回归直线方程要充分利用已知数据,合理利用公式减少运算. (2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系. 【尝试训练】

 (2020·安徽省“江南十校”质检)某生产部门生产的某种产品,如果年返修率不超过千分之一,那么该生产部门当年考核结果为优秀,现获得该生产部门 2015~2019 年的相关数据如下表所示:

 年份 2015 2016 2017 2018 2019 年生产台数 x/万台 2 4 5 6 8

 该产品的年利润 y/百万元 30 40 60 50 70 年返修台数/台 19 58 45 71 70 注:年返修率= 年返修台数年生产台数 (假定生产出来的产品可以全部售出). (1)从该生产部门 2015~2019 年的相关数据中任意选取 3 年的数据,求这 3 年中至少有 2 年生产部门考核结果为优秀的概率; (2)利用上表中五年的数据求出年利润 y 关于年生产台数 x 的线性回归方程是y=b1 x+a 1 (其中b 1 =6.5,a 1 =17.5).① 该生产部门计划从 2020 年开始转型,即决定 2020 年只生产该产品 1 万台,且预计 2020 年可获利润 32 百万元,但技术人员发现,若用预计的 2020 年的数据与2015~2019 年中考核结果为优秀的年份的数据重新建立回归方程,只有当重新估算的b 2 ,a 2 的值(数值精确到 0.01)相对于①式中的b 1 ,a 1 的值的误差的绝对值都不超过 10%时,2020 年该产品返修率才不超过千分之一.若生产部门希望 2020 年考核结果为优秀,能否实施转型计划?请说明理由. 附:y=bx+a中,b=∑ni = 1

 (x i -x-)(y i -y-)∑ni = 1

 (x i -x-)

 2=∑ni = 1 x i y i -n x-

 y- ∑ni = 1 x2i -nx- 2 ,a=y--bx-, A 相对于 B 的误差为 |A-B|B×100%. 解 (1)在 2015~2019 这 5 年的相关数据中任取 3 年的取法总数为 n=10,依条件知,年返修率不超过千分之一的年份有 2015 年,2017 年,2019 年, 所以任意选取 3 年的数据,其中恰有 1 年生产部门考核结果为优秀的取法总数为m=3, 所以至少有 2 年生产部门考核结果为优秀的概率 p=1-310 =710 . (2)因为x-= 14 ∑4i = 1 x i =4,y-= 14 ∑4i = 1 y i =48,∑4i = 1 x2i =94,∑4i = 1 x i y i =952, 所以b 2 =∑4i = 1 x i y i -4 x-

 y- ∑4i = 1 x2i -4x- 2 = 9215 ≈6.13, a 2 =48- 9215 ×4≈23.47(写a 2 =48-6.13×4=23.48 也对),

 所以 |b2 -b 1 |b 1×100%≈6%<10%, |a2 -a 1 |a 1×100%≈34%>10%,不符合题意. 故若生产部门希望 2020 年考核结果为优秀,则不能实施转型计划.

 满分答题示范——概率与统计的综合问题 【例题】

 (12 分)(2018·全国Ⅰ卷)某家庭记录了未使用节水龙头 50 天的日用水量数据(单位:m 3 )和使用了节水龙头 50 天的日用水量数据,得到频数分布表如下:

 未使用节水龙头 50 天的日用水量频数分布表

 日用 水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7] 频数 1 3 2 4 9 26 5 使用了节水龙头 50 天的日用水量频数分布表

 日用 水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6] 频数 1 5 13 10 16 5 (1)在下图中作出使用了节水龙头 50 天的日用水量数据的频率分布直方图;

 (2)估计该家庭使用节水龙头后,日用水量小于 0.35(m 3 )的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算,同一组中的数据以这组数据所在区间中点的值作代表) [规范解答] (1)所求的频率分布直方图如下:

  4′(得分点 1) (2)由题可知用水量在[0.3,0.4]的频数为 10,所以可估计在[0.3,0.35)的频数为 5,故用水量小于 0.35(m 3 )的频数为 1+5+13+5=24,其概率为 p= 2450 =0.48. 6′(得分点 2) (3)该家庭未使用节水龙头 50 天的日用水量的平均数为 x-1 =150 (0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.8′(得分点 3) 该家庭使用了节水龙头后 50 天的日用水量的平均数为 x-2 =150(0.05×1 + 0.15×5 + 0.25×13 + 0.35×10 + 0.45×16 + 0.55×5) =0.35.10′(得分点 4) 估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3 ).12′(得分点 5) [高考状元满分心得] ❶得步骤分:抓住得分点的步骤,“步步为赢”,求得满分.如得分点 3,4 都有步骤分. ❷得关键分:解题过程中的关键点,有则给分,无则没分.如得分点 2,由于使用节水龙头后的频数分布表中不含 0.35,因此可将区间[0.3,0.4)的频率的 12 视为[0.3,0.35)的频率. ❸得计算分:解题过程中的计算准确是得满分的根本保证.如得分点 1,只有计算准确,才能精确画图. [构建模板]

  【规范训练】

 (2020·河北六校联考)某中学一教师统计甲、乙两位同学高三学年的数学成绩(满分 150 分),现有甲、乙两位同学的 20 次成绩的茎叶图如图所示.

 (1)根据茎叶图求甲、乙两位同学成绩的中位数,并将图中乙同学成绩的频率分布直方图补充完整; (2)根据茎叶图比较甲、乙两位同学数学成绩的平均值及稳定程度(不要求计算具体值,给出结论即可); (3)现从甲、乙两位同学不低于 140 分的成绩中任意选出 2 个成绩,设事件 A 为“其中 2 个成绩分别属于不同的同学”,求事件 A 发生的概率. 解 (1)甲同学成绩的中位数是 119,乙同学成绩的中位数是 128. 乙同学成绩的频率分布直方图如图所示:

 (2)从茎叶图可以看出,乙同学成绩的平均值比甲同学成绩的平均值高,乙同学的

 成绩比甲同学的成绩更稳定. (3)甲同学不低于 140 分的成绩有 2 个,分别设为 a,b,乙同学不低于 140 分的成绩有 3 个,分别设为 c,d,e. 现从甲、乙两位同学不低于 140 分的成绩中任意选出 2 个,可能出现的情况有{a,b},{a,c},{a,d},{a,e},{b,c},{b,d},{b,e},{c,d},{c,e},{d,e},共 10 种. 其中 2 个成绩分别属于不同的同学的情况有{a,c},{a,d},{a,e},{b,c},{b,d},{b,e},共 6 种, 因此事件 A 发生的概率 P(A)=610 =35 .

 热点跟踪训练 1.(2019·全国Ⅰ卷)某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:

  满意 不满意 男顾客 40 10 女顾客 30 20 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异? 附:χ 2 =n(ad-bc)

 2(a+b)(c+d)(a+c)(b+d)

 .

 解 (1)由调查数据,男顾客中对该商场服务满意的频率为 4050 =0.8,因此男顾客对该商场服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的频率为 3050 =0.6,因此女顾客对该商场服务满意的概率的估计值为 0.6. (2) χ 2 = 100×(40×20-30×10)250×50×70×30≈4.762. 由于 4.762>3.841,故有 95%的把握认为男、女顾客对该商场服务的评价有差异.

 2.(2019·豫北名校调研)某企业为了解下属某部门对本企业职工的服务情况,随机访问 50 名职工,根据这 50 名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),„,[80,90),[90,100].

 (1)求频率分布直方图中 a 的值; (2)估计该企业的职工对该部门评分不低于 80 的概率; (3)从评分在[40,60)的受访职工中,随机抽取 2 人,求此 2 人的评分都在[40,50)的概率. 解 (1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以 a=0.006. (2)由所给频率分布直方图知,50 名受访职工评分不低于 80 的频率为(0.022+0.018)×10=0.4. 所以该企业职工对该部门评分不低于 80 的概率的估计值为 0.4. (3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为 A 1 ,A 2 ,A 3 ; 受访职工中评分在[40,50)的有:

 50×0.004×10=2(人), 记为 B 1 ,B 2 , 从这 5 名受访职工中随机抽取 2 人,所有可能的结果共有 10 种,它们是{A 1 ,A 2 },{A 1 ,A 3 },{A 1 ,B 1 },{A 1 ,B 2 },{A 2 ,A 3 },{A 2 ,B 1 },{A 2 ,B 2 },{A 3 ,B 1 },{A 3 ,B 2 },{B 1 ,B 2 }. 又因为所抽取 2 人的评分都在[40,50)的结果有 1 种,即{B 1 ,B 2 },故所求的概率为 p=110 . 3.(2020·河南八市联考)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了 50 名购买该家电的消费者,让他们根据实际使用体验进行评分. (1)设消费者的年龄为 x,对该款智能家电的评分为 y.若根据统计数据,用最小二乘法得到 y 关于 x 的线性回归方程为y=1.2x+40,且年龄 x 的方差为 s 2 x =14.4,评分 y 的方差为 s 2 y =22.5.求 y 与 x 的相关系数 r,并据此判断对该款智能家电的评

 分与年龄相关性的强弱; (2)按照一定的标准,将 50 名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有 99%的把握认为对该智能家电的评价与年龄有关.

  好评 差评 青年 8 16 中老年 20 6 附:线性回归直线y=bx+a的斜率b=∑ni = 1

 (x i -x-)(y i -y-)∑ni = 1

 (x i -x-)

 2;相关系数 r=∑ni = 1

 (x i -x-)(y i -y-)∑ni = 1

 (x i -x-)

 2 ∑ni = 1

 (y i -y-)

 2; 独立性检验中的 χ 2 =n(ad-bc)

 2(a+b)(a+c)(b+d)(c+d)

 ,其中 n=a+b+c+d. 解 (1)相关系数 r=∑50i = 1

 (x i -x-)(y i -y-)∑50i = 1

 (x i -x-)

 2 ∑50i = 1

 (y i -y-)

 2 =∑50i = 1

 (x i -x-)(y i -y-)∑50i = 1

 (x i -x-)

 2·∑50i = 1

 (x i -x-)

 2∑50i = 1

 (y i -y-)

 2 =b·50s 2 x50s 2 y =1.2×1215 =0.96. 故对该款智能家电的评分与年龄的相关性较强. (2)完善列联表如下

  好评 差评 合计 青年 8 16 24 中老年 20 6 26 合计 28 22 50 由 2×2 列联表得

 χ 2 = 50×(8×6-20×16)224×26×28×22≈9.624>6.635. 故有 99%的把握认为对该智能家电的评价与年龄有关. 4.(2019·石家庄调研)某出租车公司响应国家节能减排的号召,已陆续购买了 140辆纯电动汽车作为运营车辆.目前我国主流纯电动汽车按续航里程数 R(单位:千米)分为 3 类,即 A 类:80≤R<150,B 类:150≤R<250,C 类:R≥250.该公司对这 140 辆车的行驶总里程进行统计,结果如下表:

 类型 A 类 B 类 C 类 已行驶总里程不超过 10 万千米的车辆数 10 40 30 已行驶总里程超过 10 万千米的车辆数 20 20 20 (1)从这 140 辆汽车中任取一辆,求该车行驶总里程超过 10 万千米的概率; (2)公司为了了解这些车的工作状况,决定抽取 14 辆车进行车况分析,按表中描述的六种情况进行分层抽样,设从 C 类车中抽取了 n 辆车. ①求 n 的值; ②如果从这 n 辆车中随机选取两辆车,求恰有一辆车行驶总里程超过 10 万千米的概率. 解 (1)从这 140 辆汽车中任取一辆,则该车行驶总里程超过 10 万千米的概率为p 1 = 20+20+20140= 37 . (2)①依题意 n=14140 ×(30+20)=5. ②5 辆车中已行驶总里程不超过 10 万千米的车有 3 辆,记为 a,b,c; 5 辆车中已行驶总里程超过 10 万千米的车有 2 辆,记为 m,n. “从 5 辆车中随机选取两辆车”的所有选法共 10 种,它们是 ab,ac,am,an,bc,bm,bn,cm,cn,mn. “从 5 辆车中随机选取两辆车,恰有一辆车行驶里程超过 10 万千米”的选法共 6种:am,an,bm,bn,cm,cn,

 则选取两辆车中恰有一辆车行驶里程超过 10 万千米的概率 p 2 =610 =35 . 5.(2020·郑州模拟)某机构欲组织某学术研讨活动,根据报名人数 x(单位:人)确定预交活动经费标准 y(单位:千元/人)的情况如下表:

 x 100 200 300 400 500 y 7 6.5 5.8 5 4.2 (1)若 y 与 x 具有较强的线性相关关系,根据上表中的数据,用最小二乘法求出 y关于 x 的线性回归方程y=bx+a; (2)根据(1)所求回归方程确定参加研讨活动每人的预交费用,下面提供甲、乙两种方案:甲方案是所有报名者组成一个组,固定投入为 3.63 千元/人,且开源节流可节省 0.000 1x 千元/人;乙方案是若报名人数不超过 330 人,则组成一个组,固定投入为 3.63 千元/人,且开源节流可节省 0.000 1x 千元/人,若报名人数超过 330人,则分成两个组,固定投入可降到 2.93 千元/人,且开源节流可节省 0.000 1x千元/人,但分成两个组后需附加费共计 200 千元.试分别预测甲、乙两种方案报名人数 x 为多少时,相应的余款最多,最多为多少?并以此为依据从报名人数控制上给该机构提出一个合理建议. 参考公式:b=∑ni = 1 x i y i -n x-

 y- ∑ni = 1 x2i -nx- 2 =∑ni = 1

 (x i -x-)(y i -y-)∑ni = 1

 (x i -x-)

 2,a=y--bx-. 解 (1)x-= 100+200+300+400+5005=300, y-= 7+6.5+5.8+5+4.25=5.7,

 x 100 200 300 400 500 y 7 6.5 5.8 5 4.2 x-x- -200 -100 0 100 200 y-y- 1.3 0.8 0.1 -0.7 -1.5 (x-x-) 2

 40 000 10 000 0 10 000 40

 000

 (x-x-)(y-y-) -260 -80 0 -70 -300 因而b=∑5i = 1

 (x i - x- )(y i -y-)∑5i = 1

 (x i -x-)

 2=-710100 000 =-0.007 1, a=5.7+0.007 1×300=7.83, 故所求线性回归方程为y=-0.007 1x+7.83. (2)依题意得,甲方案的余款为 f(x)=(-0.007 1x+7.83)x-3.63x+0.000 1x 2 = -0.007x 2 +4.2x. 又(-0.007 1x+7.83)x-2.93x+0.000 1x 2 -200=-0.007x 2 +4.9x-200, 所以乙方案的余款为 g(x)=  -0.007x 2 +4.2x,0<x≤330,-0.007x 2 +4.9x-200,x>300.

 甲方案:当 x=4.20.014 =300 时,f(x)取最大值 630. 乙方案:x=4.90.014 =350>330, g(350)=-0.007×350 2 +4.9×350-200=657.5>630, 故对于方案乙,当 x=350 时,g(x)取最大值 657.5. 因此,若采用方案甲,则应将报名人数控制在 300 人左右,活动费用最少,最经济; 若采用方案乙,则应将报名人数控制在 350 人左右,活动费用最少,最经济. 6.如图是某小区 2017 年 1 月至 2018 年 1 月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码 1~13 分别对应 2017 年 1 月~2018 年 1 月)

 由散点图选择 y=a+b x和 y=c+dln x 两个模型进行拟合,经过数据处理得到两个回归方程分别为y^=0.936 9+0.028 5 x和y^=0.955 4+0.030 6ln x,并得到以下一些统计量的值:

 y^=0.936 9+0.028 5 x y^=0.955 4+0.030 16ln x 残差平方和 ∑13i = 1

 (y i -y^i ) 2

 0.000 591 0.000 164 总偏差平方和 ∑13i = 1

 (y i -y-) 2

 0.006 050 (1)请利用相关指数 R 2 判断哪个模型的拟合效果更好; (2)某位购房者拟于 2018 年 6 月份购买这个小区 m(70≤m≤160)平方米的二手房(欲购房为其家庭首套房).若购房时该小区所有住房的房产证均已满 2 年但未满 5年,请你利用(1)中拟合效果更好的模型估算该购房者应支付的购房金额(购房金额=房款+税费;房屋均价精确到 0.001 万元/平方米). 附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格进行征收.(计税价格=房款),征收方式见下表:

 契税 (买方缴纳) 首套面积 90 平方米以内(含 90 平方米)为 1%;首套面积 90平方米以上且 144 平方米以内(含 144 平方米)为 1.5%;面积144 平方米以上或非首套为 3% 增值税 (卖方缴纳) 房产证未满2年或满2年且面积在144平方米以上(不含144平方米)为 5.6%;其他情况免征 个人所得税 (卖方缴纳) 首套面积 144 平方米以内(含 144 平方米)为 1%;面积 144平方米以上或非首套均为 1.5%;房产证满 5 年且是家庭唯一住房的免征 参考数据:ln 2≈0.69,ln 3≈1.10,ln 17≈2.83,ln 19≈2.94, 2≈1.41, 3≈1.73,17≈4.12, 19≈4.36. 参考公式:相关指数 R 2 =1-∑ni = 1

 (y i -y^i )

 2∑ni = 1

 (y i -y-)

 2. 解 (1)设模型y^=0.936 9+0.028 5 x和y^=0.955 4+0.030 6ln x 的相关指数分别为

 R 2 1 和 R 2 2 ,则 R 2 1 =1- 0.000 5910.006 05,R 2 2 =1- 0.000 1640.006 05,R 2 1 <R 2 2 , 所以模型y^=0.955 4+0.030 6ln x 拟合的效果更好. (2)由(1)知模型y^=0.955 4+0.030 6ln x 拟合的效果好,利用该模型预测可得,这个小区在 2018 年 6 月份的在售二手房均价为

 y^=0.955 4+0.030 6ln 18=0.955 4+0.030 6(ln 2+2ln 3)≈1.044 万元/平方米, 设该购房者应支付的购房金额为 h 万元,因为税费中买方只需缴纳契税,所以 ①当 70≤m≤90 时,契税为计税价格的 1%, 故 h=m×1.044×(1%+1)=1.054 44m; ②当 90<m≤144 时,契税为计税价格的 1.5%, 故 h=m×1.044×(1.5%+1)=1.059 66m; ③当 144<m≤160 时,契税为计税价格的 3%, 故 h=m×1.044×(3%+1)=1.075 32m. 所以 h= 1.054 44m,70≤m≤90,1.059 66m,90<m≤144,1.075 32m,144<m≤160.

推荐访问:前瞻 概率 热点问题

猜你喜欢