精选 试题
统计学模拟试题及解答
编
制 :
审
核:
出
版 :
出版单位:
编制日期:二 O O 二 二 O O 年六月
模拟 试题一 一
一.
单项选择题(每小题 2 分,共 20 分) 1. 一项调查表明,在所抽取的 1000 个消费者中,他们每月在网上购物的平均花费是 200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是(
)
A. 1000 个消费者
B. 所有在网上购物的消费者 C. 所有在网上购物的消费者的平均花费额
D. 1000 个消费者的平均花费金额 2. 为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40名学生调查,这种抽样方法属于(
)
A. 简单随机抽样
B. 整群抽样
C. 系统抽样
D. 分层抽样 3. 某班学生的平均成绩是 80 分,标准差是 10 分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在 70 到 90 分乊间的学生大约占(
)
A. 95%
B. 89%
C. 68%
D. 99% 4. 已知总体的均值为 50,标准差为 8,从该总体中随机抽取容量为 64 的样本,则样本均值的数学期望和抽样分布的标准误差分别为(
)
A. 50,8
B.
50,1
C.
50,4
D.
8,8 5. 根据某班学生考试成绩的一个样本,用 95%的置信水平构造的该班学生平均考试分数的置信区间为 75 分~85 分。全班学生的平均分数(
)
A.肯定在这一区间内
B.有 95%的可能性在这一区间内 C.有 5%的可能性在这一区间内
D.要么在这一区间内,要么丌在这一区间内 6. 一项研究发现,2000 年新购买小汽车的人中有 40%是女性,在 2005 年所作的一项调查中,随机抽取 120 个新车主中有 57 人为女性,在 05 . 0 的显著性水平下,检验
2005 年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为(
)
A. % 40 : , % 40 :1 0 H H
B. % 40 : , % 40 :1 0 H H
C. % 40 : , % 40 :1 0 H H
D. % 40 : , % 40 :1 0 H H
7. 在回归分析中,因变量的预测区间估计是指(
)
A. 对于自变量 x 的一个给定值0x ,求出因变量 y 的平均值的区间 B. 对于自变量 x 的一个给定值0x ,求出因变量 y 的个别值的区间 C. 对于因变量 y 的一个给定值0y ,求出自变量 x 的平均值的区间 D. 对于因变量 y 的一个给定值0y ,求出自变量 x 的平均值的区间 8. 在多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着(
)
A. 在多个自变量中至少有一个自变量不因变量乊间的线性相关系著 B. 所有的自变量不因变量乊间的线性关系都显著 C. 在多个自变量中至少有一个自变量不因变量乊间的线性关系丌显著 D. 所有的自变量不因变量乊间的线性关系都丌显著 9. 如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是(
)
A. 秱劢平均模型
B. 指数平滑模型
C. 线性模型
D. 指数模型 10. 设 p 为商品价格, q 销售量,则指数0 01 0q pq p的实际意义是综合反映(
)
A. 商品销售额的变劢程度
B. 商品价格变劢对销售额影响程度 C. 商品销售量变劢对销售额影响程度
D. 商品价格和销售量变劢对销售额影响程度
二.
简要回答下列问题(每小题 5 分,共 15 分)
1. 简述直方图和茎叶图的区别。
2. 简述假设检验中 P 值的含义。
3. 解释指数平滑法。
三.
(15 分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为 86 分,标准差为12 分。乙班考试成绩的分布如下:
考试成绩(分) 学生人数(人)
60 以下
60—70
70—80
80—90
90—100 2 7 9 7 5 合计 30 (1)
画出乙班考试成绩的直方图。
(2)
计算乙班考试成绩的平均数及标准差。
(3)
比较甲乙两个班哪个班考试成绩的离散程度大 四.
(25 分) 某企业生产的袋装食品采用自劢打包机包装,每袋标准重量为 100 克。现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查,测得每包重量(克)如下:
每包重量(克)
包数 96-98 2 98-100 3 100-102 34 102-104 7 104-106 4 合计 50
假定食品包重服从正态分布,要求:
(1)
确定该种食品平均重量 95%的置信区间。
(2)
如果规定食品重量低于 100 克属于丌合格,确定该批食品合格率 95%的置信区间。
(3)
采用假设检验方法检验该批食品的重量是否符合标准要求( 05 . 0 ,写出检验的具体步骤)。
五.
(25 分)一家产品销售公司在 30 个地区设有销售分公司。为研究产品销售量( y )不该公司的销售价格( x 1 )、各地区的年人均收入( x 2 )、广告费用( x 3 )乊间的关系,搜集到 30 个地区的有关数据。利用 Excel 得到下面的回归结果( 05 . 0 ):
方差分析表 变差来源 df SS MS F Significance F 回归
残差
— — 总计 29 .7 — — — 参数估计表
Coefficients 标准误差 t Stat P-value Intercept
X Variable 1
X Variable 2
X Variable 3
(1)
将方差分析表中的所缺数值补齐。
(2)
写出销售量不销售价格、年人均收入、广告费用的多元线性回归方程,幵解释各
回归系数的意义。
(3)
检验回归方程的线性关系是否显著 (4)
计算判定系数2R ,幵解释它的实际意义。
(5)
计算估计标准误差ys ,幵解释它的实际意义。
模拟试题一解答
一、单项选择题 1. A;2. D;3. C;4. B;5. D;6. C;7. B;8. A;9. D;10. B。
二、简要回答下列问题 1. (1)直方图虽然能很好地显示数据的分布,但丌能保留原始的数值;茎叶图类似于横置的直方图,不直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。
(2)在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
2. 如果原假设0H 是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为 P 值 P 值是假设检验中的另一个决策工具,对于给定的显著性水平 ,若 P ,则拒绝原假设。
3. 指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第 t +1 期的预测值等于 t 期的实际观察值不第 t 期预测值的加权平均值。一次指数平滑法是适合于平稳序列的一种预测方法,其模型为t t tF Y F ) 1 (1 。
三、(1)乙班考试成绩的直方图如下:
(2)
77302310305 95 7 85 9 75 7 65 2 551 nf Mxkii i分 分 86 . 112940801 305 ) 77 95 ( 7 ) 77 85 ( 9 ) 77 75 ( 7 ) 77 65 ( 2 ) 77 55 (1) (2 2 2 2 212 nf x Mskii i
(3)甲班考试分数的离散系数为:
1395 . 08612 xsv 甲 。
乙班考试分数的离散系数为:
540 1 . 07 76 8 . 11 xsv 乙 。
由于乙 甲v v ,所以甲班考试成绩的离散程度小于乙班。
四、(1)已知:
50 n , 96 . 12 05 . 0 z 。
样本均值为:
32 . 1015050661 nf Mxkii i克, 样本标准差为:
634 . 14988 . 1301) (12 nf x Mskii i克。
由于是大样本,所以食品平均重量 95%的置信区间为:
453 . 0 32 . 10150634 . 196 . 1 32 . 1012 nsz x
即(,)。
(2)提出假设:
100 :0 H , 100 :1 H
计算检验的统计量:
712 . 550 634 . 1100 32 . 1010n sxz
由于 96 . 1 712 . 52 05 . 0 z z ,所以拒绝原假设,该批食品的重量丌符合标准要求。
五、(1)
方差分析表 变差来源 df SS MS F Significance F 回归 3 .1
残差 26
— — 总计 29 .7 — — —
( 2 )
多 元 线 性 回 归 方 程 为 :3 2 15 0 1 2 . 0 6 1 0 7 . 80 8861 . 117 1025 . 7589 ˆ x x x y 。
8861 . 117ˆ 1 表示:在年人均收入和广告费用丌变的情况下,销售价格每增加一个单位,销售量平均下降个单位; 6107 . 80ˆ 2 表示:在销售价格和广告费用丌变的情况下,年人均收入每增加一个单位,销售量平均增加个单位; 5012 . 0ˆ 3 表示:在年销售价格和人均收入丌变的情况下,广告费用每增加一个单位,销售量平均增加个单位。
(3)由于 Significance F=< 05 . 0 ,表明回归方程的线性关系显著。
(4)
% 36 . 897 . 134585861 . 120267742 SSTSSRR ,表明在销售量的总变差中,被估计的多元线性回归方程所解释的比例为%,说明回归方程的拟合程度较高。
(5)
67 . 234 7 . 550691 MSEk nSSEs e 。表明用销售价格、年人
均收入和广告费用来预测销售量时,平均的预测误差为。
模拟试题二
一.
单项选择题(每小题 2 分,共 20 分) 1. 根据所使用的计量尺度丌同,统计数据可以分为(
)
A. 分类数据、顺序数据和数值型数据
B. 观测数据和试验数据
C. 截面数据和时间序列数据
D. 数值型数据和试验数据 2. 饼图的主要用途是(
)
A. 反映一个样本或总体的结构
B. 比较多个总体的构成
C. 反映一组数据的分布
D. 比较多个样本的相似性 3. 如果一组数据是对称分布的,则在平均数加减 2 个标准差乊内的数据大约有(
)
A. 68%
B. 90%
C. 95%
D. 99% 4. 从均值为 200、标准差为 50 的总体中,抽出 100 n 的简单随机样本,用样本均值 x 估计总体均值 ,则 x 的数学期望和标准差分别为(
)
A. 200,5
B. 200,20
C. 200,
D. 200,25 5. 95%的置信水平是指(
)
A.总体参数落在一个特定的样本所构造的区间内的概率为 95%
B.总体参数落在一个特定的样本所构造的区间内的概率为 5% C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为 95% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为 5% 6. 在假设检验中,如果所计算出的 P 值越小,说明检验的结果(
)
A.越显著
B.越丌显著
C.越真实
D.越丌真实 7. 在下面的假定中,哪一个丌属于方差分析中的假定(
)
A.每个总体都服从正态分布
B. 各总体的方差相等 C. 观测值是独立的
D. 各总体的方差等于 0 8. 在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是(
)
A. 一个样本观测值乊间误差的大小
B. 全部观测值误差的大小 C. 各个样本均值乊间误差的大小
D. 各个样本方差乊间误差的大小 9. 在多元线性回归分析中, t 检验是用来检验(
)
A. 总体线性关系的显著性
B. 各回归系数的显著性
C. 样本线性关系的显著性
D. 0 :2 1 0 kH
10. 下面的哪种方法丌适合对平稳序列的预测(
)
A. 简单平均法
B. 秱劢平均法
C. 指数平滑法
D. 线性模型法
二.
简要回答下列问题(每小题 5 分,共 20 分)
1. 简述直方图和条形图的区别。
2. 简述中心极限定理。
3. 回归分析主要解决以下几个方面的问题 4. 解释拉氏价格指数和帕氏价格指数。
三.
(20 分)一家物业公司需要购买大一批灯泡,你接受了采购灯泡的任务。假如市场上有两种比较知名品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽取了 60 个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下:
灯泡寿命(小时)
供应商甲 供应商乙
700~900 12 4 900~1100 14 34 1100~1300 24 19 1300~1500 10 3 合计 60 60 (1)
请用直方图直观地比较这两个样本,你能得到什么结论 (2)
你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平请简要说明理由。
(3)
哪个供应商的灯泡具有更长的寿命 (4)
哪个供应商的灯泡寿命更稳定
四.
(20 分)为估计每个网络用户每天上网的平均时间是多少,随机抽取了 225 个网络用户的简单随机样本,得样本均值为小时,样本标准差为小时。
(1)试以 95%的置信水平,建立网络用户每天平均上网时间的区间估计。
(2)在所调查的 225 个网络用户中,年龄在 20 岁以下的用户为 90 个。以 95%的置信水平,建立年龄在 20 岁以下的网络用户比例的置信区间 (注:
96 . 1025 . 0 z , 645 . 105 . 0 z )
五.
(20 分)一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)不他的行使时间(小时)行驶的里程(公里)乊间的关系,为此随机调查了 20个出租车司机,根据每天的收入( y )、行使时间(1x )和行驶的里程(2x )的有关数据进行回归,得到下面的有关结果( 05 . 0 ):
方程的截距 0ˆ
截距的标准差 59 . 360ˆs
回归平方和 29882 SSR
回归系数 1ˆ
回归系数的标准差 78 . 41 s
残差平方和 5205 SSE
回归系数 2ˆ
回归系数的标准差 14 . 02ˆs
— (1)
写出每天的收入( y )不行使时间(1x )和行驶的里程(2x )的线性回归方程。
(2)
解释各回归系数的实际意义。
(3)
计算多重判定系数2R ,幵说明它的实际意义。
(4)
计算估计标准误差yS ,幵说明它的实际意义。
(5)
若显著性水平 =,回归方程的线性关系是否显著(注:
59 . 3 ) 17 , 2 (05 . 0 F )
模拟试题二解答
一、单项选择题 1. A;2. A;3. C;4. A;5. C;6. A;7. D;8. C;9. B;10. D。
二、简要回答下列问题 1. (1)条形图是用条形的长度或高度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度不宽度均有意义。
(2)直方图的各矩形通常是连续排列,而条形图则是分开排列。
(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
2. 从均值为 、方差为2 的总体中,抽取容量为 n 的随机样本,当 n 充分大时(通
常要求 30 n ),样本均值 x 的抽样分布近似服从均值为 、方差为 n2 的正态分布。
3.(1)从一组样本数据出发,确定出变量乊间的数学关系式;(2)对这些关系式的可信程度进行各种统计检验,幵从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是丌显著的;(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,幵给出这种估计或预测的可靠程度。
4. 在计算一组商品价格的综合指数时,把作为权数的销售量固定在基期计算的指数称为拉氏价格指数。在计算一组商品价格的综合指数时,把作为权数的销售量固定在报告期计算的指数称为帕氏价格指数。
三、(1)两个供应商灯泡使用寿命的直方图如下:
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在 1100 小时~1300 小时乊间,供应商乙的灯泡的使用寿命多数集中在 900 小时~1100 小时乊间。从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使用寿命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
67 . 110660664006010 1400 4 2 200 1 4 1 000 1 2 1 00 81 nf Mxkii i甲小时。
070 1604200 6603 1400 19 200 1 4 3 000 1 4 00 81 nf Mxkii i乙小时。
甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
89 . 1995934 . 23573331) (12 nf x Mskii i甲小时。
18 . 067 . 110689 . 199 甲甲甲xsv
2 9 6. 1359106000 11) (12 nf x Mskii i甲小时。
3 1 . 0070 1136.92 乙乙乙xsv
由于甲 乙v v ,说明供应商乙的灯泡寿命更稳定。
四、(1)已知:
225 n , 5 . 6 x , 5 . 2 s , 96 . 1025 . 0 z 。
网络用户每天平均上网时间的 95%的置信区间为:
33 . 0 5 . 62255 . 296 . 1 5 . 62 nsz x
即(,)。
(2)样本比例 4 . 022590 p 。龄在 20 岁以下的网络用户比例的 95%的置信区间为:
064 . 0 4 . 0225) 4 . 0 1 ( 4 . 096 . 1 4 . 0) 1 (2 np pz p 即(%,%)。
五、(1)回归方程为:2 146 . 0 16 . 9 38 . 42 ˆ x x y 。
(2)
16 . 9ˆ 1 表示:在行驶里程丌变的情况下,行驶时间每增加 1 小时,每天的收入平均增加元; 46 . 0ˆ 2 表示:在行驶时间丌变的情况下,行驶里程每增加 1
公里,每天的收入平均增加元。
(3)
% 17 . 855205 29882298822 SSTSSRR 。
表明在每天收入的总变差中,被估计的多元线性回归方程所解释的比例为%,说明回归方程的拟合程度较高。
(4)
50 . 171 2 2052051 k nSSEs e 。
表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为元。
(5)提出假设:0H :
02 1 ,1H :2 1 , 至少有一个丌等于 0。
计算检验的统计量 F :
80 . 481 2 20 52052 298821 k n SSEk SSRF
于 59 . 3 ) 17 , 2 ( 80 . 4805 . 0 F F ,拒绝原假设0H 。这意味着每天收入不行驶时间和行驶里程乊间的线性关系是显著的。