《数据分析》课程考试试卷 学年第 学期 班级
时间:地分钟的7还分考试形式:开卷
一、填空题(每题4分,共40分)
1.方程显著性检验是检验 对 的影响是否显著;参数显著性检验是检验
对 的影响是否显著。
2.选择“最优”回归方程的方法有、、等。
3. Spss for windows中主成分分析由 过程实现。
4.因子分析把每个原始变量分解为两部分因素:一部分为,另一部分为。
5.在快速聚类过程中,数据的标准化可通过 过程来实现,在分层聚类中,数据
的标准化可通过 选项来实现。
6. Q型聚类是指对 进行聚类,R型聚类是指对 进行聚类。
7.凝聚点是指。
8.因子分析中ag的统计意义是 o
9.取消一个自变量后回归平方和减少的数值,称为因变量对这个自变量的 o
10.按变量相关程度来分,在 和 情况下主成分分析效果较好。
二、简答(每题10分,共30分)
1.简述主成分分析、因子分析的基本思想,以及两者的的联系和差异。
2.简述方差分析的基本原理及应用条件。
3.简述聚类分析基本思想,Q型聚类分析与R型聚类分析的区别,系统聚类法基本步 骤。
三、计算题(每题15分,共30分)
1.现收集了财政收入(Y)与工业总产值(Xl)、建筑业总产值(X2) 1978—1990年 数据,经分析回归方程为
Y=524.536+0.05265X 1+0.454X2
T 值 (7.518) (2.695) (3.214)
R2=.0.990 F=246.240
(1)对所求得的方程作显著性检验,在A=0.05时,你的结论是什么?
(2)对各回归系数作显著性检验.(A=O.05)
(3)说明回归方程的经济意义.
(4)求出回归方程的复相关系数.
(5)若因变量Y与自变量X1,X2的偏相关系数分别为中;2=0.916心2尸0.71188,说明了 什么?
(6)若1991年工业总产值为24502亿元,建筑业总产值为2980亿元,试求1991年财政 收入的预测值与预测区间.(∣-A=95%,随机误差项的标准差δ=121.85)
有关临界值:Fo.。5(2,10)=41,F(M)5(2,13)=3.8,Sos(IO)=L812 to25(10)=2∙228
2.下表是进行因子分析的结果,根据下列信息计算公共因子Fj的方差贡献,说明其统计 意义.
表1解释的总方差
| 成份 | 初始特征值 | 提取平方和载入 |
| 合计 | 方差的% | 累积% | 合计 | 方差的% | 累积% |
| 1 | 2.285 | 38.084 | 38.084 | 2.285 | 38.084 | 38.084 |
| 2 | 1.793 | 29.881 | 67.965 | 1.793 | 29.881 | 67.965 |
| 3 | .954 | 15.3 | 83.858 | | | |
| 4 | .700 | 11.659 | 95.517 | | | |
| 5 | .201 | 3.356 | 98.873 | | | |
| 6 | .068 | 1.127 | 100.000 | | | |
提取方法:主成份分析。表2成份得分系数矩阵
| 成份 |
| 1 | 2 |
| 氯 | -.427 | .009 |
| 硫化氢 | .259 | .365 |
| 二氧化碳 | .185 | -.160 |
| 碳4 | -.256 | .352 |
| 环氧氯丙烷 | .295 | .167 |
| 环己烷 | -.040 | .497 |
提取方法:主成份。