⼀、单项选择题:(本⼤题⼩题,1分/每⼩题,共分)1.SPSS的数据⽂件后缀名是:(A).sav
2.对数据的各种统计处理,SPSS是在下⾯哪⼀个选项中进⾏:(A)数据编辑窗⼝;
3.在SPSS中,下⾯哪⼀个不是SPSS的运⾏⽅式(A)输⼊运⾏⽅式;
4.下⾯哪⼀个选项不属于SPSS的数据分析步骤:(D)数据扩展;
5.在SPSS中,下⾯哪⼀个选项不属于对变量(列)的描述:(B)变量名称⼤⼩;
6.在SPSS的定义中,下⾯哪⼀个变量名的定义是错误的:
(D)A_BFG_;⾸字符应以英⽂字母开头,后⾯可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后⼀个字符。SPSS允许⽤汉字作为变量名。
7.在SPSS的定义中,下⾯哪⼀个变量名的定义是错误的:
(A)AND;SPSS有默认的变量名,以字母“VAR”开头,后⾯补⾜5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY 、 AND 、 NOT 、 OR等。8.在SPSS数据⽂件中,下⾯那⼀项不属于数据的结构:(D)数据值;
9.在SPSS数据⽂件中,下⾯那⼀项属于数据的内容:(D)数据值;
10. 通常来说,发放了900份问卷,可直接得到的有效问卷有800份,则SPSS所建⽴的相关数据⽂件中的⾏数为(D)800;
11.下⾯那⼀项不属于SPSS的基本变量类型:(D)整数型;
12.当在SPSS数据⽂件中输⼊变量为“职⼯姓名”,则应选择的变量类型是:(B)字符串型;
13.当在SPSS数据⽂件中输⼊变量为“职⼯⼯资数”,则应选择的变量类型是:(A)数值型;
13.当在SPSS数据⽂件中输⼊变量为“公司成⽴⽇期”,则应选择的变量类型是:(C)⽇期型;
14.在SPSS的数据结构中,下⾯那⼀项不是“缺失数据”的定义:(D)数据不是科学计数法;
15.统计学依据变量的计量尺度将变量分为三类,以下哪⼀类不属于这三类:(D)科学计数类型;
16.在统计学中,变量“⾝⾼”属于计量尺度中的:
(A)数值型变量;⾝⾼(定距)、优良中差(定序)、性别(定类)
17.在统计学中,将变量“年龄”分为“⽼年”、“中年”、“青年”三个取值,分别⽤1、2、3表⽰,则变量“年龄”属于计量尺度中的:(B)定序型变量;
18.在统计学中,将变量“性别”分为“男”、“⼥”、两个取值,分别⽤1、2表⽰,则变量“性别”属于计量尺度中的:(C)定类型变量;
19.下⾯哪⼀个选项不能被SPSS系统正常打开:(C)⽂本⽂件格式;
20. 下⾯哪⼀个选项不能被SPSS系统正常打开:(D).exe;
21.在SPSS数据编辑窗⼝中,需要定义变量的数据结构,以下哪⼀项不属于变量的数据结构:(D)变量值;
22. 在SPSS数据结构中,下⾯哪⼀项不属于数据类型:(D)数值标签型;
23.下⾯哪⼀个选项不是SPSS中定义的基本描述统计量:(D)回归函数;
24.下⾯哪⼀个选项不是SPSS中定义的基本描述统计量:D)因⼦;
25.下⾯那⼀项刻画了随机变量分布形态的对称性:(D)偏度系数;
26.下⾯那⼀项刻画了随机变量分布形态陡缓程度:(D)峰度系数;
27.对于SPSS来说,下⾯那⼀项不包括在变量的频数分布内容中:(D)均值;(频数、百分⽐、有效百分⽐、累计百分⽐)
27.对于SPSS来说,下⾯那⼀项不包括在变量的频数分布内容中:(C)标准差;
28.在SPSS中,下⾯那⼀项不是频数分析中常⽤的统计图形:(D)分类图;
29.在SPSS中,当需要对变量进⾏频数分析时,需要选择下⾯那⼀项菜单:(C)分析;
30.在进⾏数据的统计分析之前,⼀般需要完成数据的预处理,以下哪⼀项不属于数据的预处理内容:(B)峰度和偏度处理;
31.在SPSS中,当我需要对原有某个变量的数据进⾏取对数运算时,应选取下⾯那⼀项进⾏处理:(A)变量计算;
32.在SPSS中,下⾯那⼀项不属于数据分组的⽬的:
(D)有利于进⾏因⼦分析;
33.对于SPSS中的组距分组,下⾯那⼀项是正确的说法:(A)分组数与数据本⾝特点和数据个数有关;
34.对于SPSS来说,能够快捷找到变量数据的最⼤值和最⼩值的数据预处理⽅法是:(A)排序;
35.对于SPSS来说,能够快捷找到变量数据的异常值的数据预处理⽅法是:(A)排序;
36.在学⽣的⼀张数据表中,有平时分数、实验分数和卷⾯分数,如使⽤SPSS计算最终得分,则需要使⽤SPSS预处理中的:(C)变量计算;
37.在SPSS中,以下哪个选项可以完成如下功能:由收集的整体数据中抽取出年龄⼤于30的数据:(A)数据选取;
38.下⾯哪⼀个选项不是对数据的基本统计分析:(D)实现变量的排序与合并;
39.在SPSS中,当变量是数值型时,则频数分析所⽤图形为:(A)直⽅图;
40.在SPSS中,当需要选取出满⾜某⼀个条件的所有个案,则使⽤下⾯的那⼀项:(A)个案选择;
41.在SPSS中,均值的计算适合下⾯那⼀项:(A)定距型;
42.现有⼀批数据为(0,1,2,-2,3,-3,4),则这批数据的极差为:(A)7;
43.以下图是某随机变量的概率密度,请问其峰度是:
(B)⼩于零;右偏⼤于0;左偏⼩于0;偏度为0表⽰对称。44. 以下图是某随机变量的概率密度,请问其峰度是:
(A)⼤于零;
45.以下图是某随机变量的概率密度,请问其峰度是:
(C)等于零;
46.单因素⽅差分析的第⼀步是明确观测变量和控制变量,例如,当分析不同施肥量是否对农产品产量带来显著影响、地域差别是否对妇⼥⽣育率有关系和学历对⼯资的作⽤关系时,控制变量分别是:(A)施肥量、地域和学历;(B)施肥量、⽣育率和学历;(C)施肥量、地域和⼯资;(D) 农产品产量、地域和学历;
47. 单因素⽅差分析的第⼀步是明确观测变量和控制变量,例如,当分析不同施肥量是否对农产品产量带来显著影响、地域差别是否对妇⼥⽣育率有关系和学历对⼯资的作⽤关系时,观测变量分别是:(A)农产品产量、妇⼥⽣育率和⼯资;
48.当需要分析多个随机变量之间的相互影响和关系时,在SPSS中应使⽤下⾯哪⼀个选项:(D)交叉分组下的频数分析;
49.下⾯那⼀种情况下,可以使⽤交叉列联表中来进⾏卡⽅分布检验:(A)列联表单元格的全部期望频数都⼤于6;
50.当需要分析某⼀个变量的分布情况时,采⽤下⾯那⼀个选项较为合适:(A)频数分析;
51.在统计分析中,描述变量的数据离散程度的基本统计量是:(A)标准差;
52.在统计分析中,描述变量数据分布的中⼼位置的基本统计量是:(D)均值;
53.在统计分析中,描述变量数据分布的对称程度的基本统计量是:(B)偏度;
54.在统计分析中,描述变量的数据分布的陡峭程度的基本统计量是:(C)峰度;
55.下⾯那⼀种说法是正确的:
(B)偏度⼤于零,则数据分布的长尾巴在左边;56.下图中右下⾓的问号应选择:
(C)参数检验;
57.在得到⼀批未知其总体分布的数据后,可使⽤以下哪种⽅法验证其是否与某个已知理论分布相吻合: (C)参数检验;
58. 需要检验⼀批未知的连续数值型随机单样本是否是正态分布,则需要下⾯的那⼀项: (C)标准差检验;
59.已知某⼀分布是正态分布的随机变量x 的均值为µ,⽅差为2σ,则将其转换成标准正态分布(即均值为0,标准差为1)的公式是:
(A)()x µσ-;(B)2()x µσ-;(C)()x n µ-;(D)()x σµ-;
60.下⾯那⼀项不是两独⽴样本t 检验的前提条件: (D)两个样本的⽅差必须相等;
61.设待检验两个总体的均值分别为1µ、2µ,则相关的两独⽴样本t 检验的假设0H 是: (A)012:0H µµ-=;
62.在交叉列联表检验中,⾏数为6,列数为7,则当变量间独⽴时所对应卡⽅分布的⾃由度是: ⾃由度=(列数-1)*(⾏数-1) (A)30;
63.在交叉列联表检验中,当变量间独⽴时所对应检验统计量的分布是: (A)卡⽅分布;
64.已知两批独⽴随机样本都服从正态分布,要检验这两批随机样本的⽅差是否相同,则需要采⽤: (A)F 检验;
65. .已知两批独⽴随机样本都服从正态分布,要检验这两批随机样本的均值是否相同,则需要采⽤: (B)两独⽴样本t 检验;66. 已知⼀批独⽴随机样本服从正态分布,要检验这批随机样本的均值是否与某总体分布的均值相同,则需要采⽤: (A)单样本t 检验;
67.下⾯那⼀项不属于假设检验的基本步骤: (B)画出随机样本的直⽅图;
68.当样本的分布未知,需要利⽤样本的数据推断出总体分布形态的⽅法是: (A)⾮参数检验;(B)参数检验;(C)⽅差检验;(D)因⼦分解;
69. 在总体分布未知的情况下,利⽤样本数据对所假定总体的分布进⾏显著性检验的⽅法是: (B)⾮参数检验;70.现有两段独⽴样本数据,欲判断它们之间的分布是否存在显著性差异,则可采⽤: (B)⾮参数检验;71.单样本的总体分布卡⽅检验属于: (C)⾮参数检验,⽤于了解样本的分布是否与某⼀已知的理论分布吻合;72. 单样本K-S 检验属于: (C)⾮参数检验,⽤于了解连续数值型样本的分布是否与某⼀已知的理论分布吻合;73.两配对样本t检验的⽬的是:
(C)推导出来⾃于两个总体的配对样本的分布是否存在显著性差异;
74.以下是使⽤SPSS所做的⾮参数检验的结果图,根据所给图选择正确的⼀项:
:
(A)接受假设H0;
75.样本值序列为1011011010011000101010000111,则整段样本值序列的游程数是:(A)17;
75.样本值序列为男男⼥⼥⼥男⼥⼥男男男男,则整段样本值序列的游程数是:
(A)5;
76.样本值序列为男男男男男男男⼥⼥⼥⼥⼥,则整段样本值序列的游程数是:(A)2;
77. 样本值序列为男男男男男男男⼥⼥⼥⼥⼥,则整段样本值序列的游程数是:(A)2;
78. 样本值序列为男⼥男⼥男⼥男⼥男⼥男男,则整段样本值序列的游程数是:(C)11;
79. 样本值序列为00110111000100100010,则整段样本值序列的游程数是:(C)11;
80. 样本性质下⾯的那⼀项可适⽤于两独⽴样本的曼-惠特尼U检验:(A)样本秩;
81. 样本性质下⾯的那⼀项可适⽤于两独⽴样本的K-S检验:(B)样本数值;
82.下图是某两独⽴样本的游程检验⽰意图,请问图中数据的游程数是:
(A)6;
83.K-S检验可⽤于:(B)⾮参数检验;
84.下⾯那⼀选项是独⽴样本:
(A)分别对两批不同年级的⼤学⽣调查他们的学习兴趣;85.现有⼀批数据:2.3, 1.2, 3.8, 6, 9,则6的秩是:(C)4,
86.观察某新开发的饲料对猪的影响:⾸先不⽤这个饲料,测量猪在⼀个⽉的体重;再在下⼀个⽉内使⽤新饲料喂养同⼀批猪,测量体重;实验者想知道前后两个⽉猪的体重的分布是否有差别,则可⽤以下哪⼀项进⾏检验:(C)⽅差检验;
87.观察某新的营销⼿段对商品销售量的影响:⾸先不⽤这个营销⼿段,测量10种商品在⼀个⽉的销售量;再在下⼀个⽉内使⽤该新营销⼿段处理同样这10种商品,测量销售量;实验者想知道这新的营销⼿段是否对商品的销售量有显著性区别,则可⽤
以下哪⼀项进⾏检验(销售量的分布未知):(A) ⾮参数检验中的两配对样本检验;
88.观察性别是否对书籍种类的购买意愿有差别:随机选择20个男同学,随机选择30个⼥同学,分别调查他们对书籍的购买意愿,调查者想知道性别对数据种类的购买是否有影响,则可使⽤(男和⼥同学购买数据的分布是正态分布):(B) ⾮参数检验中的两独⽴样本检验;
89.在假设检验中,秩的概念主要⽤在下⾯那⼀项中:(B)⾮参数检验;
90.现有⼀种饲料,使⽤不同的数量来喂养动物,测量出不同喂养量情况下动物的体重,现欲知道动物的体重是否与不同喂养量有关,则采⽤下⾯那⼀项:(D)⽅差检验;
91.使⽤某种肥料对10块⽟⽶⽥的产量进⾏实验,分别在每块⽥内使⽤0公⽄、1公⽄、2公⽄、3公⽄、4公⽄、5公⽄该肥料,再测量出每种肥料使⽤量和每块⽥的产量,当使⽤⽅差分析时,下⾯哪⼀个说法是正确的:(A)肥料量是控制变量,每块⽥的产量是观测变量;
92.在制定某商品⼴告宣传策略时,⼴告效果可能会受到⼴告形式、地区规模、选择的栏⽬、播放的时间段、播放的频率等因素的影响。⼈们需要研究在影响⼴告效果的众多因素中,那些因素是主要的,则最适合的分析⽅法是:(C)多配对样本分析;
93.在⽅差分析中,共分为4组,每组有30个数据,则检验统计量F服从:(A)⾃由度为(3,116)的F分布;F(k-1,n-k)
94.现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则1.2的秩是:(A)2;
95.现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则1.3的秩是:(B)3;
96.现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则3.2的秩是:(D)4;
97.现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则4.5的秩是:(B)5;
98.现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则6的秩是:(A)6;
99.现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则9.8的秩是:(D)7;
100. 现有⼀批数据:3.2,1.3,4.5,6,0.8,9.8,1.2,则0.8的秩是:(C)1;
101.⽐较多种促销形式对同样10种商品销售的影响,则需要以下⽅法:(C)多配对样本的⾮参数检验;
102.分析不同⼴告形式、不同地区对产品的销售额影响时,需要使⽤:(B)多因素⽅差分析;
103.在多因素⽅差分析中,下⾯那⼀项不会影响观测变量的变动:
(A) 各控制变量的独⽴作⽤;
104.变量x=(1,2,3),y=(2,4,6),则变量x和y的相关系数是:(A)1;
105.对于变量x和y之间的相关系数,下⾯哪⼀个说法是错误的:
(D) 当变量之间存在⾮线性关系时,还可以使⽤相关系数判断x和y之间的关系;106.对于回归分析来说,下⾯那⼀项不属于回归分析的基本步骤:(C)计算样本数据的峰度;
三、简答题:(请将解答写在试卷上,本⼤题3⼩题,10分/每⼩题,共30分)1.如下是⼀份问卷调查表:①被调查者专业:
(A)理科;(B)⽂科;(C)⼯科;(D)社会科学;②被调查者年级:
(A) 1年级;(B) 2年级;(C) 3年级;(D) 4年级;③被调查者性别:(A)男;(B)⼥
④被调查者年级的⽉花费量;⑤被调查者⼊学⽇期;⑥被调查者民族;
、“定类型变量”。2.现有计数数据如下:
请按照SPSS 中的要求,分别填写下表中的数据组织⽅式:
注:需填写“变量1”、“变量2”、“变量3”的具体名字。 4.现在SPSS 中某⼀变量的⼀批数据如下: -1.16;1.43;-0.87;-0.45;-1.79;-1.52;1.01;0.74;0.58;0.01;-0.88;1.52;-0.27;-0.01;1.36;-0.21;
请计算这批数据的均值,⽅差,标准差:全距,偏度系数,峰度系数 解:均值=-0.03 ⽅差=1.10 标准差=1.05全距=1.52-(-1.79)=3.31 偏度系数=0.01 峰度系数=-1.19
5.年龄和⾎压列联表如下:
请根据交叉列联表的卡⽅检验步骤,判断年龄和⾎压之间是否是独⽴⽆关的。
答:经过⾎压和年龄的交叉列联表的卡⽅检验,得出渐进Sig.(双侧)的值⼤于0.05,因此年龄和⾎压之间不独⽴。6.请简述单样本t 检验的⽬的、前提和实现步骤。
答:⽬的:利⽤来⾃某总体的样本数据,推断该总体的均值是否与指定的检验值存在显著差异,它是对总体均值的假设检验。检验前提是样本来⾃的总体应服从或近似服从正态分布。实现步骤:提出原假设—选择检验统计量—计算检验统计量的观测值和概率P-值—给定显著⽔平a ,并作出决策。
7.请简述两独⽴样本t 检验的⽬的、前提和实现步骤。。
答:⽬的:利⽤来⾃两个总体的独⽴样本,推断两个总体的均值是否存在显著差异。检验前提是:样本来⾃的总体应服从或近似服从正态分布;两样本相互独⽴,即从⼀总体抽取⼀个样本对另⼀总体中抽取⼀个样本没有任何影响,两个样本的量可以不相等。实现步骤:提出原假设—选择检验统计量—计算检验统计量的观测值和概率P-值—给定显著⽔平a ,并作出决策。8.请简述假设检验的步骤。
答:提出原假设和备择假设—选择检验统计量—计算检验统计量观测值发⽣的概率—给定显著⽔平a,并作出决策。9.下⾯是某⼀个参数检验的结果:
问题如下:
(1)这是单样本t检验还是两独⽴样本t检验?两独⽴样本t检验
(2)请简述F检验的结果;经查看,该检验的F统计量的观测值为0.161,对应概率P-值为0.688,由于概率P-值⼤于0.05,因此两总体的⽅差没有显著差异。
(3)请简述检验的结果。两总体均值检验,其中t的观测值为-0.34,对应的双侧概率0.734,由于概率值⼤于0.05,因此两总体的均值没有显著差异
10.下⾯是⼀张有关两种⼯艺下产品寿命的SPSS表,其中sysm表⽰使⽤寿命值,gy表⽰两组
请⽤两独⽴样本的曼-惠特尼⽅法对这批数据进⾏检验,判断两组数据的分布是否存在显著性差别(只需要给出曼-惠特尼U统计量的值即可)。
答:U=W-k(k+1)/2=40-8*9/2=4
11.下图左边是SPSS中甲⼄两种⼯艺下某产品寿命的⼀批数据,请在下图右表中计算出混合排序后的样本数据,各组标记、甲⼄⼯艺的累积频数、累积频率和累积频率的差。(提⽰:两独⽴样本的K-S检验)。
经过计算,混合排序后的样本数据分别为646、649、650、651、652、661、662、663、669、672、675、679、682、692、693,各组标记分别为2、2、2、2、2、1、2、2、1、2、1、1、1、1、1,甲⼯艺累计频数为0、0、0、0、0、1、1、1、2、2、3、4、5、6、7,⼄⼯艺的累计频数为1、2、3、4、5、5、6、7、7、8、8、8、8、8、8,甲⼯艺累计频率为0、0、0、0、0、0.143、0.143、0.143、0.286、0.286、0.429、0.571、0.714、0.857、1,⼄⼯艺累计频率为0.125、0.25、0.375、0.5、0.625、0.625、0.75、0.875、0.875、1、1、1、1、1、1,累计频率差为0.125、0.25、0.375、0.5、0.625、0.625、0.482、0.607、0.732、
0.589、0.714、0.571、0.429、0.286、0.143。四、叙述和分析题:(本⼤题⼩题, 分/每⼩题,共分)1.请简述利⽤SPSS进⾏数据分析的步骤。
SPSS数据的准备—SPSS数据的加⼯整理—SPSS数据的分析—SPSS分析结果的阅读和理解。2.现有SPSS数据如下图:
请完成以下任务:
①画出该SPSS数据的交叉列联表;②请进⾏所做交叉列联表的卡⽅检验;③判断年龄和⾎压之间是否有关系。(1)
(2)假设⾏变量和列变量独⽴,计算卡⽅统计量值为9.352,并得出统计量观测值得概率为0.53,⼤于0.05,因此在原假设的前提下,卡⽅观测值出现时极有可能的,因此假设成⽴。(3)年龄和⾎压之间相互独⽴。3.如下图为四个城市的⼉童⾝⾼调查表:
使⽤⾮参数检验中的多独⽴样本的Kruskal-Wallis检验,检验多个总体的分布是否存在显著性差异。①请完成如下表:
i 统计量K W -的计算公式是112(1)k
i i K W R R N N =-=-+∑)。,
4.下图是4组数据的销售量,请完成以下⼯作:
① 分别计算单因素⽅差分析概念中的SST(观测变量总离差平⽅和)、SSA(组间离差平⽅和)和SSE(组内离差平⽅和);
② 计算MSA(平均组间平⽅和)和MSE(平均组内平⽅和); ③ 写出F 统计量的表达式并计算F 值; 答案:
因篇幅问题不能全部显示,请点此查看更多更全内容