|
【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目六单元测试_1参考答案
试卷总分:100 得分:100
1.箱型图依据实际数据绘制,对数据没有任何限制性要求。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
2.众数具有唯一性。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
3.Pearson相关只有在变量具有线性关系时才是完全相关的。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
4.一个变量相同的取值必须有相同的秩次。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
5.对于定量变量而言,选择 “组宽”是做频率分布分析时最主要的问题。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
6.平均水平指标使用最广泛的是均值和中位数。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
7.不服从正态分布的变量、分类或等级变量之间的关联性可采用Pearson线性相关系数来描述。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
8.判定系数的取值范围为0≤r2≤1。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
9.corr()用来计算数据样本的协方差矩阵。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
10.插值法就是在记录中找到与缺失样本最接近的样本的该属性值插补。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
11.以下哪项不会导致缺失值的产生?( )
A.有些信息被误删了
B.属性值不存在
C.有些信息暂时无法获取,或者获取信息的代价太大
D.有些信息是被遗漏的
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
12.异常值也称为( )。
A.孤立点
B.界点
C.离群点
D.异常点
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
广开搜题
13.在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过( )倍标准差的值。
A.2倍
B.1倍
C.3倍
D.4倍
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
14.对于定性数据,可用( )和条形图直观地显示其分布情况。
A.茎叶图
B.散点图
C.饼图
D.直方图
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
15.对于定量变量而言,选择( )和是做频率分布分析时最主要的问题。
A.“组数”、“组宽”
B.“组数”、“组频率”
C.“组频数”、“组宽”
D.“组频率”、“组频数”
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
16.对比分析是指把两个( )的指标进行比较。
A.规模相当
B.有差异
C.相互联系
D.结构相同
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
17.将同一现象在不同时期的指标数值进行对比,用以说明发展方向和变化速度,如发展速度、增长速度等是( )。
A.强度相对数
B.比例相对数
C.结构相对数
D.动态相对数
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
18.为筹备班级的初中毕业联欢会,班长对全班学生爱吃哪几种水果作了民意调查,决定最终买什么水果,下面的调查数据中最值得关注的是( )
A.中位数
B.加权平均数
C.平均数
D.众数
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
19.小明准备参加校运会的跳远比赛,下面是他近期六次跳远的成绩(单位:米):3.6,3.8,4.2,4.0,3.8,4.0,那么这组数据的( )。
A.众数是3.9米
B.中位数是3.8米
C.极差是0.6米
D.平均数是4.0米
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
20.如果一组数据6,x,2,4的平均数是3,那么x是( )。
A.2
B.3
C.0
D.4
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广东开放大学作业答案
21.众数一般用于( )。
A.顺序变量
B.连续型变量
C.类别变量
D.离散型变量广开搜题
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
22.贡献度分析的原理是( )。
A.平马特莱法则
B.帕累托法则
C.四象限法则
D.ABC法则
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
23.判断两个变量是否具有线性相关关系最直观的方法是( )。
A.计算相关系数
B.直接绘制散点图
C.绘制柱状图
D.绘制散点图矩阵
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
24.Pearson相关系数一般用于分析两个( )之间的关系。
A.连续性变量
B.离散性变量
C.定距变量
D.离散系数
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
25.在Pearson相关系数的计算公式中,0.3
A.显著线性相关
B.低度线性相关
C.极弱线性相关
D.高度线性相关
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
26.不服从正态分布的变量、分类或等级变量之间的关联性可采用( )来描述
A.Distance Correlation相关系数
B.Pearson 相关系数
C.Spearman秩相关系数
D.kendall相关系数
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
27.以下哪个函数是计算数据样本的协方差矩阵?( )。
A.mean()
B.corr()
C.sum()
D.cov()
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
28.rolling_kurt()的功能是( )。
A.计算数据样本的协方差矩阵
B.样本值的偏度(三阶矩)
C.样本值的峰度(四阶矩)
D.计算数据样本的标准差
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
29.rolling_var()的功能是( )。
A.计算数据样本的标准差
B.计算数据样本的方差
C.计算数据样本的算术平均数
D.计算数据样本的协方差矩阵
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
30.plot()的功能是( )。
A.绘制样本数据的箱型图
B.绘制饼图)
C.绘制二维条形直方图
D.绘制线性二维图,折线图
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
,我们的目标是要做全覆盖、全正确的答案搜索服务。
31.某国国内生产总值2009年为2008年的109.01%,这是( )。
A.计划完成相对数
B.比较相对数
C.动态相对数)
D.比例相对数
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
32.在记录中找到与缺失样本最接近的样本的该属性值插补,此方法称为( )
A.最近临插补
B.均值/中位数/众数插补
C.使用固定值
D.插值法
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案广东开放大学作业答案
33.牛顿插值法与拉格朗日插值相比,具有( )的特点。
A.承袭性和多项性
B.易于变动节点和易于实现性
C.承袭性和易于变动节点
D.承袭性和易于实现性
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
34.将含有异常值的记录直接删除,容易造成( )
A.历史数据减少,影响分析结果的客观性和正确性
B.大量隐藏的记录会被删除,可能会改变变量的原有分布,造成分析结果的不准确
C.资源的大量浪费,影响分析结果的客观性和正确性
D.样本量不足,可能会改变变量的原有分布,造成分析结果的不准确
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
35.在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:( ),我们的目标是要做全覆盖、全正确的答案搜索服务。
A.有放回的简单随机抽样
B.分层抽样
C.渐进抽样
D.无放回的简单随机抽样广东开放大学作业答案
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
36.为了消除指标之间的量纲和取值范围差异的影响,需要进行( )。
A.冗余属性识别
B.数据变换
C.实体识别
D.标准化处理
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
37.( )是当前用得最多的数据标准化方法。
A.小数定标规范化
B.最小 - 最大规范化
C.零 C 均值规范化
D.标准差标准化
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
38.小波变换具有( )的特点
A.多分辨率
B.多频道
C.可平移
D.可伸缩
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
39.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:( )
A.0.821
B.0.716
C.1.224
D.1.458
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
40.数据质量分析的主要任务是检查原始数据中是否存在 {图} 。
A.异常值
B.重复值广东开放大学作业答案
C.脏数据
D.无用数据
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
41.脏数据包括()。
A.不一致的值广开搜题
B.异常值
C.缺失值
D.重复数据
E.含有特殊符号(如、¥、*)的数据广东开放大学作业答案
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
42.分布分析能揭示数据的()。
A.分布类型
B.分布状态
C.分布位置
D.分布特征
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
43.平均水平指标是对个体集中趋势的度量,使用最广泛的是( )。
A.变异系数
B.均值
C.中位数
D.极差
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
44.数据的相关性分析可以( )。
A.各绘制散点图矩阵
B.直接绘制散点图
C.绘制柱状图
D.计算相关系数
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
45.pandas 主要统计特征函数有( )。
A.corr()
B.unique()
C.sum()
D.mean()
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
|
上一篇:【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目七单元测试_1参考答案下一篇:【广开搜题】广东开放大学生产与运作管理(专,2024春)形测四_1_1参考答案 (2)
|