|
【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目九单元测试_1参考答案
试卷总分:100 得分:100
1.线性回归包括一元非线性回归、多元非线性回归和分段回归( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
2.沃尔玛超市中“啤酒和尿不湿”的营销案例是关联规则运用的经典案例( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
3.支持向量机的优点是容易过拟合( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
4.支持度和关联度是衡量关联规则强度的两个重要指标( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
5.从广义角度来说,数据分析和数据挖掘包含的范畴是一致的。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
6.从狭义角度来说,相对于数据挖掘,数据挖掘的结果是模型或规则。
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
7.神经网络的建模过程类似一棵树的成长过程,即从根部开始,到树干,到分枝,再到细枝末节的分叉,最终生长出一片片的树叶。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
8.决策树技术对数据的分布甚至缺失非常宽容,不容易受到极值的影响。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
9.相对于数据分析来说,数据挖掘更加侧重于将数据和业务紧密结合,实现功效的最大化。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
10.相对于数据挖掘来说,数据分析呈现的结果更多偏向于模型或规则的输出。( )
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
11.相对于数据挖掘来说,数据分析呈现的结果更多偏向于:( )
A.通过模型或规则可对未知标签的数据进行预测判别用户是否响应某种营销活动
B.统计描述结果的呈现
C.模型或规则的输出
D.通过模型或规则实现智能的商业决策,划分产品所属的群类
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
12.数据挖掘流程的操作步骤中,不包括以下哪种?( )
A.构建模型
B.模型评估
C.绘制表格
D.应用部署
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
13.不属于数据分析与数据挖掘工具的有:( )
A.SPSS
B.SQL
C.R语言
D.Python
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
14.构建模型前的数据准备时间在整个数据挖掘流程中的时间占比是多少?( )
A.0.5广开搜题
B.0.2
C.0.6
D.0.8
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
15.Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( )
A.1989年
B.1996年
C.1991年
D.1993年
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
16.下列常用的数据分析与挖掘工具中,不属于开源工具的是?( )
A.Python
B.SPSS
C.Weka
D.R语言
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
17.下列不是对决策树CHAID算法的描述的选项是?( )
A.SQL)
B.CHAID
C.CART
D.ID3
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
18.下列不是对决策树CHAID算法的描述的选项是?( )
A.应用的前提是因变量为类别型变量(Category)
B.利用卡方检验来选择对因变量最有影响的自变量
C.依据局部最优原则
D.检验标准是基尼系数(Gini)等不纯度的指标广东开放大学作业答案
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
19.下列对决策树ID3算法的描述不正确的选项是?( )
A.利用卡方检验来选择对因变量最有影响的自变量
B.基于信息熵来选择最佳测试属性
C.样本集的划分依据测试属性的取值进行
D.根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
20.关于神经网络,描述错误的选项是?( )
A.知识和结果的不可解释性
B.大规模串行结构和信息的串行处理
C.主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习
D.“神经网络是通过输入多个非线性模型以及不同模型之间的加权互联
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
21.下列描述中,不属于神经网络的特点的是?( )
A.完美的知识和结果的解释性
B.良好的自适应性、自组织性和高容错性
C.大规模并行结构和信息的并行处理
D.较强的学习、记忆和识别功能
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
22.不属于Python语言代码特点的是:( )
A.简洁性
B.不可移植性
C.易维护性
D.易读性
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
23.通常情况下,神经网络不会应用在下列哪个领域?( )
A.信号处理
B.预测系统
C.模式识别
D.统计分析
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
24.在回归分析中,下列哪个选项不属于线性回归( )
A.多元线性回归
B.分段回归
C.多个因变量与多个自变量的回归
D.一元线性回归
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
25.在回归分析中,不属于参数估计方法改进方向的选项是?( )
A.非线性回归
B.主成分回归
C.岭回归
D.偏最小二乘回归
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
26.下列对数据挖掘的描述不正确的选项是?( )
A.关联规则经过划分后,每个群组内部各对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。
B.神经网络(Neural Network)是通过数学算法来模仿人脑思维的抽象计算模型,它是数据挖掘中机器学习的典型代表。
C.贝叶斯分类方法(Bayesian Classifier)是非常成熟的统计学分类方法,它主要用来预测类成员间关系的可能性。
D.回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具.
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
27.沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( )
A.神经网络
B.决策树
C.聚类分析
D.关联规则
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
28.下列关于聚类分析不正确的说法是:( )
A.运用层次的方法, 依次让最相似的数据对象两两合并,这样不断地合并,最后就形成了一棵聚类树
B.数据处理阶段用作数据探索的工具,通过聚类发现数据间的深层次的关系等广开搜题
C.按照相似性和相异性进行划分后,每个群组内部各对象间的相似度会很高,而不同群组对象之间的相异度很低
D.直接作为模型对观察对象进行群体划分
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
29.下列关于贝叶斯定理描述错误的是:( )
A.一种非常成熟的统计学分类方法
B.主要用来确定群组内部和群租间的相似度和相异度
C.主要用于分类问题的归类等
D.朴素贝叶斯分类方法可以跟决策树和神经网络算法相媲美。
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
30.关于支持向量机,下列说法正确的选项是?( )
A.对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合
B.知识和结果的不可解释性
C.通过输入多个非线性模型以及不同模型之间的加权互联
D.大规模串行结构和信息的串行处理
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
31.下列选项中,不是对支持向量机的描述的是?( )
A.基于小概率事件原理
B.在线性的情况下,就在原空间寻找两类样本的最优分类超平面
C.以结构风险最小为原则
D.训练数据较大
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
32.下列选项中,不是对支持向量机的描述的是?( )
A.以结构风险最小为原则
B.在线性的情况下,就在原空间寻找两类样本的最优分类超平面
C.训练数据较小
D.对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
33.对于假设检验,下列说法正确的是:( )
A.主要用于分类问题的归类等,我们的目标是要做全覆盖、全正确的答案搜索服务。
B.基于小概率事件原理
C.知识和结果的不可解释性
D.以结构风险最小为原则
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
34.如果我们要给餐饮业做数据分析和挖掘,那么在整个实际流程中,下列哪个步骤是耗时最长的?( )
A.模型构建与评估
B.明确数据挖掘目标
C.应用部署
D.数据收集与清洗
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
35.从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述?( )
A.数据挖掘是技术性的“采矿”过程,发现未知的模式和规律
B.数据挖掘侧重于实际的业务知识
C.数据挖掘更重视模型或规则的构建
D.数据挖掘需要有过硬的数学功底和编程技术
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
36.从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项是对狭义层面下数据分析的描述?( )
A.数据分析是技术性的“采矿”过程,发现未知的模式和规律
B.数据分析需要有过硬的数学功底和编程技术
C.数据分析更重视模型或规则的构建
D.数据分析更重视结合业务知识解读统计结果
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
37.有一天,老师问了个问题,只根据头发和声音怎么判断一位同学的性别。为了解决这个问题,同学们马上简单的统计了7位同学的相关特征数据。那么请问,要解决老师的问题,采用哪种数据挖掘方法最合适?( )
A.聚类分析
B.决策树
C.神经网络
D.假设检验
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
38.下列常用的数据分析与挖掘工具中,属于商业软件的是?( )
A.SPSS
B.R语言
C.Weka
D.Python
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
39.2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( )
A.决策树
B.支持向量机
C.神经网络
D.假设检验
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
40.2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( )
A.回归分析
B.决策树
C.假设检验
D.神经网络
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
41.下列选项中,属于数据挖掘的成熟技术的是:( )
A.神经网络
B.聚类方法
C.决策树
D.支持向量机
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
42.相对于数据分析来说,数据挖掘需要掌握的技能有:( )
A.基本的统计学知识
B.常用可视化图表展现的能力
C.良好的数学功底
D.优秀的编程能力
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
43.属于数据分析与数据挖掘工具的有:( )
A.R语言
B.Python
C.SQL
D.Weka
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
44.下列属于数据挖掘技术的有:( )广东开放大学作业答案
A.关联规则
B.决策树
C.回归分析
D.神经网络
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
45.下面选项中,属于列表的方法的是( )。
A.假设检验
B.Weka
C.PowerBI
D.贝叶斯定理
答案:更多参考答案,请关注【广开搜题】微信公众号,发送题目获取答案
|
上一篇:【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目三单元测试_1参考答案下一篇:【广开搜题】广东开放大学数据分析与挖掘(本,2024春)项目二单元测试_1参考答案
|