《大数据--概念、方法与应用》第二套作业(第二单元)答卷
《大数据--概念、方法与应用》第二套作业(第二单元)答卷
《大数据--概念、方法与应用》第二套作业(第二单元)
试卷总分:100 得分:100
一、单项选择题 (共 10 道试题,共 50 分)
1. 导入与预处理过程的特点和挑战是( )。
A. 数据量大,导致企业不堪重负
B. 成本增长速度快
C. 隐私安全
D. 以上选项都不正确
答案:
2.( )是一些管理方面的最佳实践。
A. 数据挖掘
B. 可视化分析
C. 数据质量和管理
D. 预测性分析
答案:
3.回归分析方法反映的是将事务数据库中属性值在( )的特征。
A. 地点上
B. 空间上
C. 时间上
D. 以上都不是
答案:
4.K-Means算法不适合处理( )属性。
A. 连续型
B. 离散型
C. 稳定型
D. 随机型
答案:
5.在企业危机管理及其预警中,管理者更感兴趣的是( )。
A. 关联规则
B. 意外规则
C. 依赖规则
D. 相关规则
答案:
6.聚类分析目的是使得属于同一类别的数据间的相似性尽可能( )。
A. 小
B. 大
C. 相同
D. 随机
答案:
7.两个或多个变量的( )之间存在某种规律性,就称为关联。
A. 范围
B. 特点
C. 取值
D. 字段
答案:
8.数据挖掘在大型数据库中寻找预测信息是( )。
A. 自动的
B. 被动的
C. 随机的
D. 单一的
答案:
9.偏差检测的基本方法是寻找( )之间有意义的差别。
A. 期望值与参照值
B. 观测值与参照值
C. 预测值与参照值
D. 期望值与预测值
答案:
,我们的目标是要做全覆盖、全正确的答案搜索服务。
10.可视化是给人看的,( )是给机器看的。
A. 数据质量和管理
B. 数据挖掘
C. 预测性分析
D. 语音引擎
答案:
二、多项选择题 (共 5 道试题,共 25 分)
1. 下列选项中,属于大数据分析的基本方面的包括( )。
A. 预测性分析能力
B. 数据质量和管理
C. 可视化分析
D. 语义引擎
答案:
2.下列选项中属于偏差分析的包括( )。
A. 分类中的反常实例
B. 模式的例外
C. 对期望的偏差
D. 结果的异常
答案:
3.下列选项中,属于传统的聚类分析手段的有( )。
A. 划分法
B. 层次方法
C. 基于密度方法
D. 基于网络方法
答案:
4.回归分析主要研究问题包括( )。
A. 数据序列的趋势特征
B. 数据序列的预测
C. 数据序列的统计
D. 数据间的相关关系
答案:
5.概念描述分析( )。
A. 特征性描述
B. 区别性描述
C. 共同性描述
D. 关联性描述
答案:
三、判断题 (共 5 道试题,共 25 分)
1. 数据挖掘支持特定的发现问题,要求发现放之四海皆准的知识。( )
答案:
2. 用户在导入时是不可以进行一些简单的清洗和预处理工作的。( )
答案:
3. 结构化数据的多样性带来了数据分析的新挑战。( )
答案:
4. 概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。( )
答案:
5. 对于大数据分析需求,一些实时性需求会用到MySQL的Infobright。( )
答案: |