【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包02期末考试押题试卷与答案

[复制链接]
查看: 20|回复: 0

19万

主题

19万

帖子

59万

积分

论坛元老

Rank: 8Rank: 8

积分
594010
发表于 2024-4-22 00:37:54 | 显示全部楼层 |阅读模式
23春大数据技术导论试卷包-02
关注公众号【】,回复【试】获取试题答案


一 、判断题
1. MapReduce模型中,Map针对每一个输入元素都要生成一个输出元素,Reduce针对每一个输入列表都要生成一个输出元素。()
A. √
B. ×
答案:A
- 关注公众号【】,对话框内发送试题,获得答案。
2. 特征约简是在保留、提高原有判别能力的前提下,从原有的特征中删除不重要或不相关的特征,或者通过对特征进行重组来减少特征的个数,同时减少特征向量的维度。()
A. √
B. ×
答案:A
- 关注公众号【】,对话框内发送试题,获得答案。
3. 数据约简是指在对挖掘任务和数据本身内容理解的基础之上,寻找依赖于发现目标特征的有用数据,以缩减数据规模,从而在尽可能保持数据原貌的前提下,最大限度地精简数据量。()国开一网一平台
A. √
B. ×
答案:A
- 关注公众号【】,对话框内发送试题,获得答案。
4. Cyber空间是指以计算机技术、现代通信网络技术、虚拟现实技术等信息技术的综合运用为基础,以知识和信息为内容的新型空间。()
A. √
B. ×
答案:A
- 关注公众号【】,对话框内发送试题,获得答案。
5. 流式数据的处理是批量处理。()
A. √国开一网一平台
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
6. 文本数据是典型的结构化数据类型。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
7. 多维数据分析的目标是探索多维数据项的分布规律和模式,并揭示不同维度属性之间的隐含关系。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
8. 图像信息获取的方法只有扫描技术。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
9. 大数据的获取要避免重复数据。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
10. 从分析的结果上来看,大数据分析主要分为探索性数据分析、证实性数据分析、定性数据分析;从分析的方式上来看,大数据分析主要分为离线数据分析、在线数据分析和交互式分析。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
11. 数据转换可将原始数据转换成适合数据分析的形式,如果数据转换处理不当,将严重扭曲数据本身的内涵,改变数据原本的形态。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
12. 数据清洗是数据预处理的重要部分,其主要工作是检查数据的完整性及数据的一致性, 对其中的噪声数据进行平滑,对丢失的数据进行填补,以及对重复的数据进行消除等。()
A. √
B. ×
答案:关注公众号【】,对话框内发送试题,获得答案。
二 、单选题
1. 下列不属于文本相似度计算流程的是()?
A. 文本排序
B. 文本分词
C. 统计词频
D. 写出词频向量,我们的目标是要做全覆盖、全正确的答案搜索服务。
答案:关注公众号【】,对话框内发送试题,获得答案。
2. 数据清洗算法的衡量标准主要包含 ( )、错误返回率和精确度。
A. 冗余度
B. 返回率
C. 可用性
D. 一致性
答案:关注公众号【】,对话框内发送试题,获得答案。
3. 下列不属于指数平滑法的适用范围的是()?
A. 稳定变化态势的时间序列数据
B. 不稳定变化的时间序列数据
C. 规则变化的时间序列数据
D. 直线上升或下降趋势的时间序列数据
答案:关注公众号【】,对话框内发送试题,获得答案。
4. Z分数规范化方法中,下列可以替换标准差的是()?
A. 均值
B. 方差
C. 极差
D. 平均值绝对偏差
答案:关注公众号【】,对话框内发送试题,获得答案。
5. 下列不属于地图的构成要素的是()?
A. 图形要素
B. 价格要素
C. 数学要素
D. 辅助要素
答案:关注公众号【】,对话框内发送试题,获得答案。
6. 基于任务的定义和分类,下列不属于可视分析关注点的是()?
A. 以用户价值为关注点
B. 以用户意图为关注点
C. 以同户行为为关注点
D. 以软件操作为关注点
答案:关注公众号【】,对话框内发送试题,获得答案。
7. 下面不属于互联网大数据的是()?
A. 视频
B. 图片
C. 音频
D. 心情
答案:关注公众号【】,对话框内发送试题,获得答案。
8. 下面不是研究数据方法的是()?
A. 统计学
B. 机器学习
C. 心理分析
D. 数据挖掘
答案:关注公众号【】,对话框内发送试题,获得答案。
9. 下列不属于单词计数的Map过程的是()?
A. 按列分割文件
B. 分词处理
C. 按行分割文件
D. 排序与合并
答案:关注公众号【】,对话框内发送试题,获得答案。
10. Hadoop作业服务器不负责()?
A. 接受用户提交的作业,我们的目标是要做全覆盖、全正确的答案搜索服务。
B. 任务的分配
C. 执行具体的任务
D. 管理所有的任务服务器
答案:关注公众号【】,对话框内发送试题,获得答案。
11. 下列不属于无参数值约简技术的是()?
A. 直方图
B. 聚类
C. 选择
D. 线性回归模型
答案:关注公众号【】,对话框内发送试题,获得答案。
12. 下列不属于数据约简的特点()?
A. 计算量巨大
B. 成本降低
C. 较少存储量
D. 方便分类
答案:关注公众号【】,对话框内发送试题,获得答案。
13. 下列不属于NoSQL数据库的键值式存储的常见形式的是()?
A. 临时型
B. 附加型
C. 混合型
D. 永久型
答案:关注公众号【】,对话框内发送试题,获得答案。
14. 下列不属于通用网络爬虫的结构的是()?
A. 页面爬行模块
B. 页面分析模块
C. 页面数据库
D. 页面修改模块
答案:关注公众号【】,对话框内发送试题,获得答案。国开一网一平台
15. 下列不属于判别方法的是()?
A. 最大似然法
B. 最小二乘法
C. 距离判别法
D. 贝叶斯判别法
答案:关注公众号【】,对话框内发送试题,获得答案。
16. 下列不属于相关系数的是()?
A. 简单相关系数
B. 复相关系数
C. 典型相关系数
D. 常态相关系数
答案:关注公众号【】,对话框内发送试题,获得答案。
三 、问答题
1. 什么是数值约简?数值约简技术可以分为哪两类?
答案:关注公众号【】,对话框内发送试题,获得答案。
2. 根据信息的特征,可以将信息可视化划分为哪些类别?
答案:关注公众号【】,对话框内发送试题,获得答案。
3. 数据分析与数据挖掘的主要区别是?
答案:关注公众号【】,对话框内发送试题,获得答案。
4. 移动平均法的定义是?
答案:关注公众号【】,对话框内发送试题,获得答案。
5. 数据科学的定义?
答案:关注公众号【】,对话框内发送试题,获得答案。
6. 大数据获取的定义?
答案:关注公众号【】,对话框内发送试题,获得答案。
7. 请简述MapReduce的基本原理。
答案:关注公众号【】,对话框内发送试题,获得答案。
关注公众号【】,回复【试题】获取试题答案





上一篇:【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包04期末考试押题试卷与答案
下一篇:【国开搜题】国家开放大学 一网一平台24春大数据技术导论试卷包01期末考试押题试卷与答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图