|
拿答案客服:11447,66066
更多答案:www.ybaotk.com
《大数据技术(省)》任务1
1.[单选题] 数据约简主要有特征约简、样本约简、( )和数值约简等。
A.维数约简
B.归一化 C.数据变换
D.一致性 答:——A——
2.[单选题] 下列哪项不属于大数据离线处理的特点( )
A.数据具有实时性,不易长时间保存 B.在大量数据上进行复杂的批量运算
C.数据在计算之前已经完全到位,不会发生变化 D.能够方便地查询批量计算的结果。
答:——A——
3.[单选题] 以下关于云计算、大数据和物联网之间的关系,论述错误的是:( ) A.云计算侧重于数据分析
B.云计算、大数据和物联网三者紧密相关,相辅相成 C.物联网可以借助于云计算实现海量数据的存储
D.物联网可以借助于大数据实现海量数据的分析
答:——A——4.[单选题] 数据挖掘是从数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中挖掘出隐含在其中的、人们事先不知的、对决策有用的( )的过程。
A.语义网 B.产生式
C.知识与信息
D.规则
答:————
5.[单选题] 网页数据是( )。
A.网站外部数据 B.日志数据
C.网站内部数据
D.高速缓存数据 答:————
6.[单选题] HDFS的命名空间不包含
)
A.目录
B.文件
C.块
D.字节 答:————
7.[单选题] 以下对HADoop的说法错误的是:( )
A.HADoop的核心是HDFS和MApREDuCE
B.HADoop是基于JAvA语言开发的,只支持JAvA语言编程
C.HADoop2.0增加了NAmENoDE HA和WirE-CompATiBiliTy两个重大特性 D.HADoop MApREDuCE是针对谷歌MApREDuCE的开源实现,通常用于大规模数据集的并行计算
答:————
8.[单选题] 下列关于计算机存储容量单位的说法中,错误的是( )。 A.1KB<1MB<1GB
B.基本单位是字节(ByTE)
C.一个汉字需要一个字节的存储空间 D.一个字节能够容纳一个英文字符
答:————
9.[单选题] 数据预处理过程中,关于最大最小标准化说法正确的是( )
A.变换后变量的取值范围为【-1,1】
B.变换后变量的取值范围为(-1,1)
C.消除了量纲的影响
D.改变了数据的偏度 答:————
10.[单选题] 除了简单随机抽样外,其他抽样方法具有等概率思想的是( )
A.两阶段集群抽样
B.等距抽样 C.集群抽样
D.以上都对
答:————
11.[判断题] 数据集成是指将不同来源、不同格式、不同特点与不同性质的数据在逻辑上或物理上有机地集中,存放在不一致的数据存储(如数据仓库)中。 A.√
B.×
答:————
12.[判断题] 数据规范化可将原来的度量值转换为无量纲的值,通过将属性数据按比例缩放,将一个函数给定属性的整个值域映射到一个新的值域中,即每个旧的值都被一个新的值替代。
A.√
B.× 答:————
13.[判断题] 横向扩展将许多低端的机器组织在一起,形成一个功能专一的分布式系统。
A.√
B.×
答:————
14.[判断题] 大数据的应用之一是,促进健康管理的个性化和多元化。
A.√
B.× 答:————
15.[判断题] 网络数据获取是指通过网络爬虫等方式从网站上获取数据信息的过程,这样可将非结构化数据、半结构化数据从网页中提取出来,并以非结构化的方式将其存储为统一的本地数据文件。
A.√
B.×
答:————
16.[判断题] 计算机科学是算法与算法变换的科学,数据科学是关于数据的科学,数据科学是为研究探索CyBEr空间中数据界的理论、方法和技术。 A.√
B.×
答:————
17.[判断题] 于大数据而言,最基本、最重要的要求就是减少误、保证质量。因此,大数据收集的信息量要尽量精确。
A.√
B.×
答:————18.[判断题] 决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。
A.√
B.× 答:————
19.[判断题] 全量抽取类似于数据迁移或数据复制,它将数据源中的表或视图 的数据全部从数据库中抽取出来,再进行后续的转换和加载操作。 A.√
B.×
答:————
20.[判断题] 一幅图画最伟大的价值莫过于它能够使我们实际看到的内容比期望看到的内容丰富得多。 A.√
B.×
答:————
21.[多选题] 大数据分析就是根据既定目标需求对数据处理结果进行分析,下列哪些是当前常用的数据分析技术( )。 A.统计分析
B.数据挖掘
C.机器学习 D.和可视化分析
答:————
22.[多选题] 下列哪些测量指标可以用作离散变量( )。
A.方差
B.标准差
C.极差
D.中位数 答:————
23.[多选题] 下列关于数据生命周期管理的核心认识中,正确的是( )。
A.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
B.在不同的数据存在阶段,数据的价值是不同的 C.根据数据价值的不同应该对数据采取不同的管理策略
D.数据生命周期管理旨在产生效益的同时,降低生产成本 答:————
24.[多选题] 在大数据抽取中,可以分为初始化转移阶段和增量转移阶段。初始化转移阶段采用( )的方式,增量转移阶段采用( )方式进行有选择的抽取。
A.同构异质数据抽取
B.增量数据抽取 C.同构同质数据抽取
D.全量数据抽取
答:————25.[多选题] 网络爬虫流程主要包括( )、( )和( )三部分。
A.存储数据 B.寻找网址
C.解析网页
D.获取网页
答:————26.[多选题] 大数据的来源包括()。
A.互联网数据 B.实时数据
C.探测数据
D.传感器数据
答:————
更多答案:www.ybaotk.com
拿答案客服:11447,66066 |
上一篇:浙江广播电视大学21秋《园林树木(省)》任务1参考非答案下一篇:浙江广播电视大学21秋《大数据技术(省)》任务3答案非答案
|