国开电大大数据概论(专)作业答案

[复制链接]
查看: 40|回复: 0

6万

主题

9万

帖子

20万

积分

论坛元老

Rank: 8Rank: 8

积分
202732
发表于 2025-4-11 17:44:47 | 显示全部楼层 |阅读模式
大数据概论(专)
学校: 无
问题 1: 1. 关于聚类挖掘,表述错误的是:
选项:

A. 聚类结果的好坏取决于相似性的度量方法以及具体实现

B. 好聚类的方法的标准是要产生高质量的聚类结果

C. 聚类结果的好坏与能否发现隐含模式无关

D. 好的聚类结果应该有高类内相似性和低类间相似性这样的特征
答案: 聚类结果的好坏与能否发现隐含模式无关
问题 2: 2. 什么是存储在计算机内有结构的数据的集合?
选项:

A. 数据库管理系统

B. 数据库系统

C. 数据库结构

D. 数据库
答案: 数据库
问题 3: 3. 哪个不属于知识发现的步骤
选项:

A. 数据选择

B. 数据集成

C. 数据清理

D. 数据开发
答案: 数据开发
问题 4: 4. 不属于社交网络特点的是
选项:

A. 海量用户

B. 实时数据

C. 数据单一

D. 完整数据
答案: 数据单一
问题 5: 5. 单舆情的系统架构正确的是
选项:

A. 规划-存储-分析-采集-报告-管控

B. 规划-采集-分析-存储-报告-管控

C. 规划-存储-采集-分析-报告-管控

D. 规划-采集-存储-分析-报告-管控
答案: 规划-采集-存储-分析-报告-管控
问题 6: 6. 以下不属于网络舆情的主要来源的是
选项:

A. QQ

B. 论坛与BBS

C. 书信

D.
答案: 书信
问题 7: 7. 大数据可能带来(),但未必能够带来()
选项:

A. 多样性;准确度

B. 精确度;多样性

C. 准确度;精确度

D. 精确度;准确度
答案: 请关注ybaotk.com搜题查看答案
问题 8: 8. 数据清洗的方法不包括( )。
选项:

A. 缺失值处理

B. 重复数据记录处理

C. 噪声数据清除

D. 一致性检查
答案: 请关注ybaotk.com搜题查看答案
问题 9: 9. 计量单位从低到高,下面的说法正确的是( )
选项:

A. KB< MB< GB< TB

B. EB< KB< MB< TB

C. GB< KB< MB< TB

D. EB< MB< GB< TB
答案: 请关注ybaotk.com搜题查看答案
问题 10: 10. 智能健康手环的应用开发,体现了( )的数据采集技术的应用
选项:

A. 传感器

B. API接口

C. 网络爬虫

D. 统计报表
答案: 请关注ybaotk.com搜题查看答案
问题 11: 11. 属于高质量聚类分析的要求:①可扩展性 ②处理相同类型数据的能力 ③发现任意形状的能力 ④领域知识参数输入的最大化 ⑤处理噪声数据的能力 ⑥数据输入顺序敏感
选项:

A. ①②③④⑤⑥

B. ①③⑥

C. ①③⑤

D. ②④⑥
答案: 请关注ybaotk.com搜题查看答案
问题 12: 12. 社群结构聚合探测算法的步骤中,()条件满足时,算法会停止并输出探测结果。
选项:

A. maxφpq≤0

B. 0

C. maxφpq

D. maxφpq≥0

E. maxφpq<0
答案: 请关注ybaotk.com搜题查看答案
问题 13: 13. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 14: 14. 网球比赛,与其他体育项目一样,涉及大量数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 15: 15. 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 16: 16. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
选项:

A. 自行开发数据产品

B. 投资入股互联网电商行业

C. 提高分析挖掘能力

D. 打通多源跨域数据

E. 实现科学决策与运营
答案: 请关注ybaotk.com搜题查看答案
问题 17: 17. 中国电信把自己的大数据开发分为:
选项:

A. 媒体类应用

B. 广告类应用

C. 服务类应用

D. 商品类应用
答案: 请关注ybaotk.com搜题查看答案
问题 18: 18. 根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 19: 19. 宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 20: 20. 大数据的数据类型包括网络日志、音频、视频、图片、地理位置信息等等。 ()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 21: 21. 大数据的起始计量单位至少是 MB。()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 22: 22. 在没有大数据的条件下,人才的发现与选拔都很难做到全信息”,大数据能够帮助人们解决这个问题。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 23: 23. 大数据的应用之一是,促进健康管理的个性化和多元化。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 24: 24. 由于历史的原因,我国医院的信息化建设层次不齐、水平不一。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 25: 25. 以下说法错误的是
选项:

A. 关联规则在使用时的两个指标是支持度和置信度

B. FP-树频集算法是针对Apriori算法缺点进行改进后的算法

C. APRIORI算法最大的缺点是复杂度太高

D. FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的
答案: 请关注ybaotk.com搜题查看答案
问题 26: 26. 关联规则的基本概念中错误的是
选项:

A. 置信度是项集出现次数除以总的交易次数

B. 项集频率指的是项集所有交易中出现的次数

C. K项集指的是K个项的集合

D. 相对支持度指的是项集出现次数除以总的交易次数
答案: 请关注ybaotk.com搜题查看答案
问题 27: 27. K均值算法的缺点():①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:

A. ①③

B. ①②③④⑤

C. ①③⑤

D. ②④
答案: 请关注ybaotk.com搜题查看答案
问题 28: 28. 什么是大数据使用的最可靠方法?
选项:

A. 大数据与样本数据结合

B. 样本数据源

C. 大数据源

D. 规模大
答案: 请关注ybaotk.com搜题查看答案
问题 29: 29. 下列关于数据重组的说法中,错误的是( )。
选项:

A. 数据重组是数据的重新生产和重新采集

B. 数据重组实现的关键在于多源数据融合和数据集成

C. 数据重组能够使数据焕发新的光芒

D. 数据重组有利于实现新颖的数据模式创新
答案: 请关注ybaotk.com搜题查看答案
问题 30: 30. 大数据的最显著特征是( )。
选项:

A. 数据类型多样

B. 数据价值密度高

C. 数据处理速度快

D. 数据规模大
答案: 请关注ybaotk.com搜题查看答案
问题 31: 31. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:

A. 在数据规模上强调相对数据而不是绝对数据

B. 在分析效果上更追究效率而不是绝对精确

C. 在数据基础上倾向于全体数据而不是抽样数据

D. 在分析方法上更注重相关分析而不是因果分析
答案: 请关注ybaotk.com搜题查看答案
问题 32: 32. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高
答案: 请关注ybaotk.com搜题查看答案
问题 33: 33. 单选 Hive的数据计算使用
选项:

A. HBASE

B. HDFS

C. PIG

D. MapReduce
答案: 请关注ybaotk.com搜题查看答案
问题 34: 34. 单选 Hadoop生态系统中,最核心的设计是()
选项:

A. HDFS和MAPREDUCE

B. HIVE和HDFS

C. HBASE和STORM

D. TEZ和PIG
答案: 请关注ybaotk.com搜题查看答案
问题 35: 35. 单选 Web挖掘中内容挖掘的基本技术是()
选项:

A. 图片挖掘

B. 文本挖掘

C. 数据挖掘

D. 技术挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 36: 36. 布尔权重是指如果某个词条在一篇文本中出现,则将其权值定义为(),否则定义为()
选项:

A. 2,0

B. 0,2

C. 1,0

D. 0,1
答案: 请关注ybaotk.com搜题查看答案
问题 37: 37. 以下哪个不是推荐系统的评测指标
选项:

A. 新颖性

B. 统一性

C. 惊喜度

D. 覆盖率
答案: 请关注ybaotk.com搜题查看答案
问题 38: 38. 分类变量使用( )建立预测模型。
选项:

A. 离散树

B. 决策树

C. 分类树

D. 回归树
答案: 请关注ybaotk.com搜题查看答案
问题 39: 39. 对线下零售而言,做好大数据分析应用的前提是( )
选项:

A. 扩大营业面积

B. 增加数据来源

C. 增加统计种类

D. 开展优惠促销
答案: 请关注ybaotk.com搜题查看答案
问题 40: 40. 万维网的实施国家是( )
选项:

A. 德国

B. 英国

C. 印度

D. 美国
答案: 请关注ybaotk.com搜题查看答案
问题 41: 41. 一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( )
选项:

A. 实验思维

B. 相关思维

C. 定量思维

D. 因果思维
答案: 请关注ybaotk.com搜题查看答案
问题 42: 42. 下列关于网络用户行为的说法中,错误的是( )。
选项:

A. 用户的隐私安全很难得以规范保护

B. 数字轨迹用完即自动删除

C. 网络公司能够捕捉到用户在其网站上的所有行为

D. 用户离散的交互痕迹能够为企业提升服务质量提供参考
答案: 请关注ybaotk.com搜题查看答案
问题 43: 43. 以下说法正确的是
选项:

A. Spark只能基于HDFS这样分布式文件存储系统

B. Spark可以基于HDFS这样分布式文件存储系统也可以基于Tachyon这样基于内存分布式文件存储系统

C. Spark只能基于Tachyon这样基于内存分布式文件存储系统

D. Spark既无法基于HDFS这样分布式文件存储系统也无法基于Tachyon这样基于内存分布式文件存储系统
答案: 请关注ybaotk.com搜题查看答案
问题 44: 44. 能同时进行交互式计算,批处理,流式计算的计算框架为
选项:

A. Storm

B. Impala

C. Spark

D. Shark
答案: 请关注ybaotk.com搜题查看答案
问题 45: 45. Storm属于()计算
选项:

A. 流式

B. 批处理

C. 交互式

D. 云
答案: 请关注ybaotk.com搜题查看答案
问题 46: 46. Spark生态图中,()提供了图存储结构和常见的图算法
选项:

A. GraphxGraphParallel

B. Tachyon

C. SharkSQL

D. SparkStreaming
答案: 请关注ybaotk.com搜题查看答案
问题 47: 47. 中国互联网购物者占互联网使用者的比例为:
选项:

A. 0.56

B. 0.55

C. 0.57

D. 0.5
答案: 请关注ybaotk.com搜题查看答案
问题 48: 48. RDD中进行map,filter,groupBy等操作属于()
选项:

A. Acter

B. Change

C. Active

D. Transformation
答案: 请关注ybaotk.com搜题查看答案
问题 49: 49. 大数据时代,数据使用的关键是( )。
选项:

A. 数据存储

B. 数据收集

C. 数据分析

D. 数据再利用
答案: 请关注ybaotk.com搜题查看答案
问题 50: 50. 下列关于数据交易市场的说法中,错误的是( )。
选项:

A. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

B. 数据交易市场是大数据产业发展到一定程度的产物

C. 商业化的数据交易活动催生了多方参与的第三方数据交易市场

D. 数据交易市场是大数据资源化的必然产物
答案: 请关注ybaotk.com搜题查看答案
问题 51: 51. 数据仓库的最终目的是( )。
选项:

A. 建立数据仓库逻辑模型

B. 收集业务需求

C. 为用户和业务部门提供决策支持

D. 开发数据仓库的应用分析
答案: 请关注ybaotk.com搜题查看答案
问题 52: 52. K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:

A. ①③⑤

B. ①②③④⑤

C. ②④

D. ①③
答案: 请关注ybaotk.com搜题查看答案
问题 53: 53. 关于内容深度理解建立索引说法正确的是
选项:

A. 客观索引与文档内容有关

B. 内容索引与客观因素有很大关系

C. 内容索引又可以分为单索引和双索引

D. 索引分为客观索引和主观索引
答案: 请关注ybaotk.com搜题查看答案
问题 54: 54. 中国的网络消费者比线下消费者更( )。
选项:

A. 年轻和富裕

B. 年老和贫困

C. 年轻和贫困

D. 年老和富裕
答案: 请关注ybaotk.com搜题查看答案
问题 55: 55. 大数据获取的个人信息比传统调研获得的个人信息真实性( )。
选项:

A. 更低

B. 相同

C. 不确定

D. 更高
答案: 请关注ybaotk.com搜题查看答案
问题 56: 56. DMP分为( )和( )。
选项:

A. 单一式DMP;多元式DMP

B. 开放式DMP;私有式DMP

C. 单一式DMP;封闭式DMP

D. 开放式DMP;封闭式DMP
答案: 请关注ybaotk.com搜题查看答案
问题 57: 57. 阿里巴巴旗下的数据管理平台,被称为:
选项:

A. 蚂蚁花呗

B. 达摩盘

C. 招财宝

D. 支付宝
答案: 请关注ybaotk.com搜题查看答案
问题 58: 58. 万维网之父是( )。
选项:

A. 蒂姆•伯纳斯-李

B. 舍恩伯格

C. 彼得•德鲁克

D. 斯科特•布朗
答案: 请关注ybaotk.com搜题查看答案
问题 59: 59. Mac OS系统的开发者是()。
选项:

A. 苹果公司

B. 微软公司

C. 惠普公司

D. IBM公司
答案: 请关注ybaotk.com搜题查看答案
问题 60: 60. 下列论据中,能够支撑大数据无所不能”的观点的是( )。
选项:

A. 个人隐私泄露与信息安全担忧

B. 大数据具有非常高的成本

C. 互联网金融打破了传统的观念和行为

D. 大数据存在泡沫
答案: 请关注ybaotk.com搜题查看答案
问题 61: 61. Spark生态图中,()提供了一个机器学习的算法库
选项:

A. GraphxGraphParallel

B. Tachyon

C. MLBaseMachineLearning

D. SharkSQL
答案: 请关注ybaotk.com搜题查看答案
问题 62: 62. ()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库
选项:

A. MaHout

B. YARN

C. MAPREDUCE

D. STORM
答案: 请关注ybaotk.com搜题查看答案
问题 63: 63. 特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()
选项:

A. 越大,越大

B. 越小,越小

C. 越大,越小

D. 越小,越大
答案: 请关注ybaotk.com搜题查看答案
问题 64: 64. RDD中进行count,collect,save等操作属于()
选项:

A. Active

B. Transformation

C. Change

D. Acter
答案: 请关注ybaotk.com搜题查看答案
问题 65: 65. 根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性
选项:

A. 页面的重要性无法传递

B. 被多次引用的页面

C. 被非重要的页面引用的页面

D. 没有被多次引用的页面
答案: 请关注ybaotk.com搜题查看答案
问题 66: 66. Web应用挖掘中最有效而且简单的分析方法是
选项:

A. 点击流分析

B. 内容分析

C. 结构分析

D. 数据挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 67: 67. Hadoop生态系统中,集群的资源管理系统是()
选项:

A. MAPREDUCE

B. YARN

C. STORM

D. HDFS
答案: 请关注ybaotk.com搜题查看答案
问题 68: 68. Hadoop提供的MapReduce的编程方式中,()是最原始的方式
选项:

A. HadoopStreaming

B. Java

C. PHP

D. HadoopPipes
答案: 请关注ybaotk.com搜题查看答案
问题 69: 69. 大数据的起源是( )
选项:

A. 金融

B. 电信

C. 公共管理

D. 互联网
答案: 请关注ybaotk.com搜题查看答案
问题 70: 70. 智慧城市的智慧之源是( )
选项:

A. 物联网

B. 云计算

C. 大数据

D. 数字城市
答案: 请关注ybaotk.com搜题查看答案
问题 71: 71. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系
选项:

A. 相关因果

B. 因果相关

C. 因果并列

D. 并列相关
答案: 请关注ybaotk.com搜题查看答案
问题 72: 72. 传统大数据质量清洗的特点有:
选项:

A. 协调式的

B. 确定性

C. 强类型性

D. 非确定性
答案: 请关注ybaotk.com搜题查看答案
问题 73: 73. 以下选项中属于数据的作用的是( )。
选项:

A. 欣赏

B. 建立信心

C. 验证假设

D. 沟通
答案: 请关注ybaotk.com搜题查看答案
问题 74: 74. 慈铭体检机构的 O2O健康管理产品,由( )组成。
选项:

A. 智能运动手腕

B. 手机APP

C. 健康管理云平台

D. 保健品
答案: 请关注ybaotk.com搜题查看答案
问题 75: 75. 当前大数据技术的基础包括( )
选项:

A. 关系型数据库

B. 分布式数据库

C. 分布式文件系统

D. 分布式并行计算
答案: 请关注ybaotk.com搜题查看答案
问题 76: 76. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )
选项:

A. 提供高性能并行计算技术的强力支撑

B. 能够静态演化事物的变化及变化的规律

C. 能够直观反映成对数据之间的空间关系

D. 能够直观反映多维数据之间的空间关系

E. 能够动态演化事物的变化及变化的规律
答案: 请关注ybaotk.com搜题查看答案
问题 77: 77. 下列关于计算机存储容量单位换算关系的公式中,正确的是( )
选项:

A. 1GB=1024KB

B. 1KB=1024Byte

C. 1KB=1012Byte

D. 1GB=1012KB

E. 1GB=1024MB
答案: 请关注ybaotk.com搜题查看答案
问题 78: 78. 避免数据孤岛”的方法包括:
选项:

A. 数据融合

B. 数据输入

C. 利用样本框

D. 关键匹配变量
答案: 请关注ybaotk.com搜题查看答案
问题 79: 79. 以下属于机器学习的是:
选项:

A. 监督式学习

B. 半监督式学习

C. 非监督式学习

D. 强化学习
答案: 请关注ybaotk.com搜题查看答案
问题 80: 80. 机器学习的四大类分析技术的主要算法包括()
选项:

A. 描述性统计

B. 聚类分析

C. 分类与预测

D. 关联分析
答案: 请关注ybaotk.com搜题查看答案
问题 81: 81. 大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?
选项:

A. 变化很快

B. 数据很大

C. 构成复杂

D. 蕴含大价值
答案: 请关注ybaotk.com搜题查看答案
问题 82: 82. 用户建模模块的功能是
选项:

A. 存储或者修改用户的兴趣偏好

B. 获取、表示用户的兴趣偏好

C. 帮助用户找到需要的东西

D. 对用户进行识别和分类
答案: 请关注ybaotk.com搜题查看答案
问题 83: 83. 下列关于脏数据的说法中,正确的是( )。
选项:

A. 编码不统一

B. 意义不明确

C. 格式不规范

D. 数据不完整

E. 与实际业务关系不大
答案: 请关注ybaotk.com搜题查看答案
问题 84: 84. 2012年中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。
选项:

A. 文化交流

B. 质量安全控制

C. 农业生产经营

D. 市场流通
答案: 请关注ybaotk.com搜题查看答案
问题 85: 85. 关于聚类挖掘,表述错误的是:
选项:

A. 聚类结果的好坏与能否发现隐含模式无关

B. 好的聚类结果应该有高类内相似性和低类间相似性这样的特征

C. 好聚类的方法的标准是要产生高质量的聚类结果

D. 聚类结果的好坏取决于相似性的度量方法以及具体实现
答案: 请关注ybaotk.com搜题查看答案
问题 86: 86. 什么是存储在计算机内有结构的数据的集合?
选项:

A. 数据库结构

B. 数据库管理系统

C. 数据库系统

D. 数据库
答案: 请关注ybaotk.com搜题查看答案
问题 87: 87. 哪个不属于知识发现的步骤
选项:

A. 数据清理

B. 数据集成

C. 数据开发

D. 数据选择
答案: 请关注ybaotk.com搜题查看答案
问题 88: 88. 不属于社交网络特点的是
选项:

A. 数据单一

B. 海量用户

C. 实时数据

D. 完整数据
答案: 请关注ybaotk.com搜题查看答案
问题 89: 89. 单舆情的系统架构正确的是
选项:

A. 规划-采集-分析-存储-报告-管控

B. 规划-存储-分析-采集-报告-管控

C. 规划-采集-存储-分析-报告-管控

D. 规划-存储-采集-分析-报告-管控
答案: 请关注ybaotk.com搜题查看答案
问题 90: 90. 以下不属于网络舆情的主要来源的是
选项:

A. 书信

B. QQ

C.

D. 论坛与BBS
答案: 请关注ybaotk.com搜题查看答案
问题 91: 1. 当前社会中,最为突出的大数据环境是( )
选项:

A. 自然资源

B. 互联网

C. 物联网

D. 综合国力
答案: 请关注ybaotk.com搜题查看答案
问题 92: 2. 可以对大数据进行深度分析的平台工具是( )
选项:

A. 未来机器学习工具

B. 第二代机器学习工具

C. 传统的机器学习和数据分析肛具

D. 第二代机器学习工具
答案: 请关注ybaotk.com搜题查看答案
问题 93: 3. 根据周琦老师所讲,高德交通信息服务覆盖全国高速()以上。
选项:

A. 70%

B. 50%

C. 90%

D. 60%
答案: 请关注ybaotk.com搜题查看答案
问题 94: 4. 根据周琦老师所讲,以下哪项不属于数据挖掘的内容?
选项:

A. 高德地图导航有躲避拥堵功能

B. 建立道路拥堵概率与拥堵趋势变化模型

C. 补充与完善路网属性

D. 多维分析统计用户出行规律
答案: 请关注ybaotk.com搜题查看答案
问题 95: 5. 2012年全国各城市支付宝人均支出排名中,位居第二位的是()
选项:

A. 高雄市

B. 嘉义市

C. 嘉兴市

D. 杭州市
答案: 请关注ybaotk.com搜题查看答案
问题 96: 6. 第一个提出大数据概念的公司是 ( )。
选项:

A. 微软公司

B. 谷歌公司

C. 脸谱公司

D. 麦肯锡公司
答案: 请关注ybaotk.com搜题查看答案
问题 97: 7. 关于大数据在社会综合治理中的作用,以下理解不正确的是( )。
选项:

A. 大数据的运用有利于走群众路线

B. 大数据的运用能够加强交通管理

C. 大数据的运用能够维护社会治安

D. 大数据的运用能够杜绝抗生素的滥用
答案: 请关注ybaotk.com搜题查看答案
问题 98: 8. 关于推荐系统的说法错误的是
选项:

A. 推荐系统经历了很短的时间形成

B. 推荐系统的相关技术包括机器学习及数据挖掘算法等

C. 推荐系统的架构为离线计算-在线计算-推荐引擎APP

D. 推荐系统的常见表现形式有猜你喜欢、买了又买、精品推荐等
答案: 请关注ybaotk.com搜题查看答案
问题 99: 9. 以下关于搜索引擎说法错误的是
选项:

A. 呈现的搜索结果是凌乱无序的

B. 是基于web相关技术为基础的

C. 是能依据用户需求查找相应信息的在线搜索系统

D. 是对网络信息资源进行抓取和采集建立索引数据库
答案: 请关注ybaotk.com搜题查看答案
问题 100: 10. 大数据可能带来( ),但未必能够带来( )。
选项:

A. 精确度;多样性

B. 精确度;准确度

C. 多样性;准确度

D. 准确度;精确度
答案: 请关注ybaotk.com搜题查看答案
问题 101: 11. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:

A. 软件开发工程师

B. 研究科学家

C. 数据分析员

D. 数据管理人员
答案: 请关注ybaotk.com搜题查看答案
问题 102: 12. 智能健康手环的应用开发,体现了( )的数据采集技术的应用。
选项:

A. API接口

B. 统计报表

C. 网络爬虫

D. 传感器
答案: 请关注ybaotk.com搜题查看答案
问题 103: 13. 以下选项中,不属于信息时代的定律的是( )。
选项:

A. 摩尔定律

B. 吉尔德定律

C. 达律多定律

D. 麦特卡尔夫定律
答案: 请关注ybaotk.com搜题查看答案
问题 104: 14. 关于聚类挖掘,表述错误的是:
选项:

A. 聚类结果的好坏与能否发现隐含模式无关

B. 聚类结果的好坏取决于相似性的度量方法以及具体实现

C. 好的聚类结果应该有高类内相似性和低类间相似性这样的特征

D. 好聚类的方法的标准是要产生高质量的聚类结果
答案: 请关注ybaotk.com搜题查看答案
问题 105: 15. 什么是存储在计算机内有结构的数据的集合?
选项:

A. 数据库

B. 数据库管理系统

C. 数据库系统

D. 数据库结构
答案: 请关注ybaotk.com搜题查看答案
问题 106: 16. 哪个不属于知识发现的步骤
选项:

A. 数据选择

B. 数据清理

C. 数据开发

D. 数据集成
答案: 请关注ybaotk.com搜题查看答案
问题 107: 17. 不属于社交网络特点的是
选项:

A. 完整数据

B. 海量用户

C. 数据单一

D. 实时数据
答案: 请关注ybaotk.com搜题查看答案
问题 108: 18. 单舆情的系统架构正确的是
选项:

A. 规划-采集-存储-分析-报告-管控

B. 规划-采集-分析-存储-报告-管控

C. 规划-存储-分析-采集-报告-管控

D. 规划-存储-采集-分析-报告-管控
答案: 请关注ybaotk.com搜题查看答案
问题 109: 19. 以下不属于网络舆情的主要来源的是
选项:

A. 论坛与BBS

B. QQ

C.

D. 书信
答案: 请关注ybaotk.com搜题查看答案
问题 110: 20. 数据清洗的方法不包括( )。
选项:

A. 缺失值处理

B. 重复数据记录处理

C. 一致性检查

D. 噪声数据清除
答案: 请关注ybaotk.com搜题查看答案
问题 111: 21. 智能健康手环的应用开发,体现了( )的数据采集技术的应用
选项:

A. 网络爬虫

B. 统计报表

C. 传感器

D. API接口
答案: 请关注ybaotk.com搜题查看答案
问题 112: 22. 支撑大数据业务的基础是( )
选项:

A. 数据人才

B. 数据硬件

C. 数据应用

D. 数据科学
答案: 请关注ybaotk.com搜题查看答案
问题 113: 23. 面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是( )
选项:

A. 大数据信息分类模式

B. 大数据解决方案模式

C. 大数据处理服务模式

D. 大数据资源提供模式
答案: 请关注ybaotk.com搜题查看答案
问题 114: 24. 当前大数据技术的基础是由( )首先提出的。
选项:

A. 谷歌

B. 阿里巴巴

C. 百度

D. 微软
答案: 请关注ybaotk.com搜题查看答案
问题 115: 25. 大数据的起源是( )。
选项:

A. 公共管理

B. 金融

C. 互联网

D. 电信
答案: 请关注ybaotk.com搜题查看答案
问题 116: 26. ( )反映数据的精细化程度,越细化的数据,价值越高。
选项:

A. 活性

B. 规模

C. 颗粒度

D. 关联度
答案: 请关注ybaotk.com搜题查看答案
问题 117: 1. 在网络爬虫的爬行策略中,应用最为基础的是( )。
选项:

A. 大站优先策略

B. 深度优先遍历策略

C. 反向链接策略

D. 广度优先遍历策略

E. 高度优先遍历策略
答案: 请关注ybaotk.com搜题查看答案
问题 118: 2. 当前,大数据产业发展的特点是( )。
选项:

A. 增速很快

B. 多产业交叉融合

C. 规模较大

D. 规模较小

E. 增速缓慢
答案: 请关注ybaotk.com搜题查看答案
问题 119: 3. 下列关于数据生命周期管理的核心认识中,正确的是( )。
选项:

A. 根据数据价值的不同应该对数据采取不同的管理策略

B. 在不同的数据存在阶段,数据的价值是不同的

C. 数据生命周期管理旨在产生效益的同时,降低生产成本

D. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

E. 数据生命周期管理最终关注的是社会效益
答案: 请关注ybaotk.com搜题查看答案
问题 120: 4. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( )。
选项:

A. 传统营销模式比基于大数据的营销模式针对性更强

B. 基于大数据的营销模式比传统营销模式精准性更强

C. 传统营销模式比基于大数据的营销模式投入更小

D. 基于大数据的营销模式比传统营销模式实时性更强

E. 传统营销模式比基于大数据的营销模式转化率低
答案: 请关注ybaotk.com搜题查看答案
问题 121: 5. 按照涉及自变量的多少,可以将回归分析分为( )。
选项:

A. 非线性回归分析

B. 一元回归分析

C. 多元回归分析

D. 线性回归分析

E. 综合回归分析
答案: 请关注ybaotk.com搜题查看答案
问题 122: 6. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
选项:

A. 自行开发数据产品

B. 实现科学决策与运营

C. 打通多源跨域数据

D. 提高分析挖掘能力

E. 投资入股互联网电商行业
答案: 请关注ybaotk.com搜题查看答案
问题 123: 7. 下列关于大数据的说法中,错误的是( )。
选项:

A. 大数据的目的在于发现新的知识与洞察并进行科学决策

B. 大数据的应用注重因果分析而不是相关分析

C. 大数据的应用注重相关分析而不是因果分析

D. 大数据具有体量大、结构单一、时效性强的特征

E. 处理大数据需采用新型计算架构和智能算法等新技术
答案: 请关注ybaotk.com搜题查看答案
问题 124: 8. 数据建立信心的作用需具备的条件包括( )。
选项:

A. 信得过的第三方单位

B. 多方的数据源

C. 可靠数据源

D. 合适的数据分析
答案: 请关注ybaotk.com搜题查看答案
问题 125: 9. 数据只有在与( )的交互中才能发挥作用。
选项:

A. 物

B. 企业

C. 人

D. 消费者
答案: 请关注ybaotk.com搜题查看答案
问题 126: 10. 大数据的定义是:
选项:

A. 技术

B. 商业

C. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合

D. 任何超过了一台计算机处理能力的数据量
答案: 请关注ybaotk.com搜题查看答案
问题 127: 11. 大数据五大类应用方向是:
选项:

A. 预测

B. 统计

C. 预警

D. 查询

E. 触达
答案: 请关注ybaotk.com搜题查看答案
问题 128: 12. 以下属于推荐系统算法的是
选项:

A. 基于知识推理算法

B. 关联规则算法

C. 聚类及相似度算法

D. CF协同过滤算法
答案: 请关注ybaotk.com搜题查看答案
问题 129: 13. 传统大数据质量清洗的特点有:
选项:

A. 协调式的

B. 非确定性

C. 确定性

D. 强类型性
答案: 请关注ybaotk.com搜题查看答案
问题 130: 14. 以下选项中属于数据的作用的是( )。
选项:

A. 沟通

B. 建立信心

C. 验证假设

D. 欣赏
答案: 请关注ybaotk.com搜题查看答案
问题 131: 1. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 132: 2. 大数据”一词,最早出现于20世纪90年代,当时的数据仓库之父比尔.恩门经常提及Big Data。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 133: 3. 宁家骏委员指出,我国民生领域信息化服务水平显著提升。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 134: 4. 1997年,1GB闪存的价格将近8000美元,现在是25美分。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 135: 5. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响, 从而说服决策者信服并采纳其建议, 是数据分析能力对大数据人才的基本要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 136: 6. 简单随机抽样,是从总体 N个对象中任意抽取 n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 137: 7. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 138: 8. 根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 139: 9. 宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 140: 1. 属于高质量聚类分析的要求:①可扩展性 ②处理相同类型数据的能力 ③发现任意形状的能力 ④领域知识参数输入的最大化 ⑤处理噪声数据的能力 ⑥数据输入顺序敏感
选项:

A. ①③⑥

B. ①③⑤

C. ②④⑥

D. ①②③④⑤⑥
答案: 请关注ybaotk.com搜题查看答案
问题 141: 2. 社群结构聚合探测算法的步骤中,()条件满足时,算法会停止并输出探测结果。
选项:

A. maxφpq

B. maxφpq<0

C. maxφpq≥0

D. 0

E. maxφpq≤0
答案: 请关注ybaotk.com搜题查看答案
问题 142: 3. 以下说法错误的是
选项:

A. FP-树频集算法是针对Apriori算法缺点进行改进后的算法

B. 关联规则在使用时的两个指标是支持度和置信度

C. APRIORI算法最大的缺点是复杂度太高

D. FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的
答案: 请关注ybaotk.com搜题查看答案
问题 143: 4. 关联规则的基本概念中错误的是
选项:

A. 置信度是项集出现次数除以总的交易次数

B. 相对支持度指的是项集出现次数除以总的交易次数

C. 项集频率指的是项集所有交易中出现的次数

D. K项集指的是K个项的集合
答案: 请关注ybaotk.com搜题查看答案
问题 144: 5. K均值算法的缺点():①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:

A. ②④

B. ①②③④⑤

C. ①③⑤

D. ①③
答案: 请关注ybaotk.com搜题查看答案
问题 145: 6. 什么是大数据使用的最可靠方法?
选项:

A. 规模大

B. 大数据源

C. 大数据与样本数据结合

D. 样本数据源
答案: 请关注ybaotk.com搜题查看答案
问题 146: 7. 下列关于数据重组的说法中,错误的是( )。
选项:

A. 数据重组实现的关键在于多源数据融合和数据集成

B. 数据重组是数据的重新生产和重新采集

C. 数据重组能够使数据焕发新的光芒

D. 数据重组有利于实现新颖的数据模式创新
答案: 请关注ybaotk.com搜题查看答案
问题 147: 8. 大数据的最显著特征是( )。
选项:

A. 数据处理速度快

B. 数据类型多样

C. 数据价值密度高

D. 数据规模大
答案: 请关注ybaotk.com搜题查看答案
问题 148: 9. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:

A. 在分析效果上更追究效率而不是绝对精确

B. 在数据基础上倾向于全体数据而不是抽样数据

C. 在数据规模上强调相对数据而不是绝对数据

D. 在分析方法上更注重相关分析而不是因果分析
答案: 请关注ybaotk.com搜题查看答案
问题 149: 10. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:

A. 数据规模大

B. 数据价值密度高

C. 数据类型多样

D. 数据处理速度快
答案: 请关注ybaotk.com搜题查看答案
问题 150: 11. 当前社会中,最为突出的大数据环境是( )。
选项:

A. 物联网

B. 自然资源

C. 综合国力

D. 互联网
答案: 请关注ybaotk.com搜题查看答案
问题 151: 12. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种( )
选项:

A. 研究科学家

B. 数据分析员

C. 软件开发工程师

D. 数据管理人员
答案: 请关注ybaotk.com搜题查看答案
问题 152: 13. 下列论据中,能够支撑大数据无所不能”的观点的是( )
选项:

A. 大数据具有非常高的成本

B. 互联网金融打破了传统的观念和行为

C. 大数据存在泡沫

D. 个人隐私泄露与信息安全担忧
答案: 请关注ybaotk.com搜题查看答案
问题 153: 14. 下列国家的大数据发展行动中,支持原则先行、谨慎发展的国家( )
选项:

A. 英国

B. 澳大利亚

C. 韩国

D. 印度
答案: 请关注ybaotk.com搜题查看答案
问题 154: 15. 医疗健康数据的基本情况不包括以下哪项?
选项:

A. 公共安全数据

B. 健康档案数据

C. 个人健康管理数据

D. 诊疗数据
答案: 请关注ybaotk.com搜题查看答案
问题 155: 16. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的( )
选项:

A. 在分析方法上更注重相关分析而不是因果分析

B. 在数据基础上倾向于全体数据而不是抽样数据

C. 在数据规模上强调相对数据而不是绝对数据

D. 在分析效果上更追求效率而不是绝对精确
答案: 请关注ybaotk.com搜题查看答案
问题 156: 17. 数据仓库的最终目的是( )
选项:

A. 开发数据的应用分析

B. 为用户和业务部门提供决策支持

C. 收集业务需求

D. 建立数据仓库逻辑模型
答案: 请关注ybaotk.com搜题查看答案
问题 157: 18. 大数据的最显著特征是( )
选项:

A. 数据类型多样

B. 数据规模大
答案: 请关注ybaotk.com搜题查看答案
问题 158: 19. 智慧城市的构建,不包含( )。
选项:

A. 数字城市

B. 物联网

C. 联网监控

D. 云计算
答案: 请关注ybaotk.com搜题查看答案
问题 159: 20. 根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。
选项:

A. 2014年

B. 2006年

C. 2008年

D. 2010年
答案: 请关注ybaotk.com搜题查看答案
问题 160: 21. 第一个提出大数据概念的公司是
选项:

A. 麦肯锡公司

B. 脸谱公司

C. 谷歌公司

D. 微软公司
答案: 请关注ybaotk.com搜题查看答案
问题 161: 22. 以下选项中,不属于大数据对人才能力的要求是
选项:

A. IT技术能力

B. 逻辑思维能力

C. 数学统计能力

D. 业务能力
答案: 请关注ybaotk.com搜题查看答案
问题 162: 23. 根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。
选项:

A. 21

B. 30

C. 25

D. 38
答案: 请关注ybaotk.com搜题查看答案
问题 163: 24. 以下选项中,不属于大数据对人才能力的要求是( )。
选项:

A. IT技术能力

B. 业务能力

C. 数学统计能力

D. 逻辑思维能力
答案: 请关注ybaotk.com搜题查看答案
问题 164: 25. Web2.0强调()。
选项:

A. 网站

B. 单位

C. 个人

D. 机构
答案: 请关注ybaotk.com搜题查看答案
问题 165: 26. 根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。
选项:

A. 100亿

B. 80亿

C. 50亿

D. 150亿
答案: 请关注ybaotk.com搜题查看答案
问题 166: 27. 大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。
选项:

A. 新一代信息技术

B. 新一代服务业态

C. 新一代技术平台

D. 新一代信息技术和服务业态
答案: 请关注ybaotk.com搜题查看答案
问题 167: 28. 大数据整合要保证各个数据源之间的( )。
选项:

A. 差异性、协调性

B. 一致性、协调性

C. 一致性、差异性

D. 一致性、相容性
答案: 请关注ybaotk.com搜题查看答案
问题 168: 1. 当前大数据技术的基础包括( )
选项:

A. 分布式并行计算

B. 分布式数据库

C. 关系型数据库

D. 分布式文件系统
答案: 请关注ybaotk.com搜题查看答案
问题 169: 2. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )
选项:

A. 能够直观反映多维数据之间的空间关系

B. 能够静态演化事物的变化及变化的规律

C. 提供高性能并行计算技术的强力支撑

D. 能够动态演化事物的变化及变化的规律

E. 能够直观反映成对数据之间的空间关系
答案: 请关注ybaotk.com搜题查看答案
问题 170: 3. 下列关于计算机存储容量单位换算关系的公式中,正确的是( )
选项:

A. 1KB

B. 1024KB

C. 1GB

D. 1GB

E. 1024Byte

F. 1012Byte

G. 1KB

H. 1GB

I. 1024MB

J. 1012KB
答案: 请关注ybaotk.com搜题查看答案
问题 171: 4. 下列各国大数据发展路径的描述中,对应关系正确的是( )
选项:

A. 英国:视大数据为新的自然资源

B. 韩国:重视基础、首都先行

C. 印度:以IT外包转型为突破口若悬河

D. 澳大利亚:原则先行、谨慎发展

E. 日本:走尖端IT路线
答案: 请关注ybaotk.com搜题查看答案
问题 172: 5. 当前,大数据产业发展的特点是( )
选项:

A. 规模较大

B. 规模较小

C. 增速缓慢

D. 多产业交叉融合

E. 增速很快
答案: 请关注ybaotk.com搜题查看答案
问题 173: 6. 按照服务目的不同,数据流通平台可分为( )
选项:

A. 数据交易市场

B. 政府数据开放平台

C. 数据研发市场

D. 企业数据开放平台

E. 数据废气交易市场
答案: 请关注ybaotk.com搜题查看答案
问题 174: 7. 大数据的价值体现在( )
选项:

A. 大数据为政策制定提供科学论据

B. 大数据实现了精准营销

C. 大数据给思维方式带来了冲击

D. 大数据助力智慧城市提升公共服务水平

E. 大数据的发力点在于预测
答案: 请关注ybaotk.com搜题查看答案
问题 175: 8. 大数据有哪些价值?
选项:

A. 生产数据的价值

B. 实时价值

C. 描述价值

D. 用户身份识别

E. 预测价值
答案: 请关注ybaotk.com搜题查看答案
问题 176: 9. 大数据的预测价值体现在:
选项:

A. 预测热卖品及交易额

B. 预测用户的偏好、流失

C. 预测经营趋势

D. 评价
答案: 请关注ybaotk.com搜题查看答案
问题 177: 10. 大数据是描述( )所发生的行为。
选项:

A. 未来

B. 现在

C. 实时

D. 过去
答案: 请关注ybaotk.com搜题查看答案
问题 178: 11. 传统研究中数据采集的方法包括:
选项:

A. 对面访谈

B. 线上互动

C. 网络监测

D. 电话访谈
答案: 请关注ybaotk.com搜题查看答案
问题 179: 12. 以下属于能产生大数据,即大数据的源头的有
选项:

A. 搜索引擎

B. 电子商务

C. 社交网络

D. 游戏

E. 移动互联网

F. 互联网电视
答案: 请关注ybaotk.com搜题查看答案
问题 180: 13. 数据挖掘常用的工具有
选项:

A. R

B. Clement

C. Gephi

D. Photoshop
答案: 请关注ybaotk.com搜题查看答案
问题 181: 14. 中心性研究的意义是在于衡量节点的
选项:

A. 约束力

B. 权力

C. 影响力

D. 控制力
答案: 请关注ybaotk.com搜题查看答案
问题 182: 15. 属于社交网络的表达形式
选项:

A. 矩阵论

B. 网论

C. 点阵论

D. 图论
答案: 请关注ybaotk.com搜题查看答案
问题 183: 16. 以下哪些指标是衡量大数据应用成功的标准?
选项:

A. 风险更低

B. 成本更低

C. 速度更快

D. 质量更高
答案: 请关注ybaotk.com搜题查看答案
问题 184: 1. 我国国内行业之间的信息化发展水平差距比较大,农业信息化属于短板。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 185: 2. 吴军博士认为凡是简单、重复的工作,在未来的时代里一定是机器做得比人更好。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 186: 3. 20世纪50年代-80年代,第一代信息传输技术只能传输4380路信号。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 187: 4. 大数据的价值重在挖掘,而挖掘就是分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 188: 5. 物联网的处理技术应用于农业上,可以对动物疾病、植物病虫害,通过传感器进行远程诊断。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 189: 6. 数据资产型企业产品线的盈利,主要通过提供收费服务来获取
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 190: 7. 在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 191: 8. 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 192: 9. 在美国的大数据大棋中,五眼”是指配合美国进行全球监控的包含美国、英国、加拿大兰在内的五个国家
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 193: 10. 当前,企业提供的大数据解决方案大多基于 Ha doop 开源项目
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 194: 11. 澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 195: 12. 大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式, 可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 196: 13. 大数据最早由麦肯锡在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。 ()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 197: 14. 大数据”是需要新处理模式才能具有强大的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 198: 15. 大数据的数据类型包括网络日志、音频、视频、图片、地理位置信息等等。 ()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 199: 16. 大数据的起始计量单位至少是 MB。()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 200: 1. 单选 Hive的数据计算使用
选项:

A. HDFS

B. HBASE

C. MapReduce

D. PIG
答案: 请关注ybaotk.com搜题查看答案
问题 201: 2. 单选 Hadoop生态系统中,最核心的设计是()
选项:

A. TEZ和PIG

B. HDFS和MAPREDUCE

C. HIVE和HDFS

D. HBASE和STORM
答案: 请关注ybaotk.com搜题查看答案
问题 202: 3. 单选 Web挖掘中内容挖掘的基本技术是()
选项:

A. 图片挖掘

B. 文本挖掘

C. 数据挖掘

D. 技术挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 203: 4. 布尔权重是指如果某个词条在一篇文本中出现,则将其权值定义为(),否则定义为()
选项:

A. 1,0

B. 0,1

C. 2,0

D. 0,2
答案: 请关注ybaotk.com搜题查看答案
问题 204: 5. 以下哪个不是推荐系统的评测指标
选项:

A. 覆盖率

B. 新颖性

C. 统一性

D. 惊喜度
答案: 请关注ybaotk.com搜题查看答案
问题 205: 6. 分类变量使用( )建立预测模型。
选项:

A. 回归树

B. 决策树

C. 离散树

D. 分类树
答案: 请关注ybaotk.com搜题查看答案
问题 206: 7. 对线下零售而言,做好大数据分析应用的前提是( )
选项:

A. 增加数据来源

B. 开展优惠促销

C. 增加统计种类

D. 扩大营业面积
答案: 请关注ybaotk.com搜题查看答案
问题 207: 8. 万维网的实施国家是( )
选项:

A. 印度

B. 德国

C. 美国

D. 英国
答案: 请关注ybaotk.com搜题查看答案
问题 208: 9. 一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( )
选项:

A. 因果思维

B. 定量思维

C. 实验思维

D. 相关思维
答案: 请关注ybaotk.com搜题查看答案
问题 209: 10. 下列关于网络用户行为的说法中,错误的是( )。
选项:

A. 数字轨迹用完即自动删除

B. 网络公司能够捕捉到用户在其网站上的所有行为

C. 用户的隐私安全很难得以规范保护

D. 用户离散的交互痕迹能够为企业提升服务质量提供参考
答案: 请关注ybaotk.com搜题查看答案
问题 210: 11. 下列关于计算机存储容量单位的说法中,错误的是( )。
选项:

A. 一个字节能够容纳一个英文字符,

B. 一个汉字需要一个字节的存储空间

C. 1KB<1MB<1GB

D. 基本单位是字节(Byte)
答案: 请关注ybaotk.com搜题查看答案
问题 211: 12. 下列关于大数据的分析理念的说法中,错误的是( )。
选项:

A. 在分析效果上更追究效率而不是绝对精确

B. 在数据规模上强调相对数据而不是绝对数据

C. 在分析方法上更注重相关分析而不是因果分析

D. 在数据基础上倾向于全体数据而不是抽样数据
答案: 请关注ybaotk.com搜题查看答案
问题 212: 13. 下列论据中,体现冷眼”看大数据的观点的是( )
选项:

A. 互联网金融打破了传统的观念和行为

B. 数据资产型企业前景光明

C. 个人隐私泄露与信息安全担忧

D. 大数据医疗正在走进平民百姓
答案: 请关注ybaotk.com搜题查看答案
问题 213: 14. 下列国家的大数据发展行动中,视大数据为新的自然资源的国家是( )
选项:

A. 新加坡

B. 印度

C. 中国

D. 韩国
答案: 请关注ybaotk.com搜题查看答案
问题 214: 15. 大数据环境下的隐私担忧,主要表现为( )
选项:

A. 恶意广告的推送

B. 个人信息的被识别与暴露

C. 病毒入侵

D. 用户画像的生成
答案: 请关注ybaotk.com搜题查看答案
问题 215: 16. 最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?
选项:

A. 吉尔德定律

B. 麦特卡尔夫定律

C. 摩尔定律

D. 牛顿定律
答案: 请关注ybaotk.com搜题查看答案
问题 216: 17. 根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。
选项:

A. 30%

B. 90%

C. 70%

D. 50%
答案: 请关注ybaotk.com搜题查看答案
问题 217: 18. 大数据的本质是( )。
选项:

A. 挖掘

B. 联系

C. 洞察

D. 搜集
答案: 请关注ybaotk.com搜题查看答案
问题 218: 19. 由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到()以内。
选项:

A. 6个月

B. 24个月

C. 18个月

D. 12个月
答案: 请关注ybaotk.com搜题查看答案
问题 219: 20. 在数据生命周期管理实践中,( )是
选项:

A. 数据价值发觉和利用

B. 数据存储和备份规范

C. 数据管理和维护

D. 数据应用开发和管理
答案: 请关注ybaotk.com搜题查看答案
问题 220: 21. 在数据生命周期管理实践中,( )是执行方法。
选项:

A. 数据存储和备份规范

B. 数据管理和维护

C. 数据应用开发和管理

D. 数据价值发觉和利用
答案: 请关注ybaotk.com搜题查看答案
问题 221: 22. 下列国家的大数据发展行动中,集中体现重视基础、首都先行”的国家是( )。
选项:

A. 美国

B. 日本

C. 韩国

D. 中国
答案: 请关注ybaotk.com搜题查看答案
问题 222: 23. 购物篮分析属于( )。
选项:

A. 描述性统计

B. 关联分析

C. 分类与预测

D. 聚类分析
答案: 请关注ybaotk.com搜题查看答案
问题 223: 1. 避免数据孤岛”的方法包括:
选项:

A. 利用样本框

B. 关键匹配变量

C. 数据融合

D. 数据输入
答案: 请关注ybaotk.com搜题查看答案
问题 224: 2. 以下属于机器学习的是:
选项:

A. 半监督式学习

B. 监督式学习

C. 非监督式学习

D. 强化学习
答案: 请关注ybaotk.com搜题查看答案
问题 225: 3. 机器学习的四大类分析技术的主要算法包括()
选项:

A. 聚类分析

B. 分类与预测

C. 描述性统计

D. 关联分析
答案: 请关注ybaotk.com搜题查看答案
问题 226: 4. 以下哪些选项属于决策树分析的步骤?
选项:

A. 收集数据

B. 确定分析维度

C. 修剪决策树

D. 跑决策树分析
答案: 请关注ybaotk.com搜题查看答案
问题 227: 5. 大数据作为一种数据集合,它的含义包括( )。
选项:

A. 变化很快

B. 构成复杂

C. 数据很大

D. 很有价值
答案: 请关注ybaotk.com搜题查看答案
问题 228: 6. 下列关于大数据对政府政策制定的影响的说法中,错误的是( )
选项:

A. 大数据可以完美解决一切政府政策制定难题

B. 大数据有效改变了政府的决策方式

C. 大数据有助于避免传统决策方式的随意性和主观性

D. 大数推动政府从基于实证”的决策模式走向基于经验”的决策模式

E. 为数据拓展了政府决策的信息边界条件
答案: 请关注ybaotk.com搜题查看答案
问题 229: 7. 根据下图判断是聚类分析的哪种数据源
选项:

A. 距离矩阵

B. 数据矩阵

C. 相异度矩阵

D. 二模矩阵
答案: 请关注ybaotk.com搜题查看答案
问题 230: 8. 数据挖掘面临的问题有哪些
选项:

A. 数据缺失

B. 挖掘方法与用户交互

C. 算法的有效性和可伸缩性

D. 噪声处理
答案: 请关注ybaotk.com搜题查看答案
问题 231: 9. 以下Web信息特点的是
选项:

A. 信息量庞大

B. 信息是动态的

C. 垃圾信息特别多

D. 信息复杂

E. 信息使用者复杂
答案: 请关注ybaotk.com搜题查看答案
问题 232: 10. 文本挖掘的主要任务
选项:

A. 确立需求

B. 概念提取

C. 关键词提取

D. 可视化显示和导航
答案: 请关注ybaotk.com搜题查看答案
问题 233: 11. ( )是大数据应用的步骤。
选项:

A. 建模分析

B. 数据输入

C. 验证假设

D. 使用决策支持工具输出结果
答案: 请关注ybaotk.com搜题查看答案
问题 234: 12. 大数据的低耗能存储及高效率计算的要求,需要以下多种技术协同合作( )
选项:

A. 多源数据清洗及数据整合技术

B. 分布式云存储技术

C. 高性能并行计算技术

D. 分布式文件系统及分布式并行数据库

E. 可视化高维度展示技术
答案: 请关注ybaotk.com搜题查看答案
问题 235: 13. IBM公司用3个V来描述大数据的三个基本特征,这 3V是( )
选项:

A. 复杂性

B. 速度

C. 体量

D. 多样性

E. 规模
答案: 请关注ybaotk.com搜题查看答案
问题 236: 1. 在没有大数据的条件下,人才的发现与选拔都很难做到全信息”,大数据能够帮助人们解决这个问题。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 237: 2. 大数据的应用之一是,促进健康管理的个性化和多元化。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 238: 3. 国务院办公厅关于深入实施互联网+流通”行动计划的意见》要求:支持建设农产品流通全程冷链系统。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 239: 4. 中远物流有100多个配送中心,装GPS的上万辆车每月产生2亿条信息,据此优化运输路线,减排10%。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 240: 5. 《促进大数据发展行动纲要》指出,要加快政府数据开放共享,推动资源整合,提升治理能力。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 241: 1. 以下说法正确的是
选项:

A. Spark可以基于HDFS这样分布式文件存储系统也可以基于Tachyon这样基于内存分布式文件存储系统

B. Spark只能基于HDFS这样分布式文件存储系统

C. Spark既无法基于HDFS这样分布式文件存储系统也无法基于Tachyon这样基于内存分布式文件存储系统

D. Spark只能基于Tachyon这样基于内存分布式文件存储系统
答案: 请关注ybaotk.com搜题查看答案
问题 242: 2. 能同时进行交互式计算,批处理,流式计算的计算框架为
选项:

A. Spark

B. Shark

C. Storm

D. Impala
答案: 请关注ybaotk.com搜题查看答案
问题 243: 3. Storm属于()计算
选项:

A. 交互式

B. 流式

C. 批处理

D. 云
答案: 请关注ybaotk.com搜题查看答案
问题 244: 4. Spark生态图中,()提供了图存储结构和常见的图算法
选项:

A. SharkSQL

B. Tachyon

C. GraphxGraphParallel

D. SparkStreaming
答案: 请关注ybaotk.com搜题查看答案
问题 245: 5. 中国互联网购物者占互联网使用者的比例为:
选项:

A. 0.57

B. 0.5

C. 0.56

D. 0.55
答案: 请关注ybaotk.com搜题查看答案
问题 246: 6. RDD中进行map,filter,groupBy等操作属于()
选项:

A. Acter

B. Change

C. Active

D. Transformation
答案: 请关注ybaotk.com搜题查看答案
问题 247: 7. 大数据时代,数据使用的关键是( )。
选项:

A. 数据再利用

B. 数据收集

C. 数据分析

D. 数据存储
答案: 请关注ybaotk.com搜题查看答案
问题 248: 8. 下列关于数据交易市场的说法中,错误的是( )。
选项:

A. 商业化的数据交易活动催生了多方参与的第三方数据交易市场

B. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

C. 数据交易市场是大数据资源化的必然产物

D. 数据交易市场是大数据产业发展到一定程度的产物
答案: 请关注ybaotk.com搜题查看答案
问题 249: 9. 数据仓库的最终目的是( )。
选项:

A. 建立数据仓库逻辑模型

B. 收集业务需求

C. 开发数据仓库的应用分析

D. 为用户和业务部门提供决策支持
答案: 请关注ybaotk.com搜题查看答案
问题 250: 10. 大数据的最显著特征是( )。
选项:

A. 数据规模大

B. 数据价值密度高

C. 数据处理速度快

D. 数据类型多样
答案: 请关注ybaotk.com搜题查看答案
问题 251: 11. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:

A. 在分析方法上更注重相关分析而不是因果分析

B. 在分析效果上更追究效率而不是绝对精确

C. 在数据规模上强调相对数据而不是绝对数据

D. 在数据基础上倾向于全体数据而不是抽样数据
答案: 请关注ybaotk.com搜题查看答案
问题 252: 12. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:

A. 数据处理速度快

B. 数据类型多样

C. 数据规模大

D. 数据价值密度高
答案: 请关注ybaotk.com搜题查看答案
问题 253: 13. 当前社会中,最为突出的大数据环境是( )。
选项:

A. 物联网

B. 互联网

C. 自然资源

D. 综合国力
答案: 请关注ybaotk.com搜题查看答案
问题 254: 14. 一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证, 这体现了大数据思维维度中的( )
选项:

A. 定量思维

B. 实验思维

C. 因果思维

D. 相关思维
答案: 请关注ybaotk.com搜题查看答案
问题 255: 15. 下列企业中,最有可能成为典型的数据资产动营商的是( )
选项:

A. 电信运营商

B. 物联网企业

C. 互联网企业

D. 云计算企业
答案: 请关注ybaotk.com搜题查看答案
问题 256: 16. 万维网之父是( )。
选项:

A. 蒂姆.伯纳斯-李

B. 舍恩伯格

C. 斯科特.布朗

D. 彼得.德鲁克
答案: 请关注ybaotk.com搜题查看答案
问题 257: 17. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:

A. 数据分析员

B. 数据管理人员

C. 研究科学家

D. 软件开发工程师
答案: 请关注ybaotk.com搜题查看答案
问题 258: 18. 智能健康手环的应用开发,体现了( )的数据采集技术的应用。
选项:

A. 传感器

B. 统计报表

C. 网络爬虫

D. API接口
答案: 请关注ybaotk.com搜题查看答案
问题 259: 19. 智慧城市的构建,不包含( )。
选项:

A. 数字城市

B. 云计算

C. 物联网

D. 联网监控
答案: 请关注ybaotk.com搜题查看答案
问题 260: 20. Mac OS系统的开发者是( )。
选项:

A. IBM公司

B. 苹果公司

C. 惠普公司

D. 微软公司
答案: 请关注ybaotk.com搜题查看答案
问题 261: 1. 大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?
选项:

A. 构成复杂

B. 变化很快

C. 蕴含大价值

D. 数据很大
答案: 请关注ybaotk.com搜题查看答案
问题 262: 2. 用户建模模块的功能是
选项:

A. 获取、表示用户的兴趣偏好

B. 存储或者修改用户的兴趣偏好

C. 对用户进行识别和分类

D. 帮助用户找到需要的东西
答案: 请关注ybaotk.com搜题查看答案
问题 263: 3. 以下属于推荐系统产生的原因的是
选项:

A. 无明确需求

B. 信息过载

C. 具有明确需求

D. 有效信息量少
答案: 请关注ybaotk.com搜题查看答案
问题 264: 4. RDD操作进行的转换指的是
选项:

A. 通过已有的RDD产生新的RDD

B. 通过RDD计算得到一个或一组值

C. 进行countcollect等操作

D. 可以通过Scala集合或者Hadoop构造新的RDD
答案: 请关注ybaotk.com搜题查看答案
问题 265: 5. 精准营销三要素是:
选项:

A. 人

B. 物

C. 位置

D. 性别
答案: 请关注ybaotk.com搜题查看答案
问题 266: 6. 婴幼儿配方奶粉的线上销售增速放缓的原因包括( )。
选项:

A. 婴幼儿配方奶粉的总体需求减少

B. 线上体量足够大

C. 物流不发达

D. 线下促销倒逼
答案: 请关注ybaotk.com搜题查看答案
问题 267: 7. 零售数据的线上来源包括( )。
选项:

A. 全渠道覆盖

B. 合作电商的数据

C. 产品条目

D. 利用大数据对非合作电商的推算
答案: 请关注ybaotk.com搜题查看答案
问题 268: 8. 贵州发展大数据的顶层设计是要逐步建成三个中心,即()。
选项:

A. 大数据人才中心

B. 大数据内容中心

C. 大数据服务中心

D. 大数据金融中心
答案: 请关注ybaotk.com搜题查看答案
问题 269: 9. 云计算的特点包括以下哪些方面?
选项:

A. 服务可计算

B. 服务可租用

C. 低使用度

D. 高性价比
答案: 请关注ybaotk.com搜题查看答案
问题 270: 10. 下列选项中,属于贵州发展大数据的先天优势的是()。
选项:

A. 空气清新

B. 电力资源充沛

C. 气候凉爽

D. 远离地震带
答案: 请关注ybaotk.com搜题查看答案
问题 271: 11. 基于知识的推荐的产生是由于
选项:

A. 推荐系统需要利用额外的因果知识生成推荐

B. 推荐系统无法依赖购买记录进行推荐

C. 把各种推荐方法根据优缺点和试用场景进行搭配产生

D. 推荐系统会用到有关当前用户和有效物品的额外信息
答案: 请关注ybaotk.com搜题查看答案
问题 272: 12. 大数据处理流程可以概括为以下哪几步?
选项:

A. 导入和预处理

B. 统计和分析

C. 采集

D. 挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 273: 13. 宁家骏委员指出,()主导了21世纪。
选项:

A. 大数据

B. 云计算

C. 移动支付

D. 物联网
答案: 请关注ybaotk.com搜题查看答案
问题 274: 14. 大数据的主要特征表现为()。
选项:

A. 数据类型多

B. 数据容量大

C. 商业价值高

D. 处理速度快
答案: 请关注ybaotk.com搜题查看答案
问题 275: 1. 林雅华博士指出,目前中国的是一个复杂社会,是一个转型社会。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 276: 2. 移动互联网实现了人人相连、人物相联、物物相连。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 277: 3. 、奥巴马认为,对大数据的占有与控制,反映的是一个国家的核心能力之大小。因此,他已经将大数据上升到国家战略高度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 278: 4. 由于历史的原因,我国医院的信息化建设层次不齐、水平不一。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 279: 5. 网球比赛,与其他体育项目一样,涉及大量数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 280: 1. K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:

A. ①③

B. ①②③④⑤

C. ①③⑤

D. ②④
答案: 请关注ybaotk.com搜题查看答案
问题 281: 2. 关于内容深度理解建立索引说法正确的是
选项:

A. 内容索引又可以分为单索引和双索引

B. 索引分为客观索引和主观索引

C. 内容索引与客观因素有很大关系

D. 客观索引与文档内容有关
答案: 请关注ybaotk.com搜题查看答案
问题 282: 3. 中国的网络消费者比线下消费者更( )。
选项:

A. 年轻和富裕

B. 年老和贫困

C. 年轻和贫困

D. 年老和富裕
答案: 请关注ybaotk.com搜题查看答案
问题 283: 4. 大数据获取的个人信息比传统调研获得的个人信息真实性( )。
选项:

A. 更低

B. 更高

C. 不确定

D. 相同
答案: 请关注ybaotk.com搜题查看答案
问题 284: 5. DMP分为( )和( )。
选项:

A. 单一式DMP;封闭式DMP

B. 单一式DMP;多元式DMP

C. 开放式DMP;私有式DMP

D. 开放式DMP;封闭式DMP
答案: 请关注ybaotk.com搜题查看答案
问题 285: 6. 阿里巴巴旗下的数据管理平台,被称为:
选项:

A. 达摩盘

B. 招财宝

C. 蚂蚁花呗

D. 支付宝
答案: 请关注ybaotk.com搜题查看答案
问题 286: 7. 万维网之父是( )。
选项:

A. 斯科特•布朗

B. 彼得•德鲁克

C. 蒂姆•伯纳斯-李

D. 舍恩伯格
答案: 请关注ybaotk.com搜题查看答案
问题 287: 8. Mac OS系统的开发者是()。
选项:

A. 苹果公司

B. 惠普公司

C. 微软公司

D. IBM公司
答案: 请关注ybaotk.com搜题查看答案
问题 288: 9. 下列论据中,能够支撑大数据无所不能”的观点的是( )。
选项:

A. 互联网金融打破了传统的观念和行为

B. 个人隐私泄露与信息安全担忧

C. 大数据具有非常高的成本

D. 大数据存在泡沫
答案: 请关注ybaotk.com搜题查看答案
问题 289: 10. Spark生态图中,()提供了一个机器学习的算法库
选项:

A. SharkSQL

B. MLBaseMachineLearning

C. Tachyon

D. GraphxGraphParallel
答案: 请关注ybaotk.com搜题查看答案
问题 290: 11. Hive2也被称为Stringer,底层的计算引擎由()替换()
选项:

A. Tez,Hdfs

B. Pig,Tez

C. MapReduce,Tez

D. Tez,MapReduce
答案: 请关注ybaotk.com搜题查看答案
问题 291: 12. 以下关于Pig和Hive异同的说法错误的是
选项:

A. Pig和Hive的编程语言不同

B. Pig和Hive的相同点是它们的设计动机都是为用户提供更简单的数据分析方式

C. 二者都运行在Hadoop之上

D. Pig要求待处理数据必须有Schema,而Hive则无此要求
答案: 请关注ybaotk.com搜题查看答案
问题 292: 13. 支撑大数据业务的基础是( )。
选项:

A. 数据应用

B. 数据硬件

C. 数据科学

D. 数据人才
答案: 请关注ybaotk.com搜题查看答案
问题 293: 14. 在数据生命周期管理实践中,( )是执行方法。
选项:

A. 数据存储和备份规范

B. 数据价值发觉和利用

C. 数据管理和维护

D. 数据应用开发和管理
答案: 请关注ybaotk.com搜题查看答案
问题 294: 15. 下列关于网络用户行为的说法中,错误的是( )。
选项:

A. 用户的隐私安全很难得以规范保护

B. 用户离散的交互痕迹能够为企业提升服务质量提供参考

C. 数字轨迹用完即自动删除

D. 网络公司能够捕捉到用户在其网站上的所有行为
答案: 请关注ybaotk.com搜题查看答案
问题 295: 16. 下列关于计算机存储容量单位的说法中,错误的是( )。
选项:

A. 基本单位是字节(Byte)

B. 一个汉字需要一个字节的存储空间

C. 一个字节能够容纳一个英文字符

D. 1KB<1MB<1GB
答案: 请关注ybaotk.com搜题查看答案
问题 296: 17. 下列关于聚类挖掘技术的说法中,错误的是( )。
选项:

A. 要求同类数据的内容相似度尽可能小

B. 要求不同类数据的内容相似度尽可能小

C. 与分类挖掘技术相似的是,都是要对数据进行分类处理

D. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
答案: 请关注ybaotk.com搜题查看答案
问题 297: 18. 下列国家的大数据发展行动中,集中体现重视基础、首都先行”的国家是( )。
选项:

A. 中国

B. 韩国

C. 美国

D. 日本
答案: 请关注ybaotk.com搜题查看答案
问题 298: 1. 在网络爬虫的爬行策略中,应用最为基础的是( )。
选项:

A. 深度优先遍历策略

B. 大站优先策略

C. 高度优先遍历策略

D. 反向链接策略

E. 广度优先遍历策略
答案: 请关注ybaotk.com搜题查看答案
问题 299: 2. 当前,大数据产业发展的特点是( )。
选项:

A. 多产业交叉融合

B. 规模较大

C. 增速很快

D. 规模较小

E. 增速缓慢
答案: 请关注ybaotk.com搜题查看答案
问题 300: 3. 下列关于数据生命周期管理的核心认识中,正确的是( )。
选项:

A. 数据生命周期管理旨在产生效益的同时,降低生产成本

B. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

C. 在不同的数据存在阶段,数据的价值是不同的

D. 根据数据价值的不同应该对数据采取不同的管理策略

E. 数据生命周期管理最终关注的是社会效益
答案: 请关注ybaotk.com搜题查看答案
问题 301: 4. Spark产生的原因包括
选项:

A. 现有的各种计算框架各自为战

B. Spark只能进行交互式计算

C. MapReduce具有很多的局限性

D. Spark不适合交互式处理
答案: 请关注ybaotk.com搜题查看答案
问题 302: 5. 关于搜索引擎步骤中分词的说法正确的是
选项:

A. 用户的查询和内容的理解都是基于分词

B. 分词的准确性决定了搜索结果的相关性排序

C. 分词的准确性决定了搜索结果是否让用户满意

D. 中文分词的准确性对搜索引擎的结果没有任何影响
答案: 请关注ybaotk.com搜题查看答案
问题 303: 6. 属于社交网络的表达形式()删除
选项:

A. 网论

B. 矩阵论

C. 图论

D. 点阵论
答案: 请关注ybaotk.com搜题查看答案
问题 304: 7. ()是大数据运用的基础。
选项:

A. 数据统计有效性

B. 隐私问题

C. 有用的数据

D. 覆盖率
答案: 请关注ybaotk.com搜题查看答案
问题 305: 8. 移动行业的通用需求:
选项:

A. 终端市场趋势

B. 设备分布

C. 分类应用排行

D. 人群分布
答案: 请关注ybaotk.com搜题查看答案
问题 306: 9. 腾讯大数据营销策略有哪些?
选项:

A. 电商推荐

B. 效果广告

C. 关系链推荐

D. 应用推荐

E. 视频推荐
答案: 请关注ybaotk.com搜题查看答案
问题 307: 10. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( )。
选项:

A. 基于大数据的营销模式比传统营销模式精准性更强

B. 传统营销模式比基于大数据的营销模式针对性更强

C. 传统营销模式比基于大数据的营销模式投入更小

D. 基于大数据的营销模式比传统营销模式实时性更强

E. 传统营销模式比基于大数据的营销模式转化率低
答案: 请关注ybaotk.com搜题查看答案
问题 308: 11. 下列各项表述中正确的有哪些?
选项:

A. 我国中央网络安全和信息化领导小组宣告成立是在2013年。

B. 中央网络安全和信息化领导小组组长是李克强。

C. 我国中央网络安全和信息化领导小组宣告成立是在2014年。

D. 中央网络安全和信息化领导小组组长是习近平。
答案: 请关注ybaotk.com搜题查看答案
问题 309: 12. 贵州发展大数据的八个一”建议包括()。
选项:

A. 引入一批人才、聚集一批创客

B. 谋划一批产业、引进一批项目

C. 制定一个工作计划、建立一个领导机构

D. 培养一批干部、出台一批政策
答案: 请关注ybaotk.com搜题查看答案
问题 310: 13. 云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在、越来越普及,成本越来越低。
选项:

A. 密集式

B. 密闭式

C. 共享式

D. 分布式
答案: 请关注ybaotk.com搜题查看答案
问题 311: 14. 郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?
选项:

A. 农业精准生产控制

B. 农作物病虫害监测

C. 农田环境监测

D. 农作物长势苗情监测
答案: 请关注ybaotk.com搜题查看答案
问题 312: 15. 医疗领域如何利用大数据?
选项:

A. 临床决策支持

B. 个性化医疗

C. 用户行为分析

D. 社保资金安全
答案: 请关注ybaotk.com搜题查看答案
问题 313: 16. 下列关于脏数据的说法中,正确的是( )。
选项:

A. 数据不完整

B. 与实际业务关系不大

C. 格式不规范

D. 意义不明确

E. 编码不统一
答案: 请关注ybaotk.com搜题查看答案
问题 314: 17. 2012年中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。
选项:

A. 市场流通

B. 农业生产经营

C. 文化交流

D. 质量安全控制
答案: 请关注ybaotk.com搜题查看答案
问题 315: 1. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 316: 2. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 317: 3. 在噪声数据中,波动数据比离群点数据偏离整体水平更大。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 318: 4. 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 319: 5. 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 320: 1. ()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库
选项:

A. MAPREDUCE

B. YARN

C. STORM

D. MaHout
答案: 请关注ybaotk.com搜题查看答案
问题 321: 2. 特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()
选项:

A. 越大,越大

B. 越小,越小

C. 越大,越小

D. 越小,越大
答案: 请关注ybaotk.com搜题查看答案
问题 322: 3. RDD中进行count,collect,save等操作属于()
选项:

A. Acter

B. Active

C. Transformation

D. Change
答案: 请关注ybaotk.com搜题查看答案
问题 323: 4. 根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性
选项:

A. 被非重要的页面引用的页面

B. 被多次引用的页面

C. 页面的重要性无法传递

D. 没有被多次引用的页面
答案: 请关注ybaotk.com搜题查看答案
问题 324: 5. Web应用挖掘中最有效而且简单的分析方法是
选项:

A. 结构分析

B. 点击流分析

C. 数据挖掘

D. 内容分析
答案: 请关注ybaotk.com搜题查看答案
问题 325: 6. Hadoop生态系统中,集群的资源管理系统是()
选项:

A. MAPREDUCE

B. STORM

C. YARN

D. HDFS
答案: 请关注ybaotk.com搜题查看答案
问题 326: 7. Hadoop提供的MapReduce的编程方式中,()是最原始的方式
选项:

A. HadoopPipes

B. HadoopStreaming

C. PHP

D. Java
答案: 请关注ybaotk.com搜题查看答案
问题 327: 8. 大数据的起源是( )
选项:

A. 电信

B. 金融

C. 公共管理

D. 互联网
答案: 请关注ybaotk.com搜题查看答案
问题 328: 9. 智慧城市的智慧之源是( )
选项:

A. 大数据

B. 云计算

C. 物联网

D. 数字城市
答案: 请关注ybaotk.com搜题查看答案
问题 329: 10. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系
选项:

A. 因果相关

B. 因果并列

C. 相关因果

D. 并列相关
答案: 请关注ybaotk.com搜题查看答案
问题 330: 11. 下列关于数据交易市场的说法中,错误的是( )
选项:

A. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

B. 数据交易市场是大数据产业发展到一定程度的产物

C. 数据交易市场是大数据资源化的必然产物

D. 商业化的数据交易活动催生了多方参与的第三方数据交市场
答案: 请关注ybaotk.com搜题查看答案
问题 331: 12. 当前大数据技术的基础是由( )首先提出的
选项:

A. 微软

B. 百度

C. 谷歌

D. 阿里巴巴
答案: 请关注ybaotk.com搜题查看答案
问题 332: 13. 下列演示方式中,不属于传统统计图方式的是( )
选项:

A. 柱状图

B. 饼状图

C. 曲线图

D. 网络图
答案: 请关注ybaotk.com搜题查看答案
问题 333: 14. 支撑大数据业务的基础是( )。
选项:

A. 数据人才

B. 数据硬件

C. 数据科学

D. 数据应用
答案: 请关注ybaotk.com搜题查看答案
问题 334: 15. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )
选项:

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高
答案: 请关注ybaotk.com搜题查看答案
问题 335: 16. 下列关于大数据的分析理念的说法中,错误的是( )
选项:

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C. 在分析效果上更追求效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据
答案: 请关注ybaotk.com搜题查看答案
问题 336: 17. 下列关于普查的缺点的说法中,正确的是( )
选项:

A. 对样本的依赖比较强

B. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象

C. 误差不易被控制

D. 评测结果不够稳定
答案: 请关注ybaotk.com搜题查看答案
问题 337: 18. 下列关于聚类挖掘技术的说法中,错误的是( )
选项:

A. 要求不同类数据的内容相似度尽可能小

B. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

C. 要求同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是要对数据进行分类处理
答案: 请关注ybaotk.com搜题查看答案
问题 338: 19. 智慧城市的构建,不包含( )
选项:

A. 云计算

B. 联网监控

C. 数字城市

D. 物联网
答案: 请关注ybaotk.com搜题查看答案
问题 339: 1. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
::多选题::27 、多选 Spark产生的原因包括{
~%50%MapReduce具有很多的局限性
~%-100%Spark不适合交互式处理
~%50%现有的各种计算框架各自为战
~%-100%Spark只能进行交互式计算
}
选项:

A. 打通多源跨域数据

B. 投资入股互联网电商行业

C. 提高分析挖掘能力

D. 自行开发数据产品

E. 实现科学决策与运营
答案: 请关注ybaotk.com搜题查看答案
问题 340: 2. 中国电信把自己的大数据开发分为:
选项:

A. 服务类应用

B. 媒体类应用

C. 广告类应用

D. 商品类应用
答案: 请关注ybaotk.com搜题查看答案
问题 341: 3. 百度大数据的特点有哪些?
选项:

A. 具有大量搜索数据

B. 具有大量网购数据

C. 具有大量移动端数据

D. 具有消费者位置数据
答案: 请关注ybaotk.com搜题查看答案
问题 342: 4. 大数据行业就业三大方向是:
选项:

A. 大数据应用开发类人才

B. 管理大数据的人才

C. 大数据系统研发类人才

D. 大数据分析类人才
答案: 请关注ybaotk.com搜题查看答案
问题 343: 5. 首席数据官CDO需要从哪几个层面推动数据使用机制创新与优化?
选项:

A. 保护

B. 聚合

C. 维护

D. 货币化

E. 利用
答案: 请关注ybaotk.com搜题查看答案
问题 344: 6. 数据再利用的意义在于( )。
选项:

A. 提高社会效益,优化社会管理

B. 利用数据可扩展性拓宽业务领域

C. 实现数据重组的创新价值

D. 优化存储设备,降低设备成本

E. 挖掘数据的潜在价值
答案: 请关注ybaotk.com搜题查看答案
问题 345: 7. 大数据人才整体上需要具备( )等核心知识。
选项:

A. 数学与统计知识

B. 市场运营管理知识

C. 在特定业务领域的知识

D. 计算机相关知识

E. 马克思主义哲学知识
答案: 请关注ybaotk.com搜题查看答案
问题 346: 8. 下列关于大数 据的说法中,错误的是( )。
选项:

A. 大数据的目的在于发现新的知识与洞察并进行科学决策

B. 处理大数据需采用新型计算架构和智能算法等新技术

C. 大数据具有体量大、结构单一、时效性强的特征

D. 大数据的应用注重因果分析而不是相关分析

E. 大数据的应用注重相关分析而不是因果分析
答案: 请关注ybaotk.com搜题查看答案
问题 347: 9. 20世纪中后期至今的媒介革命,以( )的出现为标志。
选项:

A. 数字化

B. 计算机

C. 互联网

D. 自动化
答案: 请关注ybaotk.com搜题查看答案
问题 348: 10. 大数据的应用能够实现一场新的革命,提高综合管理水平的原因是
选项:

A. 从被动反应走向主动预见型管理

B. 从柜台式管理走向全天候管理

C. 从单兵作战走向联合共享型管理

D. 从粗放化管理走向精细化管理
答案: 请关注ybaotk.com搜题查看答案
问题 349: 11. 建立大数据需要设计一个什么样的大型系统?
选项:

A. 能够把应用放到合适的平台上

B. 能够存储数据

C. 能够处理数据

D. 能够开发出相应应用
答案: 请关注ybaotk.com搜题查看答案
问题 350: 12. 大数据的应用能够实现一场新的革命,提高综合管理水平的原因是( )。
选项:

A. 从被动反应走向主动预见型管理

B. 从单兵作战走向联合共享型管理

C. 从柜台式管理走向全天候管理

D. 从粗放化管理走向精细化管理
答案: 请关注ybaotk.com搜题查看答案
问题 351: 13. 下列哪些国家已经将大数据上升为国家战略?
选项:

A. 日本

B. 法国

C. 英国

D. 美国
答案: 请关注ybaotk.com搜题查看答案
问题 352: 14. 以下哪些是数据科学家的职责?
选项:

A. 数据库管理

B. 角色制定

C. 应用问题的解决

D. 建立分析模型

E. 数据分析
答案: 请关注ybaotk.com搜题查看答案
问题 353: 15. 电信运营商大数据整合哪些整体数据?
选项:

A. 固定电话

B. 手机

C. 宽带

D. 流量
答案: 请关注ybaotk.com搜题查看答案
问题 354: 16. 按照涉及自变量的多少,可以将回归分析分为( )。
选项:

A. 多元回归分析

B. 非线性回归分析

C. 线性回归分析

D. 综合回归分析

E. 一元回归分析
答案: 请关注ybaotk.com搜题查看答案
问题 355: 1. 当前社会中,最为突出的大数据环境是( )
选项:

A. 自然资源

B. 互联网

C. 综合国力

D. 物联网
答案: 请关注ybaotk.com搜题查看答案
问题 356: 2. 可以对大数据进行深度分析的平台工具是( )
选项:

A. 传统的机器学习和数据分析肛具

B. 第一代机器学习工具

C. 第二代机器学习工具

D. 未来机器学习工具
答案: 请关注ybaotk.com搜题查看答案
问题 357: 3. 关于大数据在社会综合治理中的作用,以下理解不正确的是( )。
选项:

A. 大数据的运用能够杜绝抗生素的滥用

B. 大数据的运用能够加强交通管理

C. 大数据的运用能够维护社会治安

D. 大数据的运用有利于走群众路线
答案: 请关注ybaotk.com搜题查看答案
问题 358: 4. 关于推荐系统的说法错误的是
选项:

A. 推荐系统的相关技术包括机器学习及数据挖掘算法等

B. 推荐系统的常见表现形式有猜你喜欢、买了又买、精品推荐等

C. 推荐系统的架构为离线计算-在线计算-推荐引擎APP

D. 推荐系统经历了很短的时间形成
答案: 请关注ybaotk.com搜题查看答案
问题 359: 5. 以下关于搜索引擎说法错误的是
选项:

A. 是能依据用户需求查找相应信息的在线搜索系统

B. 是基于web相关技术为基础的

C. 呈现的搜索结果是凌乱无序的

D. 是对网络信息资源进行抓取和采集建立索引数据库
答案: 请关注ybaotk.com搜题查看答案
问题 360: 6. 大数据可能带来( ),但未必能够带来( )。
选项:

A. 准确度;精确度

B. 精确度;多样性

C. 精确度;准确度

D. 多样性;准确度
答案: 请关注ybaotk.com搜题查看答案
问题 361: 7. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:

A. 软件开发工程师

B. 数据分析员

C. 数据管理人员

D. 研究科学家
答案: 请关注ybaotk.com搜题查看答案
问题 362: 8. 以下选项中,不属于信息时代的定律的是( )。
选项:

A. 麦特卡尔夫定律

B. 达律多定律

C. 摩尔定律

D. 吉尔德定律
答案: 请关注ybaotk.com搜题查看答案
问题 363: 9. 第一个提出大数据概念的公司是
选项:

A. 微软公司

B. 脸谱公司

C. 谷歌公司

D. 麦肯锡公司
答案: 请关注ybaotk.com搜题查看答案
问题 364: 10. 以下选项中,不属于大数据对人才能力的要求是
选项:

A. 业务能力

B. IT技术能力

C. 数学统计能力

D. 逻辑思维能力
答案: 请关注ybaotk.com搜题查看答案
问题 365: 11. Web2.0强调()。
选项:

A. 单位

B. 个人

C. 网站

D. 机构
答案: 请关注ybaotk.com搜题查看答案
问题 366: 12. 根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。
选项:

A. 80亿

B. 150亿

C. 50亿

D. 100亿
答案: 请关注ybaotk.com搜题查看答案
问题 367: 13. 大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。
选项:

A. 新一代技术平台

B. 新一代服务业态

C. 新一代信息技术

D. 新一代信息技术和服务业态
答案: 请关注ybaotk.com搜题查看答案
问题 368: 14. 大数据整合要保证各个数据源之间的( )。
选项:

A. 一致性、差异性

B. 一致性、相容性

C. 一致性、协调性

D. 差异性、协调性
答案: 请关注ybaotk.com搜题查看答案
问题 369: 15. 在数据生命周期管理实践中,( )是执行方法。
选项:

A. 数据价值发觉和利用

B. 数据管理和维护

C. 数据应用开发和管理

D. 数据存储和备份规范
答案: 请关注ybaotk.com搜题查看答案
问题 370: 16. 下列国家的大数据发展行动中,集中体现重视基础、首都先行”的国家是( )。
选项:

A. 韩国

B. 中国

C. 日本

D. 美国
答案: 请关注ybaotk.com搜题查看答案
问题 371: 17. 购物篮分析属于( )。
选项:

A. 关联分析

B. 分类与预测

C. 描述性统计

D. 聚类分析
答案: 请关注ybaotk.com搜题查看答案
问题 372: 18. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:

A. 在分析效果上更追究效率而不是绝对精确

B. 在分析方法上更注重相关分析而不是因果分析

C. 在数据基础上倾向于全体数据而不是抽样数据

D. 在数据规模上强调相对数据而不是绝对数据
答案: 请关注ybaotk.com搜题查看答案
问题 373: 19. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:

A. 数据价值密度高

B. 数据处理速度快

C. 数据规模大

D. 数据类型多样
答案: 请关注ybaotk.com搜题查看答案
问题 374: 20. 当前社会中,最为突出的大数据环境是( )。
选项:

A. 物联网

B. 互联网

C. 综合国力

D. 自然资源
答案: 请关注ybaotk.com搜题查看答案
问题 375: 21. 一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证, 这体现了大数据思维维度中的( )
选项:

A. 定量思维

B. 因果思维

C. 相关思维

D. 实验思维
答案: 请关注ybaotk.com搜题查看答案
问题 376: 22. 下列企业中,最有可能成为典型的数据资产动营商的是( )
选项:

A. 电信运营商

B. 互联网企业

C. 物联网企业

D. 云计算企业
答案: 请关注ybaotk.com搜题查看答案
问题 377: 23. 在噪声数据中,波动数据比离群点数据偏离整体水平更大。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 378: 24. 万维网之父是( )。
选项:

A. 斯科特.布朗

B. 蒂姆.伯纳斯-李

C. 彼得.德鲁克

D. 舍恩伯格
答案: 请关注ybaotk.com搜题查看答案
问题 379: 25. 智能健康手环的应用开发,体现了( )的数据采集技术的应用。
选项:

A. API接口

B. 传感器

C. 网络爬虫

D. 统计报表
答案: 请关注ybaotk.com搜题查看答案
问题 380: 26. 智慧城市的构建,不包含( )。
选项:

A. 联网监控

B. 数字城市

C. 物联网

D. 云计算
答案: 请关注ybaotk.com搜题查看答案
问题 381: 27. Mac OS系统的开发者是()。
选项:

A. 微软公司

B. IBM公司

C. 惠普公司

D. 苹果公司
答案: 请关注ybaotk.com搜题查看答案
问题 382: 28. K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:

A. ①③⑤

B. ②④

C. ①③

D. ①②③④⑤
答案: 请关注ybaotk.com搜题查看答案
问题 383: 29. 关于内容深度理解建立索引说法正确的是
选项:

A. 索引分为客观索引和主观索引

B. 客观索引与文档内容有关

C. 内容索引又可以分为单索引和双索引

D. 内容索引与客观因素有很大关系
答案: 请关注ybaotk.com搜题查看答案
问题 384: 30. 中国的网络消费者比线下消费者更( )。
选项:

A. 年老和富裕

B. 年轻和富裕

C. 年老和贫困

D. 年轻和贫困
答案: 请关注ybaotk.com搜题查看答案
问题 385: 31. 大数据获取的个人信息比传统调研获得的个人信息真实性( )。
选项:

A. 更低

B. 相同

C. 不确定

D. 更高
答案: 请关注ybaotk.com搜题查看答案
问题 386: 32. DMP分为( )和( )。
选项:

A. 单一式DMP;多元式DMP

B. 开放式DMP;封闭式DMP

C. 单一式DMP;封闭式DMP

D. 开放式DMP;私有式DMP
答案: 请关注ybaotk.com搜题查看答案
问题 387: 33. 阿里巴巴旗下的数据管理平台,被称为:
选项:

A. 达摩盘

B. 招财宝

C. 蚂蚁花呗

D. 支付宝
答案: 请关注ybaotk.com搜题查看答案
问题 388: 34. 万维网之父是( )。
选项:

A. 蒂姆•伯纳斯-李

B. 彼得•德鲁克

C. 斯科特•布朗

D. 舍恩伯格
答案: 请关注ybaotk.com搜题查看答案
问题 389: 35. 下列论据中,能够支撑大数据无所不能”的观点的是( )。
选项:

A. 个人隐私泄露与信息安全担忧

B. 大数据具有非常高的成本

C. 互联网金融打破了传统的观念和行为

D. 大数据存在泡沫
答案: 请关注ybaotk.com搜题查看答案
问题 390: 36. Spark生态图中,()提供了一个机器学习的算法库
选项:

A. Tachyon

B. SharkSQL

C. MLBaseMachineLearning

D. GraphxGraphParallel
答案: 请关注ybaotk.com搜题查看答案
问题 391: 37. Hive2也被称为Stringer,底层的计算引擎由()替换()
选项:

A. Pig,Tez

B. MapReduce,Tez

C. Tez,Hdfs

D. Tez,MapReduce
答案: 请关注ybaotk.com搜题查看答案
问题 392: 38. 支撑大数据业务的基础是( )。
选项:

A. 数据人才

B. 数据科学

C. 数据硬件

D. 数据应用
答案: 请关注ybaotk.com搜题查看答案
问题 393: 39. 下列关于网络用户行为的说法中,错误的是( )。
选项:

A. 网络公司能够捕捉到用户在其网站上的所有行为

B. 数字轨迹用完即自动删除

C. 用户的隐私安全很难得以规范保护

D. 用户离散的交互痕迹能够为企业提升服务质量提供参考
答案: 请关注ybaotk.com搜题查看答案
问题 394: 40. 下列关于计算机存储容量单位的说法中,错误的是( )。
选项:

A. 一个汉字需要一个字节的存储空间

B. 一个字节能够容纳一个英文字符

C. 基本单位是字节(Byte)

D. 1KB<1MB<1GB
答案: 请关注ybaotk.com搜题查看答案
问题 395: 41. 下列关于聚类挖掘技术的说法中,错误的是( )。
选项:

A. 与分类挖掘技术相似的是,都是要对数据进行分类处理

B. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

C. 要求同类数据的内容相似度尽可能小

D. 要求不同类数据的内容相似度尽可能小
答案: 请关注ybaotk.com搜题查看答案
问题 396: 42. ()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库
选项:

A. MaHout

B. YARN

C. MAPREDUCE

D. STORM
答案: 请关注ybaotk.com搜题查看答案
问题 397: 43. 特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()
选项:

A. 越大,越小

B. 越小,越小

C. 越大,越大

D. 越小,越大
答案: 请关注ybaotk.com搜题查看答案
问题 398: 44. 根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性
选项:

A. 没有被多次引用的页面

B. 页面的重要性无法传递

C. 被非重要的页面引用的页面

D. 被多次引用的页面
答案: 请关注ybaotk.com搜题查看答案
问题 399: 45. Web应用挖掘中最有效而且简单的分析方法是
选项:

A. 点击流分析

B. 结构分析

C. 数据挖掘

D. 内容分析
答案: 请关注ybaotk.com搜题查看答案
问题 400: 46. Hadoop生态系统中,集群的资源管理系统是()
选项:

A. YARN

B. HDFS

C. STORM

D. MAPREDUCE
答案: 请关注ybaotk.com搜题查看答案
问题 401: 47. Hadoop提供的MapReduce的编程方式中,()是最原始的方式
选项:

A. HadoopPipes

B. Java

C. PHP

D. HadoopStreaming
答案: 请关注ybaotk.com搜题查看答案
问题 402: 48. 大数据的起源是( )
选项:

A. 公共管理

B. 金融

C. 电信

D. 互联网
答案: 请关注ybaotk.com搜题查看答案
问题 403: 49. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系
选项:

A. 因果相关

B. 相关因果

C. 并列相关

D. 因果并列
答案: 请关注ybaotk.com搜题查看答案
问题 404: 50. 下列关于数据交易市场的说法中,错误的是( )
选项:

A. 商业化的数据交易活动催生了多方参与的第三方数据交市场

B. 数据交易市场是大数据产业发展到一定程度的产物

C. 数据交易市场是大数据资源化的必然产物

D. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
答案: 请关注ybaotk.com搜题查看答案
问题 405: 51. 当前大数据技术的基础是由( )首先提出的
选项:

A. 阿里巴巴

B. 百度

C. 谷歌

D. 微软
答案: 请关注ybaotk.com搜题查看答案
问题 406: 52. 下列演示方式中,不属于传统统计图方式的是( )
选项:

A. 柱状图

B. 曲线图

C. 网络图

D. 饼状图
答案: 请关注ybaotk.com搜题查看答案
问题 407: 53. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )
选项:

A. 数据价值密度高

B. 数据规模大

C. 数据类型多样

D. 数据处理速度快
答案: 请关注ybaotk.com搜题查看答案
问题 408: 54. 下列关于大数据的分析理念的说法中,错误的是( )
选项:

A. 在分析效果上更追求效率而不是绝对精确

B. 在分析方法上更注重相关分析而不是因果分析

C. 在数据基础上倾向于全体数据而不是抽样数据

D. 在数据规模上强调相对数据而不是绝对数据
答案: 请关注ybaotk.com搜题查看答案
问题 409: 55. 下列关于聚类挖掘技术的说法中,错误的是( )
选项:

A. 要求不同类数据的内容相似度尽可能小

B. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

C. 要求同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是要对数据进行分类处理
答案: 请关注ybaotk.com搜题查看答案
问题 410: 56. 智慧城市的构建,不包含( )
选项:

A. 云计算

B. 联网监控

C. 数字城市

D. 物联网
答案: 请关注ybaotk.com搜题查看答案
问题 411: 57. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
选项:

A. 实现科学决策与运营

B. 打通多源跨域数据

C. 提高分析挖掘能力

D. 投资入股互联网电商行业

E. 自行开发数据产品
答案: 请关注ybaotk.com搜题查看答案
问题 412: 58. 中国电信把自己的大数据开发分为:
选项:

A. 服务类应用

B. 广告类应用

C. 媒体类应用

D. 商品类应用
答案: 请关注ybaotk.com搜题查看答案
问题 413: 59. 百度大数据的特点有哪些?
选项:

A. 具有大量搜索数据

B. 具有消费者位置数据

C. 具有大量网购数据

D. 具有大量移动端数据
答案: 请关注ybaotk.com搜题查看答案
问题 414: 60. 下列各项表述中正确的有哪些?
选项:

A. 我国中央网络安全和信息化领导小组宣告成立是在2013年。

B. 我国中央网络安全和信息化领导小组宣告成立是在2014年。

C. 中央网络安全和信息化领导小组组长是李克强。

D. 中央网络安全和信息化领导小组组长是习近平。
答案: 请关注ybaotk.com搜题查看答案
问题 415: 61. 贵州发展大数据的八个一”建议包括()。
选项:

A. 引入一批人才、聚集一批创客

B. 培养一批干部、出台一批政策

C. 制定一个工作计划、建立一个领导机构

D. 谋划一批产业、引进一批项目
答案: 请关注ybaotk.com搜题查看答案
问题 416: 62. 云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在、越来越普及,成本越来越低。
选项:

A. 共享式

B. 密集式

C. 密闭式

D. 分布式
答案: 请关注ybaotk.com搜题查看答案
问题 417: 63. 零售数据的线上来源包括( )。
选项:

A. 利用大数据对非合作电商的推算

B. 合作电商的数据

C. 产品条目

D. 全渠道覆盖
答案: 请关注ybaotk.com搜题查看答案
问题 418: 64. 贵州发展大数据的顶层设计是要逐步建成三个中心,即()。
选项:

A. 大数据金融中心

B. 大数据服务中心

C. 大数据人才中心

D. 大数据内容中心
答案: 请关注ybaotk.com搜题查看答案
问题 419: 65. 云计算的特点包括以下哪些方面?
选项:

A. 服务可租用

B. 低使用度

C. 高性价比

D. 服务可计算
答案: 请关注ybaotk.com搜题查看答案
问题 420: 66. 根据下图判断是聚类分析的哪种数据源
选项:

A. 距离矩阵

B. 相异度矩阵

C. 二模矩阵

D. 数据矩阵
答案: 请关注ybaotk.com搜题查看答案
问题 421: 67. 数据挖掘面临的问题有哪些
选项:

A. 挖掘方法与用户交互

B. 数据缺失

C. 噪声处理

D. 算法的有效性和可伸缩性
答案: 请关注ybaotk.com搜题查看答案
问题 422: 68. 以下Web信息特点的是
选项:

A. 信息复杂

B. 信息是动态的

C. 信息使用者复杂

D. 垃圾信息特别多

E. 信息量庞大
答案: 请关注ybaotk.com搜题查看答案
问题 423: 69. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )
选项:

A. 能够动态演化事物的变化及变化的规律

B. 能够静态演化事物的变化及变化的规律

C. 能够直观反映成对数据之间的空间关系

D. 能够直观反映多维数据之间的空间关系

E. 提供高性能并行计算技术的强力支撑
答案: 请关注ybaotk.com搜题查看答案
问题 424: 70. 下列关于计算机存储容量单位换算关系的公式中,正确的是( )
选项:

A. 1GB=1024KB

B. 1GB=1012KB

C. 1KB=1024Byte

D. 1KB=1012Byte

E. 1GB=1024MB
答案: 请关注ybaotk.com搜题查看答案
问题 425: 71. 下列各国大数据发展路径的描述中,对应关系正确的是( )
选项:

A. 澳大利亚:原则先行、谨慎发展

B. 印度:以IT外包转型为突破口若悬河

C. 日本:走尖端IT路线

D. 韩国:重视基础、首都先行

E. 英国:视大数据为新的自然资源
答案: 请关注ybaotk.com搜题查看答案
问题 426: 72. 宁家骏委员指出,我国民生领域信息化服务水平显著提升。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 427: 73. 1997年,1GB闪存的价格将近8000美元,现在是25美分。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 428: 74. 在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 429: 75. 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 430: 76. 下列关于云计算和数据库的说法中,错误的是( )
选项:

A. 比抽样调查数据更全面

B. 以为发现新的商业机会提供决策支持

C. 比抽样调查更能反映整个群体的特征与规律

D. 获取足够大的样本数据乃至全体数据非常容易

E. 获取样本的代价很高
答案: 请关注ybaotk.com搜题查看答案
问题 431: 77. 国务院办公厅关于深入实施互联网+流通”行动计划的意见》要求:支持建设农产品流通全程冷链系统。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 432: 78. 移动互联网实现了人人相连、人物相联、物物相连。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 433: 79. 、奥巴马认为,对大数据的占有与控制,反映的是一个国家的核心能力之大小。因此,他已经将大数据上升到国家战略高度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 434: 80. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 435: 81. 当前社会中,最为突出的大数据环境是( )
选项:

A. 互联网

B. 综合国力

C. 自然资源

D. 物联网
答案: 请关注ybaotk.com搜题查看答案
问题 436: 82. 可以对大数据进行深度分析的平台工具是( )
选项:

A. 传统的机器学习和数据分析肛具

B. 第二代机器学习工具

C. 未来机器学习工具

D. 第一代机器学习工具
答案: 请关注ybaotk.com搜题查看答案
问题 437: 83. 关于大数据在社会综合治理中的作用,以下理解不正确的是( )。
选项:

A. 大数据的运用能够杜绝抗生素的滥用

B. 大数据的运用能够加强交通管理

C. 大数据的运用有利于走群众路线

D. 大数据的运用能够维护社会治安
答案: 请关注ybaotk.com搜题查看答案
问题 438: 84. 关于推荐系统的说法错误的是
选项:

A. 推荐系统的常见表现形式有猜你喜欢、买了又买、精品推荐等

B. 推荐系统的相关技术包括机器学习及数据挖掘算法等

C. 推荐系统经历了很短的时间形成

D. 推荐系统的架构为离线计算-在线计算-推荐引擎APP
答案: 请关注ybaotk.com搜题查看答案
问题 439: 85. 以下关于搜索引擎说法错误的是
选项:

A. 是基于web相关技术为基础的

B. 是对网络信息资源进行抓取和采集建立索引数据库

C. 是能依据用户需求查找相应信息的在线搜索系统

D. 呈现的搜索结果是凌乱无序的
答案: 请关注ybaotk.com搜题查看答案
问题 440: 86. 大数据可能带来( ),但未必能够带来( )。
选项:

A. 准确度;精确度

B. 多样性;准确度

C. 精确度;多样性

D. 精确度;准确度
答案: 请关注ybaotk.com搜题查看答案
问题 441: 87. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:

A. 数据分析员

B. 数据管理人员

C. 研究科学家

D. 软件开发工程师
答案: 请关注ybaotk.com搜题查看答案
问题 442: 88. 以下选项中,不属于信息时代的定律的是( )。
选项:

A. 达律多定律

B. 摩尔定律

C. 吉尔德定律

D. 麦特卡尔夫定律
答案: 请关注ybaotk.com搜题查看答案
问题 443: 89. 第一个提出大数据概念的公司是
选项:

A. 谷歌公司

B. 脸谱公司

C. 麦肯锡公司

D. 微软公司
答案: 请关注ybaotk.com搜题查看答案
问题 444: 90. 以下选项中,不属于大数据对人才能力的要求是
选项:

A. IT技术能力

B. 业务能力

C. 数学统计能力

D. 逻辑思维能力
答案: 请关注ybaotk.com搜题查看答案
问题 445: 91. Web2.0强调()。
选项:

A. 个人

B. 机构

C. 单位

D. 网站
答案: 请关注ybaotk.com搜题查看答案
问题 446: 92. 根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。
选项:

A. 80亿

B. 50亿

C. 150亿

D. 100亿
答案: 请关注ybaotk.com搜题查看答案
问题 447: 93. 大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。
选项:

A. 新一代技术平台

B. 新一代信息技术和服务业态

C. 新一代服务业态

D. 新一代信息技术
答案: 请关注ybaotk.com搜题查看答案
问题 448: 94. 大数据整合要保证各个数据源之间的( )。
选项:

A. 差异性、协调性

B. 一致性、相容性

C. 一致性、协调性

D. 一致性、差异性
答案: 请关注ybaotk.com搜题查看答案
问题 449: 95. 在数据生命周期管理实践中,( )是执行方法。
选项:

A. 数据存储和备份规范

B. 数据管理和维护

C. 数据应用开发和管理

D. 数据价值发觉和利用
答案: 请关注ybaotk.com搜题查看答案
问题 450: 96. 下列国家的大数据发展行动中,集中体现重视基础、首都先行”的国家是( )。
选项:

A. 韩国

B. 美国

C. 日本

D. 中国
答案: 请关注ybaotk.com搜题查看答案
问题 451: 97. 购物篮分析属于( )。
选项:

A. 分类与预测

B. 描述性统计

C. 聚类分析

D. 关联分析
答案: 请关注ybaotk.com搜题查看答案
问题 452: 98. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C. 在分析效果上更追究效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据
答案: 请关注ybaotk.com搜题查看答案
问题 453: 99. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:

A. 数据价值密度高

B. 数据处理速度快

C. 数据规模大

D. 数据类型多样
答案: 请关注ybaotk.com搜题查看答案
问题 454: 100. 当前社会中,最为突出的大数据环境是( )。
选项:

A. 物联网

B. 自然资源

C. 互联网

D. 综合国力
答案: 请关注ybaotk.com搜题查看答案
问题 455: 101. 一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证, 这体现了大数据思维维度中的( )
选项:

A. 定量思维

B. 相关思维

C. 实验思维

D. 因果思维
答案: 请关注ybaotk.com搜题查看答案
问题 456: 102. 下列企业中,最有可能成为典型的数据资产动营商的是( )
选项:

A. 云计算企业

B. 电信运营商

C. 物联网企业

D. 互联网企业
答案: 请关注ybaotk.com搜题查看答案
问题 457: 1. 决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 458: 2. 信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 459: 3. 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 460: 4. 简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 461: 5. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案: 请关注ybaotk.com搜题查看答案

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x





上一篇:国开电大标准化理论与方法(gh)(本)作业答案
下一篇:国开电大大学英语1(专)作业答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图