|
。
形考任务2
试卷总分:100 得分:100
1.1、下列关于为什么要做数据清理描述错误的是( )
A.数据有重复
B.数据有错误
C.数据有缺失
D.数据量太大
2.2、下列关于数据清理描述错误的是( )
A.数据清理能完全解决数据质量差的问题
B.数据清理在数据分析过程中是不可或缺的一个环节
C.数据清理的目的是提高数据质量
D.可以借助Kettle来完成大量的数据清理工作
3.3、下列关于使用参照表清洗数据说法错误的是( )
A.有些数据无法从内部发现错误,需要结合外部的数据进行参照
B.只要方法得当,数据内部是可以发现错误的,不需要借助参照表
C.使用参数表可以校验数据的准确性
D.使用参照表可以处理数据的一致性
4.4、某店铺2019年度会员信息表中,某会员的出生年份是1990年,但年龄却记录为25岁,此类错误需要进行( )。
A.缺失值清洗
B.重复值清洗
C.逻辑值清洗
D.无价值数据清洗
5.5、关于数据清洗的作用,下列说法正确的是( )。
A.去重、补漏、计算
B.去重、补漏、纠错
C.补漏、纠错、计算
D.去重、计算、纠错
6.6、数据清洗时,运营数据中出现“下单时间2088-12-12”,属于( )。
A.缺失值清洗
B.格式内容清洗
C.逻辑错误清洗
D.重复数据清洗
7.7、以下说法错误的是( )
A.数据预处理的主要流程为数据清理、数据集成、数据变换与数据归约
B.数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用
C.冗余数据的删除既是一种数据清理形式,也是一种数据归约
D.整个预处理过程要尽量人机结合,尤其要注重和客户以及专家多交流
8.8、处理噪声的方法一般有( )
A.分箱
B.回归
C.聚类
D.以上都是
9.9、数据集成的过程中需要处理的问题有( )
A.实体识别
B.冗余与相关性分析。
C.数据冲突和检测
D.以上都是
10.10、数据归约的方法有( )
A.维度归约
B.数量归约
C.数据压缩
D.以上都是
11.11、关于数据重塑的说法中,下列选项描述错误的是()。
A.数据重塑可以将DataFrame转换为Series
B.stack()方法可以将列索引转换为行索引
C.对一个DataFrame使用stack()方法后返回的一定是一个Series
D..unstack()方法可以将行索引转换为列索引
12.12.请阅读下面的程序: 执行上述程序后,最终输出的结果为()。
A.0 False1 False2 True
B..0 True1 True2 False
C..0 False1 False2 False
D..0 True1 True2 True
13.13、下列选项中,关于drop_duplicates()方法描述错误的是()。
A.仅支持单一特征数据的去重
B..仅对Series和DataFrame对象有效
C.数据去重时默认保留第一个数据
D.该方法不会改变原始数据排列
14.14、下列选项中,关于dropna()方法描述正确的是()。
A.dropna()方法只会删除值为NaN的数据
B.dropna()方法不会删除值为None的数据
C.dropna()方法会删除值为None和NaN的数据
D.dropna()方法只会检测缺失数据和空值
15.15、下列选项中,关于duplicated()方法描述正确的是()。
A.duplicate()方法用于删除重复值
B.duplicate()方法用于标记重复值
C.duplicate()方法会改变原始数据
D.duplicate()方法会将重复的数据标记为False
16.16、下列选项中,属于数据处理的目的是()
A.使数据更加适用于分析
B.对无意义的数据进行清洗
C.整合数据
D.以上全部
17.17、数据清洗的主要内容包括( )。
A.缺失值清洗
B.格式内容清洗
C.逻辑错误清洗
D.以上全部
18.18、在数据表里,缺失值常见的表现形式是( )。
A.空值
B.错误标识符
C. |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
上一篇:奥鹏_国开(软件学院)24春《电子商务概论》形考作业2【标准答案】下一篇:奥鹏_国开(软件学院)24春《电子商务数据分析与应用》形考作业2【标准答案】
|