江开江苏开放大学数据采集与预处理第三次形考作业最新答案

内容查看
查看价格30

试题列表
单选题
题型:单选题客观题分值3分难度:一般得分:3
1下列说法错误的是( )
A可以对缺失值进⾏插补
B数据离散化是⼀种数据转换的⽅式
C必须删除异常值
D对数据进⾏标准化,消除量纲的影响
正确答案:C
题型:单选题客观题分值3分难度:一般得分:3
2下列选项中,( )是评价数据质量的核心准则。
A准确性
B完整性
C适用性
D简洁性
正确答案:C
题型:单选题客观题分值3分难度:一般得分:3
3下列选项属于名义型特征的是( )
A半径={7.64,7.44,7.23,7.39}
B成绩={88,92,83,95}
C景点名称={天坛,北海,故宫、⾹⼭}
D质量⽔平={⼀级,⼆级,三级,四级}
正确答案:C
题型:单选题客观题分值3分难度:一般得分:3
4
请阅读下面一段程序:
import numpy as np
import pandas as pd
ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])
ser_obj.sort_values()
执行上述程序后,最终输出的结果为( )。
A
1 NaN
2 6.0
3 5.0
0 4.0
5 2.0
4 -3.0
B
5 2.0
0 4.0
3 5.0
2 6.0
4 -3.0
1 NaN
C
0 4.0
1 NaN
2 6.0
3 5.0
4 -3.0
5 2.0
D
4 -3.0
5 2.0
0 4.0
3 5.0
2 6.0
1 NaN
正确答案:D
题型:单选题客观题分值3分难度:一般得分:3
5下列选项中,可以删除缺失值或空值的是( )。
Aisnull()
Bfillna()
Cnotnull()
Ddropna()
正确答案:D
题型:单选题客观题分值3分难度:一般得分:3
6下列说法中,关于清洗重复值的说法正确的是( )
A清洗重复值的基本思想是“合并”
B清洗重复值的基本思想是“排序”
C清洗重复值的基本思想是“分而合之”
D清洗重复值的基本思想是“排序和合井”
题型:单选题客观题分值3分难度:一般得分:3
7
请阅读下面一段程序:
from pandas import Series
import pandas as pd
from numpy import NaN
series_obj = Series([None, 4, NaN])
pd.isnull(series_obj)
执行上述程序后,最终输出的结果为( )。
A
0 True
1 False
2 True
B
0 True
1 True
2 False
C
0 False
1 True
2 True
D
0 True
1 True
2 True
题型:单选题客观题分值3分难度:一般得分:3
8下列选项表述错误的是( )
A数据清洗包括缺失值处理、异常值处理、数据转换等⼏个⽅⾯
B缺失值最好的处理⽅式是直接删除
C数据的初步处理是对数据进⾏整合、分组等操作
D检测异常值的⽅法可以基于统计、距离、密度、模型等
题型:单选题客观题分值3分难度:一般得分:3
9下列选项中,描述不正确是( )。
Aunstack()方法可以将列索引旋转为行索引
Bmerge()函数可以根据一个或多个键将不同的DataFrame进行合并
Cconcat()函数可以沿着一条轴将多个对象进行堆叠
D可以使用rename()方法对索引进行重命名操作
题型:单选题客观题分值3分难度:一般得分:3
10下列选项中,描述不正确的是( )。
Aconcat()函数可以沿着一条轴将多个对象进行堆叠
B可使用drop_duplicates()方法删除重复数据
C数据清洗的目的是为了提高数据质量
D异常值一定要删除
填空题
题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2
1
stack()方法可以将列索引转换为。
第1空分值:2分
题型:填空题客观题答案不允许乱序分值4分难度:一般得分:4
2
concat()函数的堆叠方式有横向堆叠和,连接方式有内连接和。
第1空分值:2分
第2空分值:2分
题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2
3
常见的数据质量问题主要包括缺失值、以及错误值等问题。
第1空分值:2分
题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2
4
技术是提高数据质量的有效方法。
第1空分值:2分
简答题
题型:简答题主观题分值12分难度:一般得分:12
1请简述数据预处理的常用操作。
题型:简答题主观题分值36分难度:一般得分:36
2
现有如下图所示的两组数据,其中 A组中B列数据存在缺失值,并且该列数据为int类型,B组中的数据均为str类型。接下来,请对这些数据进行以下操作:


(1)使用DataFrame创建这两组数据。
(2)现在需要使用B组中的数据对A组中的缺失值进行填充并保持数据类型一致。
(3)将合并后A组中索引名为key的索引重命名为D。
请将程序写在下面的文本框内。
题型:简答题主观题分值12分难度:一般得分:12
3简述数据清洗的基本流程。

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者
课程作业辅导,点击图片加微信,有偿服务

评论0

请先

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录