试题列表
单选题
题型:单选题客观题分值4分难度:简单得分:4
1
下列关于数据治理的表述错误的是()
A
在数据治理中,数据标准模块主要负责确保隐私、保密性和适当的访问权限等
B
数据治理可理解为对数据管理的管理
C
数据质量管理是数据治理核心模块之一,影响数据资产的应用价值
D
数据治理关注组织架构、制度、流程这些管理要素的整合和执行
正确答案:A
题型:单选题客观题分值4分难度:中等得分:4
2
下面哪一种情况属于违反了“属性违反唯一性”原则,比如主键的取值同一个值出现多次,那么这个就是违背了这个唯一性的问题,同一个主键是指同一个数据对象,比如说如果是居民管理系统,身份证号是唯一的识别主体对象的标志,那么同一个身份证号指的是同一个人,它只能出现一次,不能出现多次,不能是多个人共用一个身份证号,这个就违反了唯一性。
A
把电子邮件信息录入到身份证号码字段中了
B
身份证号码为12位
C
在数据库中,有两条记录所有的字段内容都完全一样
D
有多个人的身份证号码相同
正确答案:D
题型:单选题客观题分值4分难度:简单得分:4
3
下列选项中关于异常值处理叙述错误的是()
A
欺诈检验中,若异常值存在,应将其删除
B
若确定异常值对分析的影响是负面的,删除异常值是最简便的方法
C
并不是所有的异常值都是无意义的,部分数据工作就是围绕异常值
D
可将异常值视为缺失值处理
正确答案:A
题型:单选题客观题分值4分难度:简单得分:4
4
我们对性别字段(取值为“M”,“F”和“unknown”)进行编码:
gender={“M”, “F”, “unknown”} ——> gender={0,1,2}
上述使用的特征编码类型是( )
A
变量编码
B
One-Hot编码
C
数值编码
D
哑变量编码
正确答案:C
题型:单选题客观题分值4分难度:简单得分:4
5
在Python中,Pandas模块中的 qcut() 方法可以用于( )
A
等频离散化
B
标准化
C
二值化
D
等距离散化
正确答案:A
多选题
题型:多选题客观题分值6分难度:简单得分:6
1
下列关于填补法的表述错误的是()
A
当列特征前后取值有关联时,可采用向前填充、向后填充
B
若数据集中某一样本或者特征缺失不多,可用特定值替代缺失值
C
当列特征是离散值时,应采用平均数填充、中位数填充、回归模型填充
D
当列特征是连续值时,应采用列特征的众数填充
题型:多选题客观题分值6分难度:简单得分:6
2
下列选项属于判断异常值的方法的是()
A
线性回归
B
箱线图
C
散点图
D
3σ法则
题型:多选题客观题分值6分难度:一般得分:6
3
数据采集主要的方法有( )
A
传感器采集方法
B
实验方法
C
人工采集的方法
D
系统日志采集方法
E
网络爬虫采集方法
题型:多选题客观题分值6分难度:简单得分:6
4
下列哪些因素会影响数据的质量()
A
流程因素
B
信息因素
C
管理因素
D
技术因素
题型:多选题客观题分值6分难度:简单得分:6
5
数据稽核主要是指对数据质量评估标准的哪些指标进行检查()
A
完整性
B
及时性
C
准确性
D
一致性
题型:多选题客观题分值6分难度:简单得分:6
6
下列选项属于数据缺失机制类型的有()
A
连续随机缺失
B
非随机缺失
C
完全随机缺失
D
随机缺失
题型:多选题客观题分值6分难度:简单得分:6
7
下列选项属于数据离散化方法的是( )
A
二值化
B
等距法
C
等频法
D
映射法
题型:多选题客观题分值6分难度:简单得分:6
8
下列哪些选项属于数据治理的目标()
A
提高数据质量
B
保证数据安全
C
从数据中获取最优的价值
D
实现数据资源在各组织机构部⻔的共享
填空题
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
1
对于缺失值我们有三种处理方法: 、 和 。
第1空分值:2分
第2空分值:2分
第3空分值:2分
题型:填空题客观题答案允许乱序分值6分难度:一般得分:6
2
数据治理(data governance)是指将数据视为企业资产,对数据进行 、 和 ,并对组织内的人员、流程、技术和策略进行编排,是对数据的全生命周期管理。
第1空分值:2分
第2空分值:2分
第3空分值:2分
题型:填空题客观题答案允许乱序分值4分难度:一般得分:4
3
数据治理的目标是提高 ,保证 ,实现数据资源在各组织机构部门的共享,从企业数据中获取最优的价值。
第1空分值:2分
第2空分值:2分
题型:填空题客观题答案允许乱序分值4分难度:简单得分:4
4
关系型数据库就是指采用了 结构来组织数据的数据库,它以行和列的形式来存储数据。
第1空分值:4分
题型:填空题客观题答案允许乱序分值6分难度:一般得分:6
5
影响数据质量的因素主要包括 、 、 和管理因素。
第1空分值:2分
第2空分值:2分
第3空分值:2分
题型:填空题客观题答案允许乱序分值6分难度:简单得分:6
6
数据管理它的意义就在于,从大量原始的数据中 、 出对人们有价值的信息,然后再利用这些信息作为行动和 的依据。
第1空分值:2分
第2空分值:2分
第3空分值:2分
江开江苏开放大学数据科学导论形考作业二:第二、三、四单元自测练习最新答案
觉得这篇文章对你有用的话,就打赏一下支持文章作者
评论0