智慧树知到答案数据科学导论(山东联盟)最新答案

内容查看
查看价格15

第一章 单元测试

1、判断题:
数据和数值是同一个事物的不同提法
选项:
A:对
B:错
答案: 【错】

2、判断题:
大数据中的某个成员小数据可能“没什么用(无价值)”,但由这些“小数据”组成的大数据会“很有用(有价值)”。
选项:
A:错
B:对
答案: 【对】

3、判断题:
从理论体系看,数据科学主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数据产品开发。
选项:
A:错
B:对
答案: 【对】

4、多选题:
数据产品开发是数据科学的重要研究任务之一,关于数据产品开发正确的叙述()。
选项:
A:数据产品开发更加强调的是数据加工的增值活动。
B:数据科学的学习目的之一是提升自己的数据产品开发能力。
C:数据产品开发具有以数据为中心、多样性、层次性和增值性等特征。
D:数据产品开发能力也是数据科学家的核心竞争力。
答案: 【数据产品开发更加强调的是数据加工的增值活动。;数据科学的学习目的之一是提升自己的数据产品开发能力。;数据产品开发具有以数据为中心、多样性、层次性和增值性等特征。;数据产品开发能力也是数据科学家的核心竞争力。】

5、多选题:
数据科学方法论是指( )
选项:
A:基于知识解决问题.
B:根据问题找“数据”,并直接用数据解决问题.
C:从“大量数据”中总结和提炼出一般性知识之后,用知识去解决问题。
D:基于数据解决问题.
答案: 【根据问题找“数据”,并直接用数据解决问题.;基于数据解决问题.】

6、多选题:
关于数据科学的叙述正确的是()
选项:
A:数据科学以揭示“大数据” 的内容、形态、规律为核心内容。
B:数据科学需要解决的终极问题是将大数据放在一个完整的生态系统之中去认识与利用,建设“数据生态系统”。
C:数据学科是一门实践性极强的学科。
D:数据科学的研究和应用超出技术范畴,还涉及到发展战略、基础设施、人力资源、政策、法律与文化环境等诸多因素。
答案: 【数据科学以揭示“大数据” 的内容、形态、规律为核心内容。;数据科学需要解决的终极问题是将大数据放在一个完整的生态系统之中去认识与利用,建设“数据生态系统”。;数据学科是一门实践性极强的学科。;数据科学的研究和应用超出技术范畴,还涉及到发展战略、基础设施、人力资源、政策、法律与文化环境等诸多因素。】

7、多选题:
数据加工的目的包括()。
选项:
A:提升数据处理的准确性
B:降低数据计算的复杂度
C:提升数据质量
D:提升数据计算量
答案: 【提升数据处理的准确性;降低数据计算的复杂度;提升数据质量】

8、单选题:
在大数据时代,人们对数据的认识与研究视角是()。
选项:
A:数据能为我做什么
B:如何降低计算复杂度
C:如何设计算法和模型
D:我能为数据做什么
答案: 【数据能为我做什么】

9、单选题:
“只要拥有足够多的数据,我们可以变得更聪明”是大数据时代的一个新认识。在大数据时代,原本复杂的“智能问题”变成简单的“数据问题”,描述了数据科学的()。
选项:
A:三世界原则
B:从简原则
C:数据复杂性原则
D:三要素原则
答案: 【从简原则】

10、单选题:
数据科学强调的是“用数据直接解决问题”,当数据量足够大时,通过简单的“数据洞见( Data Insight)”操作,找出并评估历史数据中已存在的答案。这体现了数据科学中的()。
选项:
A:知识范式原则
B:数据范式原则
C:数据复杂性原则
D:协同原则
答案: 【数据范式原则】

第二章 单元测试

1、多选题:
关于机器学习与统计学如下描述正确的是()
选项:
A:机器学习更关注的是“可解释性”,侧重“模型”。
B:统计学需要事先对处理对象的概率分布做出假定(如正态分布等)
C:机器学习不需要对处理对象的概率分布做事先假定
D:统计学通过各种统计指标来评价统计模型的拟合优度
答案: 【统计学需要事先对处理对象的概率分布做出假定(如正态分布等);机器学习不需要对处理对象的概率分布做事先假定;统计学通过各种统计指标来评价统计模型的拟合优度】

2、判断题:
从学科定位看,数据科学处于数学与统计知识、黑客精神与技能和领域实务知识三大领域的重叠之处。
选项:
A:错
B:对
答案: 【对】

3、判断题:
大数据时代的分析数据的思维方式是探求难以捉摸的因果关系。
选项:
A:对
B:错
答案: 【错】

4、多选题:
关于机器学习正确的叙述是( )
选项:
A:机器学习是一个系统自我改进的过程。
B:机器学习是一种能够赋予机器学习的能力,以此让系统完成直接编程无法完成的功能的方法。
C:机器学习是指计算机能模拟人的学习行为,通过学习获取知识和技能,不断改善性能,实现自我完善。
D:机器学习的主要议题是如何实现和优化机器的自我学习
答案: 【机器学习是一个系统自我改进的过程。;机器学习是一种能够赋予机器学习的能力,以此让系统完成直接编程无法完成的功能的方法。;机器学习是指计算机能模拟人的学习行为,通过学习获取知识和技能,不断改善性能,实现自我完善。;机器学习的主要议题是如何实现和优化机器的自我学习】

5、判断题:
机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
选项:
A:错
B:对
答案: 【对】

6、判断题:
将训练集随机等分为若干份,并选择其中的一份为测试集,其余作为训练集进行训练,然后将目标函数在该测试集上进行测试,最后用结果来评价其参数设置的性能。这种方法用来解决维度灾难的问题。
选项:
A:错
B:对
答案: 【错】

7、多选题:
关于KNN算法的叙述正确的是()
选项:
A:算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。
B:计算特征之间的相似度的方法有很多,最基本且最常用的方法就是距离法。
C:算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。
D:K值是分类的类别值。
答案: 【算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。;计算特征之间的相似度的方法有很多,最基本且最常用的方法就是距离法。;算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。】

8、单选题:
K-Means 算法聚类的原始数据集假如有150个对象,选择3个对象作为初始聚类中心对象,那么k值是
选项:
A:50
B:3
C:150
D:5
答案: 【3】

9、判断题:
KNN算法是一种无监督机器学习算法。
选项:
A:错
B:对
答案: 【错】

10、判断题:
K-means算法是一种无监督机器学习算法。
选项:
A:对
B:错
答案: 【对】

 

第三章 单元测试

1、判断题:
数据科学项目中的数据工程师负责管理软硬件系统和基础设施。
选项:
A:对
B:错
答案:

2、多选题:
数据故事化描述正确的是()。
选项:
A:提升数据的可体验性
B:将数据还原成关联至特定的情境的过程
C:提升数据的可记忆性
D:易于数据洞见
答案:

3、单选题:
显示数据点在坐标系中的分布情况,对应的纵/横坐标代表的是该数据在对应维度上的属性值,这种数据可视化的统计图表是()。
选项:
A:维恩图
B:等值线
C:散点图
D:饼图
答案:

4、判断题:
数据可视化是将数据映射成符合用户视觉感知的可见视图的过程。
选项:
A:错
B:对
答案:

5、多选题:
数据科学流程中的关键活动包括()?
选项:
A:数据审计
B:数据分析
C:数据可视化
D:数据加工
答案:

6、单选题:
利用当前数据或过去数据,还会综合考虑期望结果、环境和资源条件等更多影响因素,对比所有可能方案基础上,提出可用于决策的建议和方案,是()数据分析类型
选项:
A:规范性分析
B:描述性分析
C:推断性分析
D:预测性分析
答案:

7、多选题:
在机器学习算法/统计模型的设计与应用的基础上,采用()方法将数据分析的结果展示给最终用户。
选项:
A:数据故事描述
B:数据可视化
C:数据类产品的提供
D:信息类产品的提供
答案:

8、多选题:
智慧类产品包括()。
选项:
A:决策支持
B:数据洞见
C:数据业务化
D:数据驱动
答案:

9、判断题:
数据审计、数据清洗、数据变换、数据集成等数据预处理活动并不一定存在互斥关系,多个活动在内涵和外延存在一定的重叠关系,在一项预处理任务中可能采用多种加工方法。
选项:
A:对
B:错
答案:

10、判断题:
预定义审计的前提条件来源数据带有自描述性信息。
选项:
A:错
B:对
答案:

第四章 单元测试

1、单选题:
R程序包安装可以使用()函数。
选项:
A:install.package()
B:install()
C:library()
D:install.packages()
答案:

2、单选题:
R语言默认目录可以用( )找到。
选项:
A:setwd( )
B:sep()
C:c()
D:getwd()
答案:

3、单选题:
R 中最简单的数据类型是()。
选项:
A:矩阵
B:数据框
C:数组
D:向量
答案:

4、判断题:
列表(List)是 R 中最复杂的数据类型,可包含任何类型的数据,包括向量、矩阵、数组、数据框,还可嵌套包含其他列表,各成分的元素性质与长度可不统一。
选项:
A:对
B:错
答案:

5、多选题:
R语言中使用()函数可以完成数组创建
选项:
A:array()
B:rep()
C:matrix()
D:dim()
答案:

6、多选题:
data1<-read.table(“d:/t.test.data.txt”,header=T)
上述函数中参数header=T,设定的是()。
选项:
A:header参数设定没有带有表头
B:header参数设定带有文件名
C:设定带有表头,第一行为向量名
D:可以省略
答案:

7、单选题:
将对象合并入向量使用哪个函数?
选项:
A:c()
B:sum()
C:dim()
D:mean()
答案:

8、单选题:
x1<- 9:7
y1<- 2:4
c(x1,y1)
执行结果:()
选项:
A:9 7 2 4
B:9 2 8 3 7 4
C:1 1 1 1 1 1
D:9 8 7 2 3 4
答案:

9、单选题:
x1<- 9:7
y1<- 2:4
rep(x1,y1)执行结果()
选项:
A:2 3 4 2 3 4 2 3 4
B:9 8 7 9 8 7 9 8 7
C:9 9 8 8 8 7 7 7 7
D:9 8 7 2 3 4 9 8 7
答案:

10、单选题:
向量data1中保存如下值:2,5,7,6,5,3,1,6,8,1,6,9,4,3,7,8,4。哪个命令用于找出25%分位数。
选项:
A:Quantile(data1,0.25)
B:quantile(data1,100)0.25
C:quantile(data1,25%)
D:quantile(data1)0.25
答案:

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者

评论0

请先

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录