智慧树知到答案数据库与数据挖掘最新答案

内容查看
查看价格15

第一章 单元测试

1、多选题:
下列属于关系模型的性质的是()
选项:
A:分量必须取原子值
B:不同列的列名可以相同
C:行列的顺序可以任意交换
D:列是同质的
答案: 【分量必须取原子值;行列的顺序可以任意交换;列是同质的】

2、单选题:
根据实体完整性规则,下列说法正确的是()
选项:
A:主键可以取空值
B:主键可以无意义
C:主键非空
D:非主键字段也必须非空
答案: 【主键非空】

3、单选题:
下列做法最有可能违背用户定义完整性的是()
选项:
A:百分制考试数据出现99
B:姓名数据出现叶良辰
C:时间数据出现0:00
D:日期数据出现2月30日
答案: 【日期数据出现2月30日】

4、单选题:
以下操作应用场景主要是获取两个集合的相对补集的是()
选项:
A:并操作
B:差操作
C:笛卡尔积
D:交操作
答案: 【差操作】

5、单选题:
从关系R中选择出若干属性组成新的关系属于()
选项:
A:投影操作
B:选择操作
C:除运算
D:连接操作
答案: 【连接操作】

6、单选题:
ER图中菱形表示的是()
选项:
A:实体
B:运算
C:属性
D:联系
答案: 【联系】

7、多选题:
系统中的成绩联系属于()
选项:
A:多对多关系
B:一元联系
C:联系
D:一对多关系
答案: 【多对多关系;联系】

8、单选题:
下列说法错误的是()
选项:
A:CP原则系统通用性不高
B:AP原则系统不容忍时间延迟
C: CA原则系统扩展性较弱
答案: 【AP原则系统不容忍时间延迟】

9、判断题:
分布式系统可以同时满足CAP原则
选项:
A:对
B:错
答案: 【错】

10、单选题:
下列不属于关系型数据库局限性的是()
选项:
A:大数据场景下的I/O较高
B:数据格式不完备
C:表结构扩展不方便
D:无法存储数据结构
答案: 【数据格式不完备】

第二章 单元测试

1、判断题:
Hive中删除管理表不会删除表所指向的数据文件
选项:
A:错
B:对
答案: 【错】

2、判断题:
Hive会在数据读取时进行数据类型验证
选项:
A:对
B:错
答案: 【对】

3、判断题:
Hive在strict(严格)模式下查询分区表时,WHERE子句必须要加上分区过滤。
选项:
A:对
B:错
答案: 【对】

4、多选题:
下列语句可以显示数据库test中的表名的包括()
选项:
A:SHOW TABLES IN test;
B:USE test;SHOW TABLES;
C:SHOW test.TABLES;
答案: 【SHOW TABLES IN test;;USE test;SHOW TABLES;】

5、判断题:
Hive可以向视图(VIEW)中导入数据。
选项:
A:对
B:错
答案: 【错】

6、单选题:
若分区表test包含的分区字段为(a,b),如何查看分区a=1下的所有分区()
选项:
A:SELECT PARTITIONS FROM test PARTITION(a=1);
B:SELECT b FROM test WHERE a=1;
C:SHOW PARTITIONS test PARTITION(a=1);
答案: 【SHOW PARTITIONS test PARTITION(a=1);】

7、多选题:
以下命令可以查询date_records中约会成功匹配(match=1)次数的是()
选项:
A:SELECT count(*) FROM date_records WHERE match=1;
B:SELECT sum(id) FROM date_records WHERE match=1;
C:SELECT sum(match) FROM date_records;
D:SELECT match FROM date_records WHERE match=1;
答案: 【SELECT count(*) FROM date_records WHERE match=1;;SELECT sum(match) FROM date_records;】

8、判断题:
Hive使用右外连接(RIGHT OUTER JOIN)来连接两张表进行查询时,JOIN操作符右边的表如果没有符合ON后面连接条件的记录时,右边表指定选择的列的值将不会显示。
选项:
A:对
B:错
答案: 【对】

9、判断题:
Hive中使用ORDER BY关键字进行的排序是全局有序的。
选项:
A:对
B:错
答案: 【对】

10、判断题:
UNION ALL既可以合并多个表,也可以用于同一源表的合并。
选项:
A:错
B:对
答案: 【对】

第三章 单元测试

1、判断题:
Hive中要尽量把对同一张表的查询任务汇总到一步操作中,以节约计算成本。
选项:
A:对
B:错
答案:

2、单选题:
下列不属于Hadoop常用的压缩解码器的是()
选项:
A:Gzip
B:BZip2
C:Snappy
D:winzip
答案:

3、多选题:
下列压缩编解码器的压缩文件可分割的是()
选项:
A:LZO
B:BZip2
C:Snappy
D:Gzip
答案:

4、判断题:
BZip2和Gzip的压缩率要高于LZO和Snappy。
选项:
A:错
B:对
答案:

5、单选题:
Hadoop默认的压缩编解码器是()
选项:
A:BZip2
B:winzip
C:Snappy
D:Gzip
答案:

6、单选题:
下列最适合用在中间压缩时的压缩编解码器是()
选项:
A:Snappy
B:winzip
C:Gzip
D:BZip2
答案:

7、单选题:
事务隔离中级别最高的是()
选项:
A:可重复读
B:可串行化
C:读未提交数据
D:读提交数据
答案:

8、单选题:
允许事务读已提交数据属于哪个级别的事务隔离()
选项:
A:可串行化
B:读未提交数据
C:读提交数据
D:可重复读
答案:

9、多选题:
下列与权限管理有关的关键字有()
选项:
A:SELECT
B:REVOKE
C:CREATE
D:GRANT
答案:

第四章 单元测试

1、单选题:
下面哪个不是 RDD 的特点
选项:
A:可分区
B:可修改
C:可持久化
D:可序列化
答案:

2、单选题:
Spark 的四大组件下面哪个不是
选项:
A:Spark R
B:Mlib
C:Graphx
D:Spark Streaming
答案:

3、多选题:
Spark 提供的算法包括
选项:
A:聚类
B:回归
C:推荐
D:分类
答案:

4、判断题:
RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合
选项:
A:错
B:对
答案:

5、判断题:
Spar提供了两种有限的共享变量:广播变量和累加器
选项:
A:对
B:错
答案:

第五章 单元测试

1、单选题:
关于Logistic回归和SVM,以下说法错误的是
选项:
A: Logistic回归的目标函数是最小化后验概率
B:SVM可以有效避免模型过拟合
C:SVM的目标的结构风险最小化
D:Logistic回归可用于预测事件发生概率的大小
答案:

2、单选题:
以下有关特征数据归一化的说法错误的是:
选项:
A:特征数据归一化有可能提高模型的精度
B:线性归一化适用于特征数值分化比较大的情况
C:特征数据归一化加速梯度下降优化的速度
D:概率模型不需要做归一化处理
答案:

3、多选题:
应GradientBoosting tree算法, 以下说法正确的是 :
选项:
A:当我们减少训练单个学习器的样本个数,我们可以降低variance
B:当增加最小样本分裂个数,我们可以抵制过拟合
C:当我们减少训练单个学习器的样本个数,我们可以降低bias
D:当增加最小样本分裂个数,会导致过拟合
答案:

4、判断题:
一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的
选项:
A:错
B:对
答案:

5、判断题:
重复两次的5折教程验证需要训练5个模型
选项:
A:错
B:对
答案:

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者

评论0

请先

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录