智慧树知到答案数据库与数据挖掘最新答案

第一章单元测试

1、多选题：
下列属于关系模型的性质的是()
选项：
A:分量必须取原子值
B:不同列的列名可以相同
C:行列的顺序可以任意交换
D:列是同质的
答案: 【分量必须取原子值;行列的顺序可以任意交换;列是同质的】

2、单选题：
根据实体完整性规则，下列说法正确的是()
选项：
A:主键可以取空值
B:主键可以无意义
C:主键非空
D:非主键字段也必须非空
答案: 【主键非空】

3、单选题：
下列做法最有可能违背用户定义完整性的是()
选项：
A:百分制考试数据出现99
B:姓名数据出现叶良辰
C:时间数据出现0:00
D:日期数据出现2月30日
答案: 【日期数据出现2月30日】

4、单选题：
以下操作应用场景主要是获取两个集合的相对补集的是(）
选项：
A:并操作
B:差操作
C:笛卡尔积
D:交操作
答案: 【差操作】

5、单选题：
从关系R中选择出若干属性组成新的关系属于(）
选项：
A:投影操作
B:选择操作
C:除运算
D:连接操作
答案: 【连接操作】

6、单选题：
ER图中菱形表示的是(）
选项：
A:实体
B:运算
C:属性
D:联系
答案: 【联系】

7、多选题：
系统中的成绩联系属于（）
选项：
A:多对多关系
B:一元联系
C:联系
D:一对多关系
答案: 【多对多关系;联系】

8、单选题：
下列说法错误的是(）
选项：
A:CP原则系统通用性不高
B:AP原则系统不容忍时间延迟
C: CA原则系统扩展性较弱
答案: 【AP原则系统不容忍时间延迟】

9、判断题：
分布式系统可以同时满足CAP原则
选项：
A:对
B:错
答案: 【错】

10、单选题：
下列不属于关系型数据库局限性的是（）
选项：
A:大数据场景下的I/O较高
B:数据格式不完备
C:表结构扩展不方便
D:无法存储数据结构
答案: 【数据格式不完备】

第二章单元测试

1、判断题：
Hive中删除管理表不会删除表所指向的数据文件
选项：
A:错
B:对
答案: 【错】

2、判断题：
Hive会在数据读取时进行数据类型验证
选项：
A:对
B:错
答案: 【对】

3、判断题：
Hive在strict(严格)模式下查询分区表时，WHERE子句必须要加上分区过滤。
选项：
A:对
B:错
答案: 【对】

4、多选题：
下列语句可以显示数据库test中的表名的包括()
选项：
A:SHOW TABLES IN test;
B:USE test;SHOW TABLES;
C:SHOW test.TABLES;
答案: 【SHOW TABLES IN test;;USE test;SHOW TABLES;】

5、判断题：
Hive可以向视图(VIEW)中导入数据。
选项：
A:对
B:错
答案: 【错】

6、单选题：
若分区表test包含的分区字段为(a,b),如何查看分区a=1下的所有分区()
选项：
A:SELECT PARTITIONS FROM test PARTITION(a=1);
B:SELECT b FROM test WHERE a=1;
C:SHOW PARTITIONS test PARTITION(a=1);
答案: 【SHOW PARTITIONS test PARTITION(a=1);】

7、多选题：
以下命令可以查询date_records中约会成功匹配(match=1)次数的是()
选项：
A:SELECT count(*) FROM date_records WHERE match=1;
B:SELECT sum(id) FROM date_records WHERE match=1;
C:SELECT sum(match) FROM date_records;
D:SELECT match FROM date_records WHERE match=1;
答案: 【SELECT count(*) FROM date_records WHERE match=1;;SELECT sum(match) FROM date_records;】

8、判断题：
Hive使用右外连接(RIGHT OUTER JOIN)来连接两张表进行查询时，JOIN操作符右边的表如果没有符合ON后面连接条件的记录时，右边表指定选择的列的值将不会显示。
选项：
A:对
B:错
答案: 【对】

9、判断题：
Hive中使用ORDER BY关键字进行的排序是全局有序的。
选项：
A:对
B:错
答案: 【对】

10、判断题：
UNION ALL既可以合并多个表，也可以用于同一源表的合并。
选项：
A:错
B:对
答案: 【对】

第三章单元测试

1、判断题：
Hive中要尽量把对同一张表的查询任务汇总到一步操作中，以节约计算成本。
选项：
A:对
B:错
答案:

2、单选题：
下列不属于Hadoop常用的压缩解码器的是()
选项：
A:Gzip
B:BZip2
C:Snappy
D:winzip
答案:

3、多选题：
下列压缩编解码器的压缩文件可分割的是（）
选项：
A:LZO
B:BZip2
C:Snappy
D:Gzip
答案:

4、判断题：
BZip2和Gzip的压缩率要高于LZO和Snappy。
选项：
A:错
B:对
答案:

5、单选题：
Hadoop默认的压缩编解码器是()
选项：
A:BZip2
B:winzip
C:Snappy
D:Gzip
答案:

6、单选题：
下列最适合用在中间压缩时的压缩编解码器是()
选项：
A:Snappy
B:winzip
C:Gzip
D:BZip2
答案:

7、单选题：
事务隔离中级别最高的是()
选项：
A:可重复读
B:可串行化
C:读未提交数据
D:读提交数据
答案:

8、单选题：
允许事务读已提交数据属于哪个级别的事务隔离()
选项：
A:可串行化
B:读未提交数据
C:读提交数据
D:可重复读
答案:

9、多选题：
下列与权限管理有关的关键字有()
选项：
A:SELECT
B:REVOKE
C:CREATE
D:GRANT
答案:

第四章单元测试

1、单选题：
下面哪个不是 RDD 的特点
选项：
A:可分区
B:可修改
C:可持久化
D:可序列化
答案:

2、单选题：
Spark 的四大组件下面哪个不是
选项：
A:Spark R
B:Mlib
C:Graphx
D:Spark Streaming
答案:

3、多选题：
Spark 提供的算法包括
选项：
A:聚类
B:回归
C:推荐
D:分类
答案:

4、判断题：
RDD（Resilient Distributed Dataset）叫做分布式数据集，是spark中最基本的数据抽象，它代表一个不可变，可分区，里面的元素可以并行计算的集合
选项：
A:错
B:对
答案:

5、判断题：
Spar提供了两种有限的共享变量：广播变量和累加器
选项：
A:对
B:错
答案:

第五章单元测试

1、单选题：
关于Logistic回归和SVM，以下说法错误的是
选项：
A: Logistic回归的目标函数是最小化后验概率
B:SVM可以有效避免模型过拟合
C:SVM的目标的结构风险最小化
D:Logistic回归可用于预测事件发生概率的大小
答案:

2、单选题：
以下有关特征数据归一化的说法错误的是：
选项：
A:特征数据归一化有可能提高模型的精度
B:线性归一化适用于特征数值分化比较大的情况
C:特征数据归一化加速梯度下降优化的速度
D:概率模型不需要做归一化处理
答案:

3、多选题：
应GradientBoosting tree算法，以下说法正确的是 :
选项：
A:当我们减少训练单个学习器的样本个数，我们可以降低variance
B:当增加最小样本分裂个数，我们可以抵制过拟合
C:当我们减少训练单个学习器的样本个数，我们可以降低bias
D:当增加最小样本分裂个数，会导致过拟合
答案:

4、判断题：
一个机器学习模型，如果有较高准确率，总是说明这个分类器是好的
选项：
A:错
B:对
答案:

5、判断题：
重复两次的5折教程验证需要训练5个模型
选项：
A:错
B:对
答案:

智慧树知到答案数据库与数据挖掘最新答案

第一章单元测试

第二章单元测试

第三章单元测试

第四章单元测试

第五章单元测试

评论0

请先登录！

升级VIP

夜间模式

书店

淘宝店铺

返回顶部

站点公告

第一章 单元测试

第二章 单元测试

第三章 单元测试

第四章 单元测试

第五章 单元测试

猜你喜欢

智慧树知到答案声乐（一）（山东联盟-共享资源）最新答案

智慧树知到答案有机化学（下）（中国药科大学）最新答案

智慧树知到答案组织学与胚胎学-标本观察最新答案

智慧树知到答案人体解剖学（南昌大学版）最新答案

智慧树知到答案内科护理学（山东联盟）2061953最新答案

智慧树知到答案医学遗传学（山东联盟）最新答案

评论0

请先 登录 ！

升级VIP

夜间模式

书店

淘宝店铺

返回顶部

站点公告

社交账号快速登录

社交账号快速注册

社交账号快速登录

第一章单元测试

第二章单元测试

第三章单元测试

第四章单元测试

第五章单元测试

请先登录！