第一章 单元测试
1、单选题:
什么是KDD?
选项:
A:D.动态知识发现
B:B.领域知识发现
C:C.文档知识发现
D:A.数据挖掘与知识发现
答案: 【A.数据挖掘与知识发现】
2、判断题:
数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。
选项:
A:对
B:错
答案: 【对】
3、多选题:
数据挖掘的预测建模任务主要包括哪几大类问题?
选项:
A:模式发现
B:分类
C:回归
D:模式匹配
答案: 【分类;回归】
4、多选题:
以下哪些学科和数据挖掘有密切联系?
选项:
A:矿产挖掘
B:统计
C:计算机组成原理
D:人工智能
答案: 【统计;人工智能】
5、判断题:
离群点可以是合法的数据对象或者值。
选项:
A:对
B:错
答案: 【对】
第二章 单元测试
1、单选题:
下面哪个属于定量的属性类型:
选项:
A:标称
B:序数
C:区间
D:相异
答案: 【区间】
2、单选题:
只有非零值才重要的二元属性被称作:
选项:
A:计数属性
B:非对称的二元属性
C:离散属性
D:对称属性
答案: 【非对称的二元属性】
3、判断题:
定量属性可以是整数值或者是连续值。
选项:
A:错
B:对
答案: 【对】
4、单选题:
中心趋势度量模(mode)是指
选项:
A:最小值
B:数据集中出现频率最高的值
C:最大值
D:算术平均值
答案: 【数据集中出现频率最高的值】
5、多选题:
以下哪些是属于中心趋势的度量
选项:
A:五数概括
B:中位数
C:标准差
D:平均值
答案: 【中位数;平均值】
第三章 单元测试
1、单选题:
数据清洗的方法不包括
选项:
A:一致性检查
B:缺失值处理
C:重复数据记录处理
D:噪声数据清除
答案:
2、单选题:
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?
选项:
A:数据预处理
B:分类和预测
C:噪声检测
D:频繁模式挖掘
答案:
3、单选题:
以下哪项不属于数据规约的方法?
选项:
A:维规约
B:数据迁移
C:数据压缩
D:数值规约
答案:
4、单选题:
大数据预处理的方法不包含以下哪个选项?
选项:
A:数据规约
B:数据采集
C:数据变换
D:数据清洗
答案:
5、判断题:
在噪声数据中,波动数据比离群点数据偏离整体水平更大。
选项:
A:错
B:对
答案:
第四章 单元测试
1、单选题:
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?
选项:
A:分类
B:聚类
C:自然语言处理
D:关联规则发现
答案:
2、判断题:
关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
选项:
A:对
B:错
答案:
3、判断题:
具有较高的支持度的项集具有较高的置信度。
选项:
A:错
B:对
答案:
4、判断题:
给定关联规则A→B,意味着:若A发生,B也会发生。
选项:
A:对
B:错
答案:
5、判断题:
啤酒与尿布的故事是聚类分析的典型实例。
选项:
A:对
B:错
答案:
第五章 单元测试
1、判断题:
分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。
选项:
A:对
B:错
答案:
2、判断题:
决策树方法通常用于关联规则挖掘。
选项:
A:对
B:错
答案:
3、判断题:
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
选项:
A:对
B:错
答案:
4、判断题:
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。
选项:
A:错
B:对
答案:
5、单选题:
下面哪种分类方法是属于统计学的分类方法?
选项:
A: 后向传播分类
B: 贝叶斯分类
C: 基于案例的推理
D: 判定树归纳
答案:
第六章 单元测试
1、判断题:
基于划分方法的聚类都是基于距离来判断数据对象相似度的
选项:
A:错
B:对
答案:
2、判断题:
K-Means聚类过程中计算出的“质心”点是虚拟的。
选项:
A:对
B:错
答案:
3、判断题:
DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目
选项:
A:错
B:对
答案:
4、多选题:
下列属于层次聚类方法的是
选项:
A:K-Means
B:AGNES
C:DBSCAN
D:DIANA
答案:
5、单选题:
衡量离群点的离群因子,计算的是
选项:
A:轮廓系数
B:平均绝对偏差
C:簇间距离
D:簇间距离的加权平均值
答案:
第七章 单元测试
1、单选题:
神经元节点计算什么()
选项:
A:神经元节点先计算激活函数,再计算线性函数(z = Wx + b)
B:神经元节点计算函数g,函数g计算(Wx + b)
C:神经元节点先计算线性函数(z = Wx + b),再计算激活
D:在将输出应用于激活函数之前,神经元节点计算所有特征的平均值
答案:
2、单选题:
在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法知道了神经元准确的权重和偏差,你就可以近似任何函数。实现这个最佳的办法是什么?
选项:
A:都不正确
B:赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
C:随机赋值,祈祷它们是正确的
D:搜索所有权重和偏差的组合,直到得到最佳值
答案:
3、单选题:
梯度下降算法的正确步骤是什么?1.计算预测值和真实值之间的误差 2.迭代跟新,直到找到最佳权重3.把输入传入网络,得到输出值4.初始化随机权重和偏差5.对每一个产生误差的神经元,改变相应的(权重)值以减小误差
选项:
A:1, 2, 3, 4, 5
B:5, 4, 3, 2, 1
C:3, 2, 1, 5, 4
D:4, 3, 1, 5, 2
答案:
4、单选题:
以下什么情况下神经网络模型被称为深度学习模型?
选项:
A:当这是一个图形识别的问题时
B:有维度更高的数据
C:都不正确
D:加入更多层,使神经网络的深度增加
答案:
5、判断题:
卷积神经网络可以对一个输入完成不同种类的变换(旋转或缩放),这个表述正确吗?
选项:
A:对
B:错
答案:
请先
!