试题列表
单选题
题型:单选题客观题分值2分难度:中等得分:2
1
下列关于凝聚层次聚类的说法,说法正确的是( )。
A
算法的终止条件是仅剩下一个簇
B
空间复杂度
C
具有全局优化目标函数
D
一旦两个簇合并,该操作还能撤销
正确答案:A
题型:单选题客观题分值2分难度:一般得分:2
2
决策树中不包含以下哪种节点( )。
A
内部节点
B
根节点
C
外部节点
D
叶结点
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
3
以下哪种技术对于减少数据集的维度会更好( )。
A
删除不同数据趋势的列
B
删除数据差异较大的列
C
删除缺少值太多的列
D
都不是
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
4
以下哪个聚类算法不属于基于网格的聚类算法()。
A
WaveCluster
B
BIRCH
C
MAFIA
D
STING
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
5
以下哪个算法是分类算法()。
A
EM
B
DBSCAN
C
C4.5
D
K-Mean
正确答案:C
题型:单选题客观题分值2分难度:一般得分:2
6
关联规则的评价指标是( )。
A
均方误差、均方根误差
B
Kappa统计、显著性检验
C
支持度、置信度
D
平均绝对误差、相对误差
题型:单选题客观题分值2分难度:简单得分:2
7
以下哪项关于决策树的说法是错误的()。
A
寻找最佳决策树是NP完全问题
B
冗余属性不会对决策树的准确率造成不利的影响
C
子树可能在决策树中重复多次
D
决策树算法对于噪声的干扰非常敏感
题型:单选题客观题分值2分难度:简单得分:2
8
一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求( )。
A
K-中心点聚类问题
B
二分类问题
C
多分类问题
D
层次聚类问题
题型:单选题客观题分值2分难度:简单得分:2
9
以下哪个分类方法可以较好地避免样本的不平衡问题()。
A
Bayes
B
神经网络
C
KNN
D
SVM
题型:单选题客观题分值2分难度:中等得分:2
10
“点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是( )。
A
模型预测准确率已经很高了,我们不需要做什么了
B
模型预测准确率不高,我们需要做点什么改进模型
C
以上都不对
D
无法下结论
题型:单选题客观题分值2分难度:简单得分:2
11
关于欠拟合,下面哪个说法是正确的( )。
A
训练误差较小,测试误差较大
B
训练误差较大,测试误差较大
C
训练误差较大,测试误差较小
D
训练误差不变,测试误差较大
题型:单选题客观题分值2分难度:简单得分:2
12
我们想在大数据集上训练决策树,为了使用较少时间,我们可以( )。
A
增加学习率
B
减少树的深度
C
增加树的深度
D
减少树的数量
题型:单选题客观题分值2分难度:一般得分:2
13
影响基本K-均值算法的主要因素有( )。
A
聚类准则
B
样本的数量
C
模式相似性测度
D
样本输入顺序
题型:单选题客观题分值2分难度:简单得分:2
14
一般,K-NN最近邻方法在( )的情况下效果较好。
A
样本较少但典型性好
B
样本呈团状分布
C
样本较多但典型性不好
D
样本呈链状分布
题型:单选题客观题分值2分难度:简单得分:2
15
当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题( )。
A
主成分分析
B
聚类
C
关联规则
D
分类
题型:单选题客观题分值2分难度:简单得分:2
16
下列哪个描述是正确的( )。
A
回归是无指导的学习,聚类是有指导的学习
B
回归是有指导的学习,聚类是无指导的学习
C
回归和聚类都是无指导的学习
D
回归和聚类都是有指导的学习
题型:单选题客观题分值2分难度:简单得分:2
17
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
A
模糊聚类
B
划分聚类
C
非互斥聚类
D
层次聚类
题型:单选题客观题分值2分难度:简单得分:2
18
BIRCH是一种()。
A
特征选择算法
B
关联分析算法
C
分类器
D
聚类算法
题型:单选题客观题分值2分难度:简单得分:2
19
以下不属于影响聚类算法结果的主要因素有( )。
A
分类准则
B
模式相似性测度
C
已知类别的样本质量
D
特征选取
题型:单选题客观题分值2分难度:简单得分:2
20
以下( )算法是关联规则挖掘。
A
K-Means
B
ID3
C
Apriori
D
DBSCAN
填空题
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
1
支持向量机的3种模型可分为:
第1空分值:2分
第2空分值:2分
第3空分值:2分
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
2
层次聚类方法可分为:
第1空分值:2分
第2空分值:2分
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
3
惰性学习法主要包括:
第1空分值:2分
第2空分值:2分
第3空分值:2分
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
4
分类的基本过程:
第1空分值:2分
第2空分值:2分
题型:填空题客观题答案不允许乱序分值10分难度:简单得分:10
5
回归分析的步骤 。
第1空分值:2分
第2空分值:2分
第3空分值:2分
第4空分值:2分
第5空分值:2分
简答题
题型:简答题主观题分值7分难度:简单得分:7
1
简述K-均值算法的基本过程。
题型:简答题主观题分值6分难度:简单得分:6
2
阐述统计方法的离群点检测的优缺点。
题型:简答题主观题分值5分难度:简单得分:5
3
简述基于聚类的方法的目的以及它的特点是什么。
题型:简答题主观题分值12分难度:困难得分:12
4
【案例分析题】
聚类评价指标的计算:某池塘有1400条鲤鱼、300只虾、300只鳖。
1. 现在以捕到鲤鱼为目的,若撒网后捕捉到700条鲤鱼、200只虾、100只鳖,那么评价指标:正确率、召回率和F值分别是多少?
2. 如果把池子里的所有的鲤鱼、虾和鳖都一网打尽,则此时评价指标:正确率、召回率和F值分别是多少?
江开江苏开放大学数据挖掘技术第3次形考作业最新答案
觉得这篇文章对你有用的话,就打赏一下支持文章作者
评论0