24年秋江苏开放大学数据挖掘技术060734第3次形考作业最新答案

试题列表
单选题
题型：单选题客观题分值2分难度：简单得分：2
1
以下哪个聚类算法不属于基于网格的聚类算法（）。
A
BIRCH
B
MAFIA
C
WaveCluster
D
STING
学生答案：A
老师点评：
题型：单选题客观题分值2分难度：简单得分：2
2
一般，K-NN最近邻方法在（）的情况下效果较好。
A
样本较多但典型性不好
B
样本较少但典型性好
C
样本呈链状分布
D
样本呈团状分布
学生答案：B
老师点评：
题型：单选题客观题分值2分难度：简单得分：2
3
以下哪项关于决策树的说法是错误的（）。
A
决策树算法对于噪声的干扰非常敏感
B
寻找最佳决策树是NP完全问题
C
冗余属性不会对决策树的准确率造成不利的影响
D
子树可能在决策树中重复多次
学生答案：A
老师点评：
题型：单选题客观题分值2分难度：简单得分：2
4
以下哪种技术对于减少数据集的维度会更好（）。
A
删除数据差异较大的列
B
删除缺少值太多的列
C
都不是
D
删除不同数据趋势的列
学生答案：B
老师点评：
题型：单选题客观题分值2分难度：简单得分：2
5
一监狱人脸识别准入系统用来识别对待进入人员的身份，此系统一共包括识别4种不同的人员：狱警，小偷，送餐员，其他。下面哪种学习方法最适合此种应用需求（）。
A
层次聚类问题
B
多分类问题
C
K-中心点聚类问题
D
二分类问题
学生答案：B
老师点评：
题型：单选题客观题分值2分难度：简单得分：2
6
下列哪个描述是正确的（）。
A
回归是无指导的学习，聚类是有指导的学习
B
回归是有指导的学习，聚类是无指导的学习
C
回归和聚类都是有指导的学习
D
回归和聚类都是无指导的学习
题型：单选题客观题分值2分难度：简单得分：2
7
以下哪个分类方法可以较好地避免样本的不平衡问题（）。
A
KNN
B
SVM
C
神经网络
D
Bayes
题型：单选题客观题分值2分难度：一般得分：2
8
决策树中不包含以下哪种节点（）。
A
叶结点
B
内部节点
C
根节点
D
外部节点
题型：单选题客观题分值2分难度：简单得分：2
9
以下哪个算法是分类算法（）。
A
DBSCAN
B
K-Mean
C
EM
D
C4.5
题型：单选题客观题分值2分难度：简单得分：2
10
BIRCH是一种（）。
A
特征选择算法
B
关联分析算法
C
分类器
D
聚类算法
题型：单选题客观题分值2分难度：一般得分：2
11
影响基本K-均值算法的主要因素有（）。
A
样本的数量
B
聚类准则
C
模式相似性测度
D
样本输入顺序
题型：单选题客观题分值2分难度：简单得分：2
12
简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作（）。
A
层次聚类
B
划分聚类
C
非互斥聚类
D
模糊聚类
题型：单选题客观题分值2分难度：中等得分：2
13
下列关于凝聚层次聚类的说法，说法正确的是（）。
A
算法的终止条件是仅剩下一个簇
B
具有全局优化目标函数
C
一旦两个簇合并，该操作还能撤销
D
空间复杂度
题型：单选题客观题分值2分难度：简单得分：2
14
我们想在大数据集上训练决策树，为了使用较少时间，我们可以（）。
A
增加学习率
B
减少树的深度
C
减少树的数量
D
增加树的深度
题型：单选题客观题分值2分难度：简单得分：2
15
以下不属于影响聚类算法结果的主要因素有（）。
A
模式相似性测度
B
特征选取
C
已知类别的样本质量
D
分类准则
题型：单选题客观题分值2分难度：简单得分：2
16
关于欠拟合，下面哪个说法是正确的（）。
A
训练误差较大，测试误差较大
B
训练误差不变，测试误差较大
C
训练误差较小，测试误差较大
D
训练误差较大，测试误差较小
题型：单选题客观题分值2分难度：简单得分：2
17
以下（）算法是关联规则挖掘。
A
ID3
B
K-Means
C
Apriori
D
DBSCAN
题型：单选题客观题分值2分难度：中等得分：2
18
“点击率问题”是这样一个预测问题，99%的人是不会点击的，而1%的人是会点击进去的，所以这是一个非常不平衡的数据集。假设，现在我们已经建了一个模型来分类，而且有了99%的预测准确率，我们可以下的结论是（）。
A
模型预测准确率不高，我们需要做点什么改进模型
B
模型预测准确率已经很高了，我们不需要做什么了
C
无法下结论
D
以上都不对
题型：单选题客观题分值2分难度：一般得分：2
19
关联规则的评价指标是（）。
A
平均绝对误差、相对误差
B
均方误差、均方根误差
C
Kappa统计、显著性检验
D
支持度、置信度
题型：单选题客观题分值2分难度：简单得分：2
20
当分析顾客消费行业，以便有针对性的向其推荐感兴趣的服务，属于什么问题（）。
A
分类
B
聚类
C
主成分分析
D
关联规则
填空题
题型：填空题客观题答案不允许乱序分值10分难度：简单得分：10
1
回归分析的步骤。
第1空分值：2分
第2空分值：2分
第3空分值：2分
第4空分值：2分
第5空分值：2分
题型：填空题客观题答案不允许乱序分值4分难度：简单得分：4
2
层次聚类方法可分为：
第1空分值：2分
第2空分值：2分
题型：填空题客观题答案不允许乱序分值4分难度：简单得分：4
3
分类的基本过程：
第1空分值：2分
第2空分值：2分
题型：填空题客观题答案不允许乱序分值6分难度：简单得分：6
4
支持向量机的3种模型可分为：
第1空分值：2分
第2空分值：2分
第3空分值：2分
题型：填空题客观题答案不允许乱序分值6分难度：简单得分：6
5
惰性学习法主要包括：
第1空分值：2分
第2空分值：2分
第3空分值：2分
简答题
题型：简答题主观题分值12分难度：困难得分：12
1
【案例分析题】
聚类评价指标的计算：某池塘有1400条鲤鱼、300只虾、300只鳖。
1. 现在以捕到鲤鱼为目的，若撒网后捕捉到700条鲤鱼、200只虾、100只鳖，那么评价指标：正确率、召回率和F值分别是多少？
2. 如果把池子里的所有的鲤鱼、虾和鳖都一网打尽，则此时评价指标：正确率、召回率和F值分别是多少？
题型：简答题主观题分值6分难度：简单得分：6
2
阐述统计方法的离群点检测的优缺点。

题型：简答题主观题分值7分难度：简单得分：7
3
简述K-均值算法的基本过程。

题型：简答题主观题分值5分难度：简单得分：5
4
简述基于聚类的方法的目的以及它的特点是什么。

24年秋江苏开放大学数据挖掘技术060734第3次形考作业最新答案

评论0

请先登录！

升级VIP

夜间模式

书店

淘宝店铺

返回顶部

站点公告

猜你喜欢

25年春江苏开放大学污水处理工程060120第二次形考作业最新答案

25年春江苏开放大学制图员实训050103过程性考核作业（三）最新答案

25年春江苏开放大学数控加工工艺规程编制与实施050098过程性考核作业3最新答案

25年春江苏开放大学环境工程制图与CAD060498第三次形考作业最新答案

25年春江苏开放大学机电设备安装与调试050095第四次过程性考核作业（大作业）最新答案

25年春江苏开放大学 计算机绘图员（机械）实训050102过程性作业3最新答案

评论0

请先 登录 ！