24年秋江苏开放大学数据挖掘技术060734第3次形考作业最新答案

资源下载
下载价格30

试题列表
单选题
题型:单选题客观题分值2分难度:简单得分:2
1
以下哪个聚类算法不属于基于网格的聚类算法()。
A
BIRCH
B
MAFIA
C
WaveCluster
D
STING
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
2
一般,K-NN最近邻方法在( )的情况下效果较好。
A
样本较多但典型性不好
B
样本较少但典型性好
C
样本呈链状分布
D
样本呈团状分布
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
3
以下哪项关于决策树的说法是错误的()。
A
决策树算法对于噪声的干扰非常敏感
B
寻找最佳决策树是NP完全问题
C
冗余属性不会对决策树的准确率造成不利的影响
D
子树可能在决策树中重复多次
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
4
以下哪种技术对于减少数据集的维度会更好( )。
A
删除数据差异较大的列
B
删除缺少值太多的列
C
都不是
D
删除不同数据趋势的列
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
5
一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求( )。
A
层次聚类问题
B
多分类问题
C
K-中心点聚类问题
D
二分类问题
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
6
下列哪个描述是正确的( )。
A
回归是无指导的学习,聚类是有指导的学习
B
回归是有指导的学习,聚类是无指导的学习
C
回归和聚类都是有指导的学习
D
回归和聚类都是无指导的学习
题型:单选题客观题分值2分难度:简单得分:2
7
以下哪个分类方法可以较好地避免样本的不平衡问题()。
A
KNN
B
SVM
C
神经网络
D
Bayes
题型:单选题客观题分值2分难度:一般得分:2
8
决策树中不包含以下哪种节点( )。
A
叶结点
B
内部节点
C
根节点
D
外部节点
题型:单选题客观题分值2分难度:简单得分:2
9
以下哪个算法是分类算法()。
A
DBSCAN
B
K-Mean
C
EM
D
C4.5
题型:单选题客观题分值2分难度:简单得分:2
10
BIRCH是一种()。
A
特征选择算法
B
关联分析算法
C
分类器
D
聚类算法
题型:单选题客观题分值2分难度:一般得分:2
11
影响基本K-均值算法的主要因素有( )。
A
样本的数量
B
聚类准则
C
模式相似性测度
D
样本输入顺序
题型:单选题客观题分值2分难度:简单得分:2
12
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
A
层次聚类
B
划分聚类
C
非互斥聚类
D
模糊聚类
题型:单选题客观题分值2分难度:中等得分:2
13
下列关于凝聚层次聚类的说法,说法正确的是( )。
A
算法的终止条件是仅剩下一个簇
B
具有全局优化目标函数
C
一旦两个簇合并,该操作还能撤销
D
空间复杂度
题型:单选题客观题分值2分难度:简单得分:2
14
我们想在大数据集上训练决策树,为了使用较少时间,我们可以( )。
A
增加学习率
B
减少树的深度
C
减少树的数量
D
增加树的深度
题型:单选题客观题分值2分难度:简单得分:2
15
以下不属于影响聚类算法结果的主要因素有( )。
A
模式相似性测度
B
特征选取
C
已知类别的样本质量
D
分类准则
题型:单选题客观题分值2分难度:简单得分:2
16
关于欠拟合,下面哪个说法是正确的( )。
A
训练误差较大,测试误差较大
B
训练误差不变,测试误差较大
C
训练误差较小,测试误差较大
D
训练误差较大,测试误差较小
题型:单选题客观题分值2分难度:简单得分:2
17
以下( )算法是关联规则挖掘。
A
ID3
B
K-Means
C
Apriori
D
DBSCAN
题型:单选题客观题分值2分难度:中等得分:2
18
“点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是( )。
A
模型预测准确率不高,我们需要做点什么改进模型
B
模型预测准确率已经很高了,我们不需要做什么了
C
无法下结论
D
以上都不对
题型:单选题客观题分值2分难度:一般得分:2
19
关联规则的评价指标是( )。
A
平均绝对误差、相对误差
B
均方误差、均方根误差
C
Kappa统计、显著性检验
D
支持度、置信度
题型:单选题客观题分值2分难度:简单得分:2
20
当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题( )。
A
分类
B
聚类
C
主成分分析
D
关联规则
填空题
题型:填空题客观题答案不允许乱序分值10分难度:简单得分:10
1
回归分析的步骤     。
第1空分值:2分
第2空分值:2分
第3空分值:2分
第4空分值:2分
第5空分值:2分
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
2
层次聚类方法可分为:
第1空分值:2分
第2空分值:2分
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
3
分类的基本过程:
第1空分值:2分
第2空分值:2分
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
4
支持向量机的3种模型可分为:
第1空分值:2分
第2空分值:2分
第3空分值:2分
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
5
惰性学习法主要包括:
第1空分值:2分
第2空分值:2分
第3空分值:2分
简答题
题型:简答题主观题分值12分难度:困难得分:12
1
【案例分析题】
聚类评价指标的计算:某池塘有1400条鲤鱼、300只虾、300只鳖。
1. 现在以捕到鲤鱼为目的,若撒网后捕捉到700条鲤鱼、200只虾、100只鳖,那么评价指标:正确率、召回率和F值分别是多少?
2. 如果把池子里的所有的鲤鱼、虾和鳖都一网打尽,则此时评价指标:正确率、召回率和F值分别是多少?
题型:简答题主观题分值6分难度:简单得分:6
2
阐述统计方法的离群点检测的优缺点。

题型:简答题主观题分值7分难度:简单得分:7
3
简述K-均值算法的基本过程。

题型:简答题主观题分值5分难度:简单得分:5
4
简述基于聚类的方法的目的以及它的特点是什么。

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者
课程作业辅导,点击图片加微信,有偿服务

评论0

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录