江开江苏开放大学数据挖掘技术第2次形考作业最新答案

内容查看
查看价格30

试题列表
单选题
题型:单选题客观题分值2分难度:简单得分:2
1
OLAP技术的核心是( )。
A
对用户的快速响应
B
多维分析
C
在线性
D
互操作性
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
2
数据仓库的三层体系结构不包括( )。
A
前端工具
B
数据仓库服务器
C
SMTP服务器
D
OLAP服务器
正确答案:C
题型:单选题客观题分值2分难度:较难得分:2
3
假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为( )。
A
22.6
B
27.9
C
18.3
D
26.8
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
4
下列哪个不是专门用于可视化时间空间数据的技术:( )
A
矢量场图
B
曲面图
C
饼图
D
等高线图
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
5
数据仓库设计的三级数据模型不包括( )。
A
逻辑模型
B
物理模型
C
数据模型
D
概念模型
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
6
在图集合中发现一组公共子结构,这样的任务称为( )。
A
频繁子图挖掘
B
频繁模式挖掘
C
频繁子集挖掘
D
频繁数据项挖掘
题型:单选题客观题分值2分难度:简单得分:2
7
一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是( )。
A
四年级
B
一年级
C
二年级
D
三年级
题型:单选题客观题分值2分难度:较难得分:2
8
假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为( )。
A
1.224
B
1.458
C
0.716
D
0.821
题型:单选题客观题分值2分难度:简单得分:2
9
在有关数据仓库测试,下列说法不正确的是 ( )。
A
在测试之前没必要制定详细的测试计划
B
在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.
C
当数据仓库的每个单独组件完成后,就需要对他们进行单元测试
D
系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试
题型:单选题客观题分值2分难度:简单得分:2
10
下列哪一个选项是数据立方体中的基本方体的概念( )。
A
最低抽象层创建的立方体
B
每一个数据立方体
C
最高层抽象的立方体
D
不同层创建的数据立方体
题型:单选题客观题分值2分难度:简单得分:2
11
下列哪一项不是数据规范化的常用方法( )。
A
最小-最大值规范化
B
按整数定标规范法
C
按小数定标规范化
D
z-score规范化
题型:单选题客观题分值2分难度:一般得分:2
12
熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是( )。
A
1比特
B
2.6比特
C
3.2比特
D
3.8比特
题型:单选题客观题分值2分难度:一般得分:2
13
设X={1,2,3}是频繁项集,则可由X产生( )个关联规则。
A
6
B
4
C
5
D
7
题型:单选题客观题分值2分难度:简单得分:2
14
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务()。
A
分类和预测
B
频繁模式挖掘
C
数据预处理
D
数据流挖掘
题型:单选题客观题分值2分难度:中等得分:2
15
考虑值集{12 24 33 2 4 55 68 26},其四分位数极差是( )。
A
31
B
3
C
55
D
24
题型:单选题客观题分值2分难度:简单得分:2
16
下面关于数据粒度的描述不正确的是( )。
A
粒度是指数据仓库小数据单元的详细程度和级别
B
数据综合度越高,粒度也就越大,级别也就越高
C
粒度的具体划分将直接影响数据仓库中的数据量以及查询质量
D
数据越详细,粒度就越小,级别也就越高
题型:单选题客观题分值2分难度:简单得分:2
17
下列哪一项不是数据仓库的关键性质( )。
A
与空间相关
B
集成性
C
面向主题
D
与时间相关
题型:单选题客观题分值2分难度:一般得分:2
18
下面( )属于映射数据到新的空间的方法。
A
特征加权
B
傅里叶变换
C
维归约
D
渐进抽样
题型:单选题客观题分值2分难度:简单得分:2
19
有关数据仓库的开发特点,不正确的描述是( )。
A
数据仓库使用的需求在开发出去就要明确
B
数据仓库开发要从数据出发
C
数据仓库的开发是一个不断循环的过程,是启发式的开发
D
在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
题型:单选题客观题分值2分难度:一般得分:2
20
在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是( )。
A
渐进抽样
B
分层抽样
C
无放回的简单随机抽样
D
有放回的简单随机抽样
题型:单选题客观题分值2分难度:一般得分:2
21
数据仓库是随着时间变化的,下面的描述不正确的是( )。
A
数据仓库随事件变化不断删去旧的数据内容
B
数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合
C
数据仓库随时间的变化不断增加新的数据内容
D
捕捉到的新数据会覆盖原来的快照
题型:单选题客观题分值2分难度:一般得分:2
22
频繁项集、频繁闭项集、最大频繁项集之间的关系是( )
A
频繁项集 = 频繁闭项集 最大频繁项集
B
频繁项集 频繁闭项集 =最大频繁项集
C
频繁项集 频繁闭项集 最大频繁项集
D
频繁项集 = 频繁闭项集 = 最大频繁项集
题型:单选题客观题分值2分难度:简单得分:2
23
关于OLAP的特性,下面正确的是 ( )。
(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性
A
(2) (3) (4)
B
(1) (2) (3)
C
(1) (2) (3) (4)
D
(1) (2) (3) (4) (5)
题型:单选题客观题分值2分难度:简单得分:2
24
关于OLAP和OLTP的说法,下列不正确的是( )。
A
OLAP事务量大,但事务内容比较简单且重复率高
B
OLTP面对的是决策人员和高层管理人员
C
OLAP的最终数据来源与OLTP不一样
D
OLTP以应用为核心,是应用驱动的
题型:单选题客观题分值2分难度:简单得分:2
25
关于OLAP和OLTP的区别描述,不正确的是( )。
A
OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的
B
与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务
C
OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同
D
OLAP的特点在于事务量大,但事务内容比较简单且重复率高
题型:单选题客观题分值2分难度:一般得分:2
26
关于基本数据的元数据是指( )。
A
基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息
B
基本元数据包括日志文件和简历执行处理的时序调度信息
C
基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息
D
基本元数据包括与企业相关的管理方面的数据和信息
题型:单选题客观题分值2分难度:中等得分:2
27
未来房价的预测,这种属于数据挖掘的哪类问题( )。
A
关联规则
B
分类
C
聚类
D
回归分析
题型:单选题客观题分值2分难度:简单得分:2
28
概念分层图是( )图。
A
有向无环
B
无向有环
C
无向无环
D
有向有环
题型:单选题客观题分值2分难度:中等得分:2
29
OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是 ( )。
A
OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性
B
由于OLAM的立方体和用于OLAP的立方体有本质的区别
C
OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作
D
基于WEB的OLAM是WEB技术与OLAM技术的结合
题型:单选题客观题分值2分难度:中等得分:2
30
考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。
A
1,2,3,4
B
1,2,3,5
C
1,3,4,5
D
1,2,4,5
填空题
题型:填空题客观题答案不允许乱序分值2分难度:简单得分:2
1
项集包含 或_ 项的集合
第1空分值:1分
第2空分值:1分
题型:填空题客观题答案不允许乱序分值5分难度:简单得分:5
2
相关性分析有
第1空分值:1分
第2空分值:1分
第3空分值:1分
第4空分值:1分
第5空分值:1分
题型:填空题客观题答案不允许乱序分值3分难度:简单得分:3
3
多维数据模型主要分为   。
第1空分值:1分
第2空分值:1分
第3空分值:1分
题型:填空题客观题答案不允许乱序分值2分难度:简单得分:2
4
变量之间的关系可分为
第1空分值:1分
第2空分值:1分
题型:填空题客观题答案不允许乱序分值5分难度:简单得分:5
5
回归分析的步骤     。
第1空分值:1分
第2空分值:1分
第3空分值:1分
第4空分值:1分
第5空分值:1分
简答题
题型:简答题主观题分值10分难度:困难得分:10
1
【案例分析题】
某公司存储员工信息的数据库中表示收入的字段income排序后的值(元)为:900,1000,1300,1600,1600,1900,2000,2400,2600,2900,3000,3600,4000,4600,4900,5000。
1. 按照等深分箱法进行分箱。
2. 按照等宽分箱法进行分箱。
题型:简答题主观题分值6分难度:简单得分:6
2
变量间的确定性关系和非确定性关系分别指的是什么?
题型:简答题主观题分值7分难度:简单得分:7
3
简述数据仓库概念模型与逻辑模型的设计步骤。

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者
课程作业辅导,点击图片加微信,有偿服务

评论0

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录