商务数据分析形考作业2-0001
试卷总分:100
单项选择题(共20题,共40分)
开始说明:
结束说明:
1.(2分)
数据集{12、21、15、19、17、24、11、25}的平均数是( C)。
A、16
B、17
C、18
D、19
2.(2分)
一组数据为 3、31、15、9、17、24、8、28、(A ),括号中的值是缺失值,可以用平均值( )来代替。
A、17
B、9
C、30
D、28
3.(2分)
某公司2020 年10 月份的利润率是44%, 比上个月的利润率22%提高了(D )。
A、2倍
B、50%
C、22%
D、22 个百分比
4.(2分)
数据集{11,5,10,28,30}的中位数是( A)。
A、11
B、10
C、28
D、5
5.(2分)
Excel中,函数MEDIAN可以用来计算一组数据的(D )。
A、众数
B、几何平均数
C、极差
D、中位数
6.(2分)
数据集{11,5,10,28,30}的极差是( )。
A、19
B、18
C、20
D、25
7.(2分)
数据集{3、31、15、9、17、24、8、28}的中位数是( )。
A、17
B、15
C、16
D、18
8.(2分)
某班一共有40 名学生, 他们向地震灾区捐款的统计数分别是4 人10 元、15 人20 元、10人50 元、5 人100 元、6 人200 元, 则该班级的平均捐款额是( )。
A、76
B、63.5
C、56.5
D、61
9.(2分)
某班级共有50 名学生, 其中女生20 名, 以下叙述正确的是( )。
A、男生占30%
B、女生占20%
C、男女生比例为20∶30
D、男女生比例为3∶2
10.(2分)
某企业2020 年10 月份的销售额比2019 年10 月份增加了5%, 我们就说该企业2020 年10月份的销售额( )增加了5%。
A、同比
B、环比
C、正比
D、反比
11.(2分)
数据集{7,11,5,10,11,13,19,11,10,23,17}的众数是( )。
A、19
B、11
C、10
D、17
12.(2分)
数据集{12、21、15、19、17、24、11、25}的标准差是( )。
A、5.21
B、27.14
C、18
D、14
13.(2分)
以下哪项不是数据集中趋势指标?( )
A、算术平均数
B、几何平均数
C、方差和标准差
D、中位数
14.(2分)
Excel中,可以用来计算一组数据算术平均数的函数是( )。
A、AVEDEV
B、AVERAGE
C、VARA
D、COUNT
15.(2分)
( )主要用于比较性质不同的总体数据的离散程度。
A、方差
B、标准差
C、离散系数
D、极差
16.(2分)
若企业2020 年4 月份的销售额与3 月份相比增加了5%, 我们就说4 月份销售额( )增加了5%。
A、同比
B、环比
C、正比
D、反比
17.(2分)
以下关于方差的论述中, 正确的是( )。
A、一组数据的方差越大, 说明数据的波动幅度越小
B、一组数据的方差越大, 说明数据的波动幅度越大
C、一组数据的方差越大, 说明平均数越大
D、一组数据的方差越大, 说明平均数越具有代表性
18.(2分)
研究动态数列时, 发展速度= 报告期水平/ 基期水平, 发展速度是( )。
A、总量指标
B、平均指标
C、相对指标
D、标志表现
19.(2分)
( )是指对数据集中可能存在的重复数据、缺失数据及异常值进行必要的处理。
A、商务数据统计特征处理
B、商务数据集成
C、商务数据清洗
D、商务数据转换和规约
20.(2分)
( )是指所获得的数据中与平均值的偏差超过两倍标准差的数据。
A、缺失数据
B、异常值
C、冗余数据
D、不一致数据
多项选择题(共14题,共28分)
开始说明:
结束说明:
21.(2分)
商务数据预处理主要包括哪些方法?( )
A、统计特征处理
B、商务数据转换和规约
C、商务数据集成
D、商务数据清洗
22.(2分)
以下属于连续变量的是( )。
A、温度
B、人数
C、体重
D、身高
23.(2分)
关于原始数据存在问题的表现描述错误的是( )。
A、缺失数据:缺少数据或者缺少属性
B、冗余数据:同一主体不同表述
C、异常值:与同属性数据间差异明显
D、不一致数据:全部或部分信息出现多次
24.(2分)
以下哪些选项是异常值处理时可采用的方法?( )
A、参考后续的数据分析模型,选择删除或者保留异常值
B、用一个样本统计量去代替异常值,比如平均值、中位数、众数等
C、分箱法,即通过考察相邻数据的取值对异常值进行平滑处理
D、对数据集构建一个合适的回归分析模型,以回归模型的拟合值代替异常值
25.(2分)
以下属于相对数的是( )。
A、年GDP
B、年总人口
C、年增长率
D、年发展速度
26.(2分)
以下属于推广数据的有( )。
A、直通车转化率
B、展现量
C、点击率
D、转化量
27.(2分)
以下可以进行高级数据分析的软件是( )。
A、SPSS
B、SAS
C、Python
D、R语言
28.(2分)
进行客户数据采集时,可以通过( )等渠道。
A、向数据公司租用或购买
B、向目录营销与直复营销组织购买
C、从工具软件中获得
D、网络调查
29.(2分)
以下属于绝对数的是( )。
A、年GDP
B、年总人口
C、年增长率
D、年发展速度
30.(2分)
可以采用以下哪些方法处理缺失数据?( )
A、用一个样本统计量去代替缺失数据
B、将有缺失数据的记录删除,不参加数据分析
C、随便填充一个数据
D、利用由某些统计模型计算得到的比较合理的值来代替
31.(2分)
以下哪些选项是一手数据的特点?( )
A、客观
B、及时
C、可信
D、收集成本较高
32.(2分)
以下关于商务数据预处理的说法正确的是( )。
A、数据集中缺失值占整体数据的比例很小或者某个数据在多个变量上都有缺失,可以删掉缺失值
B、不一致数据可以进行字段合并
C、异常数据需要回溯数据源,如果来源真实,就不需要修改,但要密切关注
D、将不参与后续分析的变量删掉,或者构造新变量以精简变量个数属于数据转化
33.(2分)
以下属于离散变量的是( )。
A、消费金额
B、消费次数
C、机器台数
D、新客户数
34.(2分)
以下能反映数据集中趋势指标的是( )。
A、加权算术平均数
B、几何平均数
C、标准差
D、调和平均数
判断题(共16题,共32分)
开始说明:
结束说明:
35.(2分)
如果数据本身存在错误,那么即使采用先进的数据分析方法,得到的结果也是错误的,不具备任何参考价值,甚至还会误导决策。
√
×
36.(2分)
方差的平方即为标准差。
√
×
37.(2分)
商务数据规约主要是将数据从一种表示形式变为另一种表示形式,使不同的数据之间具有相同的计算单位或计量方式,以便于比较。
√
×
38.(2分)
定性数据又叫品质数据,分为定距数据和定比数据。
√
×
39.(2分)
极差是各个数据与其均值的离差平方的算术平均数,是测度数据离散程度最重要的指标。
√
×
40.(2分)
数据离散化是指为满足数据分析的需要,将连续型数据转换为离散型数据的过程,数据离散化处理必然会损失部分原始数据中的信息。
√
×
41.(2分)
数据离散程度越小,说明变量的稳定性和均衡性越好。
√
×
42.(2分)
等频离散化是指将连续型变量的取值范围均匀划成 n 等份,且每份的间距相等。
√
×
43.(2分)
在大数据集上进行复杂的数据分析和挖掘需要很长的时间,利用数据规约可以产生更小但保持原数据完整性的新数据集,在规约后的数据集上进行分析和挖掘将更有效率。
√
×
44.(2分)
商务数据集成主要解决多个数据集或不同数据来源中不同结构的原始数据合并导致的数据冗余,以及部分数据不一致的问题。
√
×
45.(2分)
离散数据是指数值只能用自然数或整数单位计算的数据。
√
×
46.(2分)
商务数据转换主要是将数据从一种表示形式变为另一种表示形式,使不同的数据之间具有相同的计算单位或计量方式,以便于比较。
√
×
47.(2分)
一手数据的优点是及时、可信,可以回答二手数据不能回答的具体问题;缺点是主观性强,收集成本高。
√
×
48.(2分)
通过各种渠道收集来的商务数据无须处理,可直接为分析所用。
√
×
49.(2分)
数据离散程度越小,数据的分布越分散,平均数的代表性越好。
√
×
50.(2分)
商务数据规约的意义在于克服无效、错误数据对数据建模造成的影响,提高建模的准确性;大幅缩减数据挖掘所需的时间;降低储存数据的成本。
√
×
浙江电大商务数据分析形考作业2-0001最新答案
随机题搜索:
觉得这篇文章对你有用的话,就打赏一下支持文章作者
评论0