第一章 单元测试
1、单选题:
在数据量单位中,1PB等于( )。
选项:
A:512TB
B:1024TB
C:256TB
D:2048TB
答案: 【1024TB】
2、单选题:
大数据的最终价值体现( )。
选项:
A:
思想
B:
技术
C:
实践
D:
理论
答案: 【
实践
】
3、单选题:
人工智能起源于( )。
选项:
A:40-50年代
B:50-60年代
C:70-80年代
D:60-70年代
答案: 【50-60年代】
4、单选题:
被称为XCON的“专家系统”是由( )发明。
选项:
A:麻省理工学院
B:哈佛大学
C:牛津大学
D:卡内基梅隆大学
答案: 【卡内基梅隆大学】
5、多选题:
大数据具有4V特点包括( )。
选项:
A:多样
B:精确
C:大量
D:高速
E:密度高
答案: 【多样;精确;大量;高速】
6、多选题:
自然语言处理包括( )。
选项:
A:解析
B:翻译
C:编码
D:解码
E:理解
答案: 【编码;解码】
7、判断题:
在大数据时代,经常使用的数据量衡量单位为TB。
选项:
A:对
B:错
答案: 【错】
8、判断题:
模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。
选项:
A:错
B:对
答案: 【对】
9、判断题:
机器学习主要研究如何使计算机能够模拟或实现人类的学习功能。
选项:
A:对
B:错
答案: 【对】
10、判断题:
在分布式人工智能系统中,每一个Agent又是一个全自治系统。
选项:
A:对
B:错
答案: 【错】
第二章 单元测试
1、多选题:
数据的多样性包括( )。
选项:
A:数据表达方式的多样性
B:数据来源的多样性
C:数据内容的多样性
D:数据用途的多样性
E:数据格式的多样性
答案: 【数据来源的多样性;数据用途的多样性;数据格式的多样性】
2、单选题:
最普通也是最常见的数据类型是( )。
选项:
A:音频数据
B:文本
C:图片
D:视频数据
答案: 【文本】
3、单选题:
将不同数据源的数据自动收集到一个装置中是指( )。
选项:
A:数据获取
B:数据存储
C:数据建模
D:数据清洗
答案: 【数据获取】
4、判断题:
数据分析,是指从海量的数据中利用数据挖掘的方法,获取有用的有价值的数据信息。
选项:
A:对
B:错
答案: 【对】
5、多选题:
数据量测方法有( )。
选项:
A:变化地点
B:接触式
C:非接触式
D:定时式
E:变化周期
答案: 【接触式;非接触式】
6、单选题:
直接附加存储的英文缩写是( )。
选项:
A:BAS
B:NAS
C:SAN
D:DAS
答案: 【DAS】
7、多选题:
企业的数据处理大致分为( )。
选项:
A:数据库处理
B:测试性处理
C:分析性处理
D:数据编辑
E:操作性处理
答案: 【分析性处理;操作性处理】
8、多选题:
数据仓库特点包括( )。
选项:
A:面向主题
B:企业范围
C:集成性
D:时变性
E:历史性
答案: 【面向主题;企业范围;集成性;时变性;历史性】
9、多选题:
分箱方法包括( )。
选项:
A:回归
B:等宽分箱法
C:递归
D:等深分箱法
E:用户自定义区间
答案: 【等宽分箱法;等深分箱法;用户自定义区间】
10、多选题:
数据规约的途径包括( )。
选项:
A:样本归约
B:数据采样
C:属性选择
D:特征归约
E:特征值归约
答案: 【数据采样;属性选择】
第三章 单元测试
1、判断题:
学习与发现是指机器的知识学习和规律发现。
选项:
A:对
B:错
答案:
2、多选题:
系统与建造包括( )。
选项:
A:硬/软件体系结构
B:实现语言工具与环境
C:智能系统的分类
D:知识与推理
E:设计方法
答案:
3、判断题:
遗传算法采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。
选项:
A:对
B:错
答案:
4、多选题:
遗传算法的局限性( )。
选项:
A:遗传算法容易出现过早收敛。
B:遗传算法通常的效率比其他传统的优化方法低。
C:编码不规范及编码存在表示的不准确性。
D:单一的遗传算法编码不能全面地将优化问题的约束表示出来。
E:遗传算法对算法的精度、可信度、计算复杂性等方面,还没有有效的定量分析方法。
答案:
5、判断题:
遗传算法在整个进化过程中的遗传操作不是随机的。
选项:
A:对
B:错
答案:
6、单选题:
遗传算法中最常用的一种编码方法( )。
选项:
A:十进制
B:二进制
C:十六进制
D:三十二进制
答案:
7、判断题:
遗传算法中选择操作通过适应度选择优质个体而抛弃劣质个体,体现了“适者生存”的原理。
选项:
A:错
B:对
答案:
8、判断题:
蚁群算法是受自然界中真实蚁群算法的集体觅食行为的启发而发展起来的一种基于群体的模拟进化算法。
选项:
A:错
B:对
答案:
9、多选题:
群智能算法与梯度方法及传统的演化算法相比,其优点在于( )。
选项:
A:以非直接的信息交流方式确保了系统的扩展性
B:对问题定义的连续性无特殊要求
C:算法实现简单
D:无集中控制约束
E:并行分布式算法模型,可充分利用多处理器
答案:
10、单选题:
蚁群算法最早解决的问题是( )。
选项:
A:旅行商问题
B:最大流问题
C:图像识别问题
D:最短路问题
答案:
第四章 单元测试
1、判断题:
关联规则是形如X→Y的蕴涵式,表示通过X可以推导“得到”Y。
选项:
A:对
B:错
答案:
2、单选题:
关联规则A->B的支持度support=P(AB),指的是( )。
选项:
A:
事件A和事件B同时发生的概率。
B:
发生事件A的基础上发生事件B的概率。
C:
事件A发生的概率。
D:
事件B发生的概率。
答案:
3、单选题:
置信度confidence=P(B|A)=P(AB)/P(A),指的是( )。
选项:
A:
事件A和事件B同时发生的概率。
B:
事件B发生的概率。
C:
事件A发生的概率。
D:
发生事件A的基础上发生事件B的概率。
答案:
4、多选题:
关联规则的执行过程包括( )。
选项:
A:
总结分析
B:
对数据进处理
C:
找出所有的频繁项集
D:
对数据进行加工
E:
由频繁项集产生强规则
答案:
5、单选题:
( )采用自底向上的聚类方法,从最底层开始,每一次通过合并最相似的聚类来形成上一层次中的聚类,当全部数据点都合并到一个聚类时或者达到某个终止条件时结束,是大部分层次聚类采用的方法。
选项:
A:分裂的层次聚类
B:基于划分的算法
C:合并的层次聚类
D:基于密度的聚类算法
答案:
6、判断题:
K-Means算法中选择较大的K值可以降低数据的误差,并不会增加过拟合的风险。
选项:
A:错
B:对
答案:
7、单选题:
在降维技术方面,LDA的中文含义是( )。
选项:
A:
主成分分析
B:
特征选择技术
C:
数据压缩技术
D:
线性判别方法
答案:
8、多选题:
LDA降维和PCA降维的不同之处包括( )。
选项:
A:
LDA是有监督的降维方法,而PCA是无监督的降维方法
B:
两者在降维时特征分解的思想不同
C:
LDA除了可以用于降维,还可以用于分类
D:
LDA降维最多降到k-1维,而PCA没有这个限制
E:
LDA选择分类性能最好的投影方向,而PCA选择样本点投影具有最大方差的方向
答案:
9、单选题:
( )方法的思想将子集的选择看作是一个搜索寻优问题,生成不同的组合,对组合进行评价,再与其他的组合进行比较。
选项:
A:Fisher方法
B:Filter方法
C:Wrapper方法
D:LDA方法
答案:
10、单选题:
( )常考虑的是同质弱学习器,相互独立地并行学习这些弱学习器,并按照某种确定性的平均过程将它们组合起来。
选项:
A:boosting
B:bagging
C:stacking
D:wrappering
答案:
第五章 单元测试
1、判断题:
机器学习是深度学习的一个分支。
选项:
A:对
B:错
答案:
2、判断题:
感知机不能解决异或问题。
选项:
A:错
B:对
答案:
3、判断题:
LSTM模型不能应用于自然语言处理。
选项:
A:错
B:对
答案:
4、判断题:
100层以上的网络才叫深度网络。
选项:
A:错
B:对
答案:
5、判断题:
卷积神经网络相邻两层之间只有部分节点相连。
选项:
A:错
B:对
答案:
6、判断题:
感受野是特征图上的一个点对应的输入图上的区域。
选项:
A:对
B:错
答案:
7、判断题:
VGG提出可以通过重复使用简单的基础模块来构建深度模型的思路。
选项:
A:对
B:错
答案:
8、判断题:
深度学习在CV领域的应用包括检测和分割。
选项:
A:对
B:错
答案:
9、判断题:
深度学习无法应用在渔业养殖领域。
选项:
A:对
B:错
答案:
10、判断题:
机器翻译不会取代人工翻译。
选项:
A:错
B:对
答案:
第六章 单元测试
1、单选题:
Hadoop 是一个由( )开发的大数据分布式系统基础架构。
选项:
A:Apache 基金会
B:谷歌
C:苹果
D:IBM
答案:
2、判断题:
Hadoop 是一个数据管理系统,作为数据分析的核心,汇集了结构化和非结构化的数据。
选项:
A:对
B:错
答案:
3、多选题:
通常一个HDFS集群中包含( )。
选项:
A:第二名字节点
B:一个名称节点
C:数据节点
D:若干分枝节点
E:一个主节点
答案:
4、多选题:
名字节点保存源信息的种类有( )。
选项:
A:数据类型
B:文件类型
C:每个文件块的名及文件由哪些块组成
D:文件目录的所有者及其权限
E:文件名目录名及它们之间的层级关系
答案:
5、单选题:
( )角色就是定期的合并元数据信息文件和元数据操作日志。
选项:
A:主节点
B:第2名字节点
C:数据节点
D:名称节点
答案:
6、多选题:
Mapreduce的运行机制,按照时间顺序包括( )。
选项:
A:shuffle阶段
B:reduce阶段
C:combiner阶段
D:输入分片
E:map阶段
答案:
7、单选题:
( )是在服务器集群上搭建Hadoop,更接近真实的生产环境。
选项:
A:单机模式
B:伪分布模式
C:网络模式
D:全分布模式
答案:
8、单选题:
( )是在单机上,模拟一个分布式的环境,具备Hadoop的所有功能。
选项:
A:伪分布模式
B:单机模式
C:全分布模式
D:网络模式
答案:
9、判断题:
使用MapReduce之前不一定要初始化Configuration。
选项:
A:对
B:错
答案:
10、判断题:
使用MapReduce框架时,我们仅仅只是填写map和reduce部分的代码,其他的都交给mapreduce框架来处理。
选项:
A:对
B:错
答案:
评论0