江苏开放大学数据采集与预处理060749第1单元测试最新答案

试题列表
单选题
题型：单选题客观题分值3分难度：一般得分：3
1爬虫是手动请求万维网网站且提取网页数据的程序。
A对
B错
学生答案：B
老师点评：
题型：单选题客观题分值3分难度：一般得分：3
2爬虫爬取的是网站后台的数据。
A对
B错
学生答案：B
老师点评：
题型：单选题客观题分值3分难度：一般得分：3
3通用爬虫用于将互联网上的网页下载到本地，形成一个互联网内容的镜像备份。
A对
B错
学生答案：A
老师点评：
题型：单选题客观题分值3分难度：一般得分：3
4聚焦爬虫是“面向特定主题需求”的一种网络爬虫程序。
A对
B错
学生答案：A
老师点评：
题型：单选题客观题分值3分难度：一般得分：3
5通用爬虫可以选择性地爬取与预先定义好的主题相关的页面。
A对
B错
学生答案：B
老师点评：
题型：单选题客观题分值3分难度：一般得分：3
6robots.txt文件一定要放置在一个站点的根目录下。
A对
B错
题型：单选题客观题分值3分难度：一般得分：3
7robots.txt文件中至少要有一条User-agent记录。
A对
B错
题型：单选题客观题分值3分难度：一般得分：3
8robots.txt文件没有实际的约束力。
A对
B错
题型：单选题客观题分值3分难度：一般得分：3
9爬虫爬取网页的行为都很正当，不会受到网站的任何限制。
A对
B错
题型：单选题客观题分值3分难度：一般得分：3
10针对采用了反爬虫措施的网站，爬虫是无计可施的。
A对
B错
填空题
题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
1
网络爬虫又被称为网页蜘蛛、。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
2
网络爬虫能够按照一定的，自动请求万维网网站并提取网络数据。

题型：填空题主观题答案不允许乱序分值6分难度：一般得分：6
3
根据使用场景的不同，网络爬虫可分为和两种。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
4
爬虫可以爬取互联网上的且可以访问到的网页信息。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
5
是通用爬虫最重要的应用领域。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
6
文件是搜索引擎访问网站时要查看的第一个文件。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
7
网站提供了文件，可以方便网站管理员通知爬虫遍历和更新网站的内容。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
8
User-agent表示，用于描述发出HTTP请求的终端信息。

题型：填空题主观题答案不允许乱序分值3分难度：一般得分：3
9
为防止对方从访问量上认出爬虫的身份，可以访问网站的频率。

简答题
题型：简答题主观题分值8分难度：一般得分：8
1什么是网络爬虫？

题型：简答题主观题分值8分难度：一般得分：8
2请简述通用爬虫和聚焦爬虫的区别。

题型：简答题主观题分值8分难度：一般得分：8
3请简述使用网络爬虫的好处。

题型：简答题主观题分值8分难度：一般得分：8
4请简述通用爬虫和聚焦爬虫抓取网页的流程。

题型：简答题主观题分值8分难度：一般得分：8
5请举出一些针对反爬虫的应对策略。

江苏开放大学数据采集与预处理060749第1单元测试最新答案

评论0

请先登录！

升级VIP

夜间模式

书店

淘宝店铺

返回顶部

站点公告

猜你喜欢

25年春江苏开放大学政府经济学060198形考作业一最新答案

25年春江苏开放大学生命教育概论050535过程性考核一最新答案

25年春江苏开放大学工业机器人技术基础050567第一章 练习题最新答案

25年春江苏开放大学房屋建筑与装饰工程计量与计价060624形成性考核作业一最新答案

25年春江苏开放大学民法061115第一次平时作业最新答案

25年春江苏开放大学电子信息产品营销实务050564第一次作业最新答案

评论0

请先 登录 ！