试题列表
单选题
题型:单选题客观题分值3分难度:一般得分:3
1爬虫是手动请求万维网网站且提取网页数据的程序。
A对
B错
学生答案:B
老师点评:
题型:单选题客观题分值3分难度:一般得分:3
2爬虫爬取的是网站后台的数据。
A对
B错
学生答案:B
老师点评:
题型:单选题客观题分值3分难度:一般得分:3
3通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
A对
B错
学生答案:A
老师点评:
题型:单选题客观题分值3分难度:一般得分:3
4聚焦爬虫是“面向特定主题需求”的一种网络爬虫程序。
A对
B错
学生答案:A
老师点评:
题型:单选题客观题分值3分难度:一般得分:3
5通用爬虫可以选择性地爬取与预先定义好的主题相关的页面。
A对
B错
学生答案:B
老师点评:
题型:单选题客观题分值3分难度:一般得分:3
6robots.txt文件一定要放置在一个站点的根目录下。
A对
B错
题型:单选题客观题分值3分难度:一般得分:3
7robots.txt文件中至少要有一条User-agent记录。
A对
B错
题型:单选题客观题分值3分难度:一般得分:3
8robots.txt文件没有实际的约束力。
A对
B错
题型:单选题客观题分值3分难度:一般得分:3
9爬虫爬取网页的行为都很正当,不会受到网站的任何限制。
A对
B错
题型:单选题客观题分值3分难度:一般得分:3
10针对采用了反爬虫措施的网站,爬虫是无计可施的。
A对
B错
填空题
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
1
网络爬虫又被称为网页蜘蛛、。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
2
网络爬虫能够按照一定的,自动请求万维网网站并提取网络数据。
题型:填空题主观题答案不允许乱序分值6分难度:一般得分:6
3
根据使用场景的不同,网络爬虫可分为和两种。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
4
爬虫可以爬取互联网上的且可以访问到的网页信息。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
5
是通用爬虫最重要的应用领域。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
6
文件是搜索引擎访问网站时要查看的第一个文件。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
7
网站提供了文件,可以方便网站管理员通知爬虫遍历和更新网站的内容。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
8
User-agent表示,用于描述发出HTTP请求的终端信息。
题型:填空题主观题答案不允许乱序分值3分难度:一般得分:3
9
为防止对方从访问量上认出爬虫的身份,可以访问网站的频率。
简答题
题型:简答题主观题分值8分难度:一般得分:8
1什么是网络爬虫?
题型:简答题主观题分值8分难度:一般得分:8
2请简述通用爬虫和聚焦爬虫的区别。
题型:简答题主观题分值8分难度:一般得分:8
3请简述使用网络爬虫的好处。
题型:简答题主观题分值8分难度:一般得分:8
4请简述通用爬虫和聚焦爬虫抓取网页的流程。
题型:简答题主观题分值8分难度:一般得分:8
5请举出一些针对反爬虫的应对策略。
评论0