江苏开放大学数据采集与预处理060749第3单元测试最新答案

试题列表
单选题
题型：单选题客观题分值2分难度：一般得分：2
1我们既可以使用LinkExtractor类，也可以自定义符合特定需求的链接提取类。
A错
B对
学生答案：B
老师点评：
题型：单选题客观题分值2分难度：一般得分：2
2Item Pipeline主要用于处理从Spiders中获取到的Item数据。
A对
B错
学生答案：A
老师点评：
题型：单选题客观题分值2分难度：一般得分：2
3在settings.py文件中，ITEM_PIPELINES项的值默认为空。
A对
B错
学生答案：A
老师点评：
题型：单选题客观题分值2分难度：一般得分：2
4若ITEM_PIPELINES设置项的数值越大，则优先级越高。
A错
B对
学生答案：A
老师点评：
题型：单选题客观题分值2分难度：一般得分：2
5Rule规则只适用于链接，不适用于普通的文本。
A错
B对
学生答案：B
老师点评：
题型：单选题客观题分值2分难度：一般得分：2
6如果包含了多个Rule对象，那么每个Rule会轮流处理Response。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
7如果要创建一个爬虫文件，那么只能通过使用命令的方式来完成。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
8如果Scrapy爬虫文件中规定了爬虫的约束区域，那么不在这个区域的URL会被忽略。
A错
B对
题型：单选题客观题分值2分难度：一般得分：2
9如果调用process_request方法时返回None，Scrapy将停止调用该方法。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
10在爬虫工作的过程中，LinkExtractor类需要被实例化很多次。
A错
B对
题型：单选题客观题分值2分难度：一般得分：2
11一个Scrapy爬虫项目中只能存在一个爬虫文件。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
12Scrapy的代理IP、Uesr-Agent的切换都是通过Item Pipeline进行控制的。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
13由于CrawlSpider使用parse方法来实现其逻辑，如果覆盖了parse方法，CrawlSpider将会运行失败。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
14Scrapy爬虫文件中，需要使用start_urls属性确定爬取的起始URL元组或列表。
A对
B错
题型：单选题客观题分值2分难度：一般得分：2
15如果电脑上已经安装了IPython，那么Scrapy shell会优先使用IPython。
A错
B对
填空题
题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
1
Scrapy shell是一个交互式，可在不启动爬虫的条件下尝试及调试爬取代码。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
2
Scrapy是用纯Python实现的一个开源，能够高效地爬取网站数据、提取结构性数据。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：0
3
scrapy.spiders模块中提供了CrawlSpider类，专门用于爬取全站网页。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
4
CrawlSpider类使用属性来决定爬虫的爬取规则。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
5
当Item数据被Spiders收集之后，会被传递到。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
6
在Scrapy项目中，文件用于定义项目的目标实体。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
7
Scrapy框架提供做为爬虫的基类，所有自定义的爬虫必须从这个类派生。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
8
rules属性是一个包含一个或多个Rule对象的。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
9
每个Item Pipeline组件都是一个独立的Python类，该类中的方法必须实现。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
10
是Scrapy提供的爬虫基类，创建的爬虫类需要从该类继承。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
11
下载中间件是处于引擎和之间的一层组件，多个下载中间件可以被同时加载运行。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
12
Scrapy使用来表示要爬取的数据。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：0
13
LinkExtractor类的唯一目的就是从网页中提取需要爬取的链接。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
14
组件负责接收引擎递过来的请求，并按照某种方式整理排列和入列。

题型：填空题主观题答案不允许乱序分值2分难度：一般得分：2
15
CrawlSpider爬虫运行时，通过方法对start_urls中的每一个url发起请求。

简答题
题型：简答题主观题分值8分难度：一般得分：8
1请简述如何改变自定义管道的执行顺序？

题型：简答题主观题分值8分难度：一般得分：8
2请简单描述一下Scrapy框架的运作流程。

题型：简答题主观题分值8分难度：一般得分：6
3CrawlSpider类是如何获取rules的？

题型：简答题主观题分值8分难度：一般得分：8
4什么是Scrapy？

题型：简答题主观题分值8分难度：一般得分：8
5比较Spider和CrawlSpider类，阐述它们有什么异同。

江苏开放大学数据采集与预处理060749第3单元测试最新答案

评论0

请先登录！

升级VIP

夜间模式

书店

淘宝店铺

返回顶部

站点公告

猜你喜欢

25年春江苏开放大学政府经济学060198形考作业一最新答案

25年春江苏开放大学生命教育概论050535过程性考核一最新答案

25年春江苏开放大学工业机器人技术基础050567第一章 练习题最新答案

25年春江苏开放大学房屋建筑与装饰工程计量与计价060624形成性考核作业一最新答案

25年春江苏开放大学民法061115第一次平时作业最新答案

25年春江苏开放大学电子信息产品营销实务050564第一次作业最新答案

评论0

请先 登录 ！