scrapy间歇性响应为空/降速/缓存-伙伴云

scrapy 间歇性响应为空/降速/缓存

网友投稿 846 2022-05-29

使用 scrapy访问豆瓣的搜索接口时，莫名会出现response json数据为空的情况。

加上回调重新请求 (要设置dont_filter=True 防止被过滤)，还是会出现异常。

最后发现是请求速度过快导致的。

降速：

将其中的访问速度与下载速度调整一下，具体设置：

#并发请求个数（越小越慢）默认是16个 CONCURRENT_REQUESTS = 5 #下载延迟时间（越大请求越慢） DOWNLOAD_DELAY = 3

scrapy间歇性响应为空/降速/缓存

而对于多个spider文件需要不同的请求策略，则可以在爬虫文件中配置单独的 custom_settings:

自动限速(AutoThrottle)：

可参考文档：https://scrapy-chs.readthedocs.io/zh_CN/1.0/topics/autothrottle.html?highlight=auto#autothrottle-algorithm

该扩展能根据Scrapy服务器及您爬取的网站的负载自动限制爬取速度。

更友好的对待网站，而不使用默认的下载延迟0。自动调整scrapy来优化下载速度。

#默认False;为True表示启用AUTOTHROTTLE扩展 AUTOTHROTTLE_ENABLED = True #默认3秒;初始下载延迟时间 AUTOTHROTTLE_START_DELAY = 1 #默认60秒；在高延迟情况下最大的下载延迟 AUTOTHROTTLE_MAX_DELAY = 3

httpscatch缓存：

httpscatch 对HTTP请求和响应的缓存。

如果启用 HTTPCACHE_ENABLED 的话，它会缓存每个请求和对应的响应。

HTTPCACHE_ENABLED = True HTTPCACHE_EXPIRATION_SECS = 0 HTTPCACHE_DIR = 'httpcache' HTTPCACHE_IGNORE_HTTP_CODES = [] HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'

可参考文档：https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings

Scrapy

dAPI 的安装">ScrapydAPI 的安装

846 2022-05-29

崩溃没响应，使用格式刷的时候，和他自动保存备份的时候，老是突然就自动保存了，保存也就算了，他">WPS是崩溃没响应，使用格式刷的时候，和他自动保存备份的时候，老是突然就自动保存了，保存也就算了，他

846 2022-05-29

scrapy 间歇性 响应为空/降速/缓存

dAPI 的安装">ScrapydAPI 的安装

Scrapy-Splash 的安装

崩溃没响应，使用格式刷的时候，和他自动保存备份的时候，老是突然就自动保存了，保存也就算了，他">WPS是崩溃没响应，使用格式刷的时候，和他自动保存备份的时候，老是突然就自动保存了，保存也就算了，他

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接

scrapy间歇性响应为空/降速/缓存

微信扫一扫：分享

dAPI 的安装">ScrapydAPI 的安装

崩溃没响应，使用格式刷的时候，和他自动保存备份的时候，老是突然就自动保存了，保存也就算了，他">WPS是崩溃没响应，使用格式刷的时候，和他自动保存备份的时候，老是突然就自动保存了，保存也就算了，他

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接

scrapy 间歇性响应为空/降速/缓存