[Python3 网络爬虫开发实战] 1.9.5-Scrapyrt 的安装

网友投稿 847 2022-05-30

Scrapyrt 为 Scrapy 提供了一个调度的 HTTP 接口,有了它,我们就不需要再执行 Scrapy 命令而是通过请求一个 HTTP 接口来调度 Scrapy 任务了。Scrapyrt 比 Scrapyd 更轻量,如果不需要分布式多任务的话,可以简单使用 Scrapyrt 实现远程 Scrapy 任务的调度。

1. 相关链接

[Python3 网络爬虫开发实战] 1.9.5-Scrapyrt 的安装

GitHub:https://github.com/scrapinghub/scrapyrt

官方文档:http://scrapyrt.readthedocs.io

2. pip 安装

这里推荐使用 pip 安装,命令如下:

1

pip3 install scrapyrt

接下来,在任意一个 Scrapy 项目中运行如下命令来启动 HTTP 服务:

1

scrapyrt

运行之后,会默认在 9080 端口上启动服务,类似的输出结果如下:

1

2

3

4

scrapyrt

2017-07-12 22:31:03+0800 [-] Log opened.

2017-07-12 22:31:03+0800 [-] Site starting on 9080

2017-07-12 22:31:03+0800 [-] Starting factory

如果想更换运行端口,可以使用 \-p 参数,如:

1

scrapyrt -p 9081

这样就会在 9081 端口上运行了。

3. Docker 安装

另外,Scrapyrt 也支持 Docker。比如,要想在 9080 端口上运行,且本地 Scrapy 项目的路径为 /home/quotesbot,可以使用如下命令运行:

1

docker run -p 9080:9080 -tid -v /home/user/quotesbot:/scrapyrt/project scrapinghub/scrapyrt

这样同样可以在 9080 端口上监听指定的 Scrapy 项目。

Python 网络

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:ubuntu websocket python2
下一篇:Node.js 的安装
相关文章