Python 抓取 博客 记录，获取标题与url

网友投稿 879 2022-05-30

在博客网站发布了一些博客。总共有四十多篇。现在查看这些博客需要翻页，不是很方便。

想要弄出一个列表，把标题和链接展示出来。如果手动去复制粘贴，耗时耗力，也不够自动化。

有没有什么自动化的方法呢？想到以前用python做过抓取的功能。

开发环境：

Python3.7

PyCharm 2018.3.7 (Community Edition)

macOS 11.4

安装scrapy

我们主要使用的框架是scrapy，官网 https://scrapy.org/

如果需要换用清华的pip源，执行下面的命令

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pip -U pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

根据官网文档进行安装

pip3 install Scrapy

分析目标网页

目标网页的部分html如下

标签：Python 抓取博客记录

相关文章

第一篇 博客">第一篇 博客

879 2022-05-30

办公 自动化(三) | 借助服务器定时爬数据发邮件">python办公 自动化(三) | 借助服务器定时爬数据发邮件

879 2022-05-30

Python3 网络爬虫开发实战] 1.4.3-Redis 的安装">[Python3 网络爬虫开发实战] 1.4.3-Redis 的安装

879 2022-05-30