【Python3网络爬虫 开发 实战】3.1-使用urllib

网友投稿 736 2022-05-30

在Python 2中，有urllib和urllib2两个库来实现请求的发送。而在Python 3中，已经不存在urllib2这个库了，统一为urllib，其官方文档链接为：https://docs.python.org/3/library/urllib.html。

首先，了解一下urllib库，它是Python内置的HTTP请求库，也就是说不需要额外安装即可使用。它包含如下4个模块。

request：它是最基本的HTTP请求模块，可以用来模拟发送请求。就像在浏览器里输入网址然后回车一样，只需要给库方法传入URL以及额外的参数，就可以模拟实现这个过程了。

error：异常处理模块，如果出现请求错误，我们可以捕获这些异常，然后进行重试或其他操作以保证程序不会意外终止。

parse：一个工具模块，提供了许多URL处理方法，比如拆分、解析、合并等。

robotparser：主要是用来识别网站的robots.txt文件，然后判断哪些网站可以爬，哪些网站不可以爬，它其实用得比较少。

这里重点讲解一下前3个模块。

【快速入口】：3.1.1-发送请求

【Python3网络爬虫开发实战】3.1-使用urllib

【快速入口】：3.1.2处理异常

【快速入口】：3.1.3解析链接

网络 Python

标签：Python3网络爬虫开发实战

Node.js：开发资源和技术栈整理">Node.js：开发资源和技术栈整理

736 2022-05-30

后端 开发 04 使用axios调用第三方服务API">NodeJs 后端 开发 04 使用axios调用第三方服务API

736 2022-05-30

实战45讲基础篇】(task2)日志系统">【MySQL实战45讲基础篇】(task2)日志系统

736 2022-05-30

最近发表

京宠展信息指南
宠物展会2025年时间表
亚宠展、全球宠物产业风向标——亚洲宠物展览会深度解析
2025年亚洲宠物展览会、京宠展有哪些亮点
wps演示添加自定义按钮设置动作改变按顺序播放" href="https://www.huoban.com/news/post/118206.html">wps演示添加自定义按钮设置动作改变按顺序播放
WPS行中的文本调整到行中" href="https://www.huoban.com/news/post/119027.html">如何将WPS行中的文本调整到行中
系统字体问题（win10系统怎么设置密码）" href="https://www.huoban.com/news/post/62643.html">WIN10系统字体问题（win10系统怎么设置密码）
格式的应用（应用文标题的格式）" href="https://www.huoban.com/news/post/63002.html">标题格式的应用（应用文标题的格式）
数据如何合并成一列，谢谢（如何将两列数据合并到一列）" href="https://www.huoban.com/news/post/71663.html">两列数据如何合并成一列，谢谢（如何将两列数据合并到一列）
无法插入表格

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜
进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）
在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐
WPS2016怎么绘制简单的价格表?
客户管理工具是什么？">客户管理工具是什么？
Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

【Python3网络爬虫 开发 实战】3.1-使用urllib

Node.js：开发资源和技术栈整理">Node.js：开发资源和技术栈整理

后端 开发 04 使用axios调用第三方服务API">NodeJs 后端 开发 04 使用axios调用第三方服务API

实战45讲基础篇】(task2)日志系统">【MySQL实战45讲基础篇】(task2)日志系统

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

客户管理工具是什么？">客户管理工具是什么？

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接

【Python3网络爬虫开发实战】3.1-使用urllib

微信扫一扫：分享

Node.js：开发资源和技术栈整理">Node.js：开发资源和技术栈整理

后端开发 04 使用axios调用第三方服务API">NodeJs 后端开发 04 使用axios调用第三方服务API

实战45讲基础篇】(task2)日志系统">【MySQL实战45讲基础篇】(task2)日志系统

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

客户管理工具是什么？">客户管理工具是什么？

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接