无法访问你试图使用的功能所在的网络位置。是什么原因?
463
2022-05-29
Beautiful Soup 是 Python 的一个 HTML 或 XML 的解析库,我们可以用它来方便地从网页中提取数据。它拥有强大的 API 和多样的解析方式,本节就来了解下它的安装方式。
1. 相关链接
官方文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc
中文文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh
PyPI:https://pypi.python.org/pypi/beautifulsoup4
2. 准备工作
Beautiful Soup 的 HTML 和 XML 解析器是依赖于 lxml 库的,所以在此之前请确保已经成功安装好了 lxml 库,具体的安装方式参见上节。
3. pip 安装
目前,Beautiful Soup 的最新版本是 4.x 版本,之前的版本已经停止开发了。这里推荐使用 pip 来安装,安装命令如下:
1
pip3 install beautifulsoup4
命令执行完毕之后即可完成安装。
4. wheel 安装
当然,我们也可以从 PyPI 下载 wheel 文件安装,链接如下:https://pypi.python.org/pypi/beautifulsoup4
然后使用 pip 安装 wheel 文件即可。
5. 验证安装
安装完成之后,可以运行下面的代码验证一下:
1
2
3
from bs4 import BeautifulSoup
soup = BeautifulSoup('
Hello
', 'lxml')print(soup.p.string)
运行结果如下:
1
Hello
如果运行结果一致,则证明安装成功。
注意,这里我们虽然安装的是 beautifulsoup4 这个包,但是在引入的时候却是 bs4。这是因为这个包源代码本身的库文件夹名称就是 bs4,所以安装完成之后,这个库文件夹就被移入到本机 Python3 的 lib 库里,所以识别到的库文件名就叫作 bs4。
因此,包本身的名称和我们使用时导入的包的名称并不一定是一致的。
Python 网络
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。