使用xpath爬取数据

网友投稿 649 2022-05-29

使用XPath来提取数据,爬取数据的简单语法。

下载模块

快速下载模块

pip install lxml

1

导入模块

from lxml import etree

1

利用xpath获取text或者href内容

/li/a/@href 这样取的应该是href的内容 /li/a/text() 这样取得是text内容

1

2

etree的使用

h=etree.HTML(response.text)#response.text是网页的源码 h.xpath('//img') #寻找所有的img结点, h.xpath('//div').xpath('.//img')#寻找所有div下的所有img结点

1

使用xpath爬取数据

2

3

xpath的语法

符号

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

实例

谓语

带谓语的路径表达式

到这里就结束了,如果对你有帮助你,欢迎关注,你的对我很重要

数据挖掘

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:CSS 属性选择器讲解
下一篇:新手试玩云手机遇到的坑,分享记录
相关文章