掌握excel固定单元格技巧,让数据管理更高效
693
2022-05-29
使用XPath来提取数据,爬取数据的简单语法。
下载模块
快速下载模块
pip install lxml
1
导入模块
from lxml import etree
1
利用xpath获取text或者href内容
/li/a/@href 这样取的应该是href的内容 /li/a/text() 这样取得是text内容
1
2
etree的使用
h=etree.HTML(response.text)#response.text是网页的源码 h.xpath('//img') #寻找所有的img结点, h.xpath('//div').xpath('.//img')#寻找所有div下的所有img结点
1
2
3
xpath的语法
符号
XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。
实例
谓语
带谓语的路径表达式
到这里就结束了,如果对你有帮助你,欢迎关注,你的对我很重要
数据挖掘
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。