PDF转Excel:高效去除AI特征,实现数据自由编辑
859
2022-05-30
本文通过一个小实例,说明使用Pandas的Read_html方法读取网页Table表格数据
要读取的网页表格数据
http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jjzc/index.phtml
完整代码
# -*- coding: utf-8 -*- import pandas as pd # 数据出现省略号 pd.set_option('display.width', None) url = 'http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jjzc/index.phtml' # 可能有多个表格,我们取第一个 df = pd.read_html(url)[0] # print(data) # 保存数据 df.to_csv('./data.csv', encoding='utf-8')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
打开读取的数据结果,效果还是非常不错的
更多的用法可以研究下文档
参考:
天秀!Pandas还能用来写爬虫?
HTML
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。