Python爬虫：使用pyppeteer爬取动态加载的网站-伙伴云

Python爬虫：使用pyppeteer爬取动态加载的网站

网友投稿 958 2025-04-01

pyppeteer 类似selenium，可以操作Chrome浏览器

文档：https://miyakogi.github.io/pyppeteer/index.html

github: https://github.com/miyakogi/pyppeteer

安装

环境要求：

python 3.6+

pip install pyppeteer

代码示例

# -*- coding: utf-8 -*- import asyncio from pyppeteer import launch from pyquery import PyQuery as pq # 最好指定一下自己浏览器的位置，如果不指定会自动下载，太慢了... executable_path = "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" # 示例一：渲染页面 async def crawl_page(): # 打开浏览器 browser = await launch(executablePath=executable_path) # 打开tab page = await browser.newPage() # 输入网址回车 await page.goto('http://quotes.toscrape.com/js/') # 获取内容并解析 doc = pq(await page.content()) print('Quotes:', doc('.quote').length) # 关闭浏览器 await browser.close() # 示例二：截图，保存pdf，执行js async def save_pdf(): browser = await launch(executablePath=executable_path) page = await browser.newPage() await page.goto('http://quotes.toscrape.com/js/') # 网页截图保存 await page.screenshot(path='example.png') # 网页导出 PDF 保存 await page.pdf(path='example.pdf') # 执行 JavaScript dimensions = await page.evaluate('''() => { return { width: document.documentElement.clientWidth, height: document.documentElement.clientHeight, deviceScaleFactor: window.devicePixelRatio, } }''') print(dimensions) await browser.close() if __name__ == '__main__': asyncio.get_event_loop().run_until_complete(crawl_page()) # asyncio.get_event_loop().run_until_complete(save_pdf())

Python爬虫：使用pyppeteer爬取动态加载的网站

异步编程，这个关键字太多了，看的眼花缭乱

参考

别只用 Selenium，新神器 Pyppeteer 绕过淘宝更简单！

Python 网站

接口测试 --apipost 如何自定义变量">接口测试 --apipost 如何自定义变量

958 2025-04-01

ABAP Netweaver, Hybris Commerce和SAP 云平台的登录认证

958 2025-04-01

前生今世，你真的了解吗">JavaScript的前生今世，你真的了解吗

958 2025-04-01

Python爬虫：使用pyppeteer爬取动态加载的网站

接口测试 --apipost 如何自定义变量">接口测试 --apipost 如何自定义变量

ABAP Netweaver, Hybris Commerce和SAP 云平台的登录认证

前生今世，你真的了解吗">JavaScript的前生今世，你真的了解吗

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

客户管理工具是什么？">客户管理工具是什么？

进销存库存管理盘点">简单进销存库存管理盘点

友情链接

Python爬虫：使用pyppeteer爬取动态加载的网站

微信扫一扫：分享

接口测试 --apipost 如何自定义变量">接口测试 --apipost 如何自定义变量

前生今世，你真的了解吗">JavaScript的前生今世，你真的了解吗

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

客户管理工具是什么？">客户管理工具是什么？

进销存库存管理盘点">简单进销存库存管理盘点

友情链接