一日

之前有一位爬虫大佬写了一篇文章,说 HTTP/2协议天然就能防大部分的爬虫。Python 无论是 requests 还是 Scrapy 都不支持 HTTP/2协议。 Go + HTTP/2[1]这个网站可以检测你是否使用 HTTP/2协议进行请求。当我们直接使用浏览器访问的时候,页面长这样: 注意红框中的文字。但如果我们直接使用 Scrapy 访问这个页面,并打印源代码,返回的 HTML 长这样:...

特别声明: 版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

  • <a target=甘特图怎么制作更方便?甘特图制作方法" title="甘特图怎么制作更方便?甘特图制作方法" width="200" height="150">

    [置顶]甘特图怎么制作更方便?甘特图制作方法

    甘特图 2025-03-31

    本文关于甘特图怎么制作更方便?甘特图制作方法。其实现在制作甘特图的方式有多种多样,可以直接使用表格的方式来制作,或者是使用一些线上工具来制作甘特图都是可以的。今天针对于甘特图制作方式给大家详细的分享一...

  • <a target=OKR的实施标准步骤是什么?成功实施落地OKR的要点" title="OKR的实施标准步骤是什么?成功实施落地OKR的要点" width="200" height="150">

    [置顶]OKR的实施标准步骤是什么?成功实施落地OKR的要点

    OKR管理 2025-03-31

    本文关于okr的实施标准步骤是什么?成功实施落地OKR的要点。其实有关于Okr工作法,相信很多人都有一定的了解。OKR定义为一个重要的思维框架和一个发展中的学科,旨在确保员工一起工作,并专注于做出可衡...

  • <a target=一日一技:谁说 Scrapy 不能爬 HTTP/2?" title="一日一技:谁说 Scrapy 不能爬 HTTP/2?" width="200" height="150">

    一日一技:谁说 Scrapy 不能爬 HTTP/2?

    所有内容 2025-04-02

    之前有一位爬虫大佬写了一篇文章,说 HTTP/2协议天然就能防大部分的爬虫。Python 无论是 requests 还是 Scrapy 都不支持 HTTP/2协议。 Go + HTTP/2[1]这个网...

  • <a target=一日一技:如何把MongoDB作为循环队列" title="一日一技:如何把MongoDB作为循环队列" width="200" height="150">

    一日一技:如何把MongoDB作为循环队列

    所有内容 2025-04-02

    我们在使用MongoDB的时候,一个集合里面能放多少数据,一般取决于硬盘大小,只要硬盘足够大,那么我们可以无休止地往里面添加数据。 然后,有些时候,我只想把MongoDB作为一个循环队列来使用,期望它...

  • <a target=一日一技:生成器里面的 return 有什么用?" title="一日一技:生成器里面的 return 有什么用?" width="200" height="150">

    一日一技:生成器里面的 return 有什么用?

    所有内容 2025-04-01

    在粉丝群里,有一位同学问了这样一个问题: def gen_data(num): if num ˃ 10: for i in range(num): yield i else: return num g...

  • <a target=一日一技:在 macOS 中寻找大文件夹" title="一日一技:在 macOS 中寻找大文件夹" width="200" height="150">

    一日一技:在 macOS 中寻找大文件夹

    所有内容 2025-04-01

    macOS 最新版的系统已经出来很长一段时间了,我一直想升级,但是一直都没有升级。因为我的硬盘空间不够。如下图所示。 但是,使用 macOS 自带的磁盘管理工具检查大文件可以发现,实际上我的电脑里面已...

  • <a target=一日一技:如何禁止 Python 子类覆盖父类方法?" title="一日一技:如何禁止 Python 子类覆盖父类方法?" width="200" height="150">

    一日一技:如何禁止 Python 子类覆盖父类方法?

    所有内容 2025-04-01

    在昨天的文章里面,我们讲到了,当子类试图覆盖父类的时候,可以通过类型标注来发出警告。今天,我们来讲讲如何直接禁止覆盖。 Python 原生是没有提供禁止子类覆盖父类的方法的功能,因此我们需要自己来实现...

  • <a target=一日一技:带过期时间的缓存、全文搜索、频率限制怎么做?" title="一日一技:带过期时间的缓存、全文搜索、频率限制怎么做?" width="200" height="150">

    一日一技:带过期时间的缓存、全文搜索、频率限制怎么做?

    所有内容 2025-04-01

    在以前的文章里面,我给大家介绍了使用Python自带的LRU缓存实现带有过期时间的缓存:一日一技:实现有过期时间的LRU缓存。也讲过倒排索引:使用倒排索引极速提高字符串搜索效率。但这些代码对初学者来说...

  • <a target=一日一技:如何正确在自己项目里面集成别人的代码?" title="一日一技:如何正确在自己项目里面集成别人的代码?" width="200" height="150">

    一日一技:如何正确在自己项目里面集成别人的代码?

    所有内容 2025-03-31

    更进一步,这个代码不是 Python 写的,可能是 Golang,可能是 Node.js,可能是 C++。如果你的项目想直接调用对方的代码,又应该怎么办呢? 有人说,那就把别人的代码先下载到本地,然后...

  • <a target=一日一技:等待多个线程同时结束的两种方法" title="一日一技:等待多个线程同时结束的两种方法" width="200" height="150">

    一日一技:等待多个线程同时结束的两种方法

    所有内容 2025-03-31

    我们在写多线程代码的时候,可能会需要等待多个线程同时结束,然后再进行后续的流程。例如,我做了一个聚合搜索引擎,用户输入一个关键词,我需要同时在很多个搜索引擎上搜索,然后把搜索结果汇总以后返回给用户。...

  • <a target=一日一技:如何正确管理项目的环境变量" title="一日一技:如何正确管理项目的环境变量" width="200" height="150">

    一日一技:如何正确管理项目的环境变量

    所有内容 2025-03-31

    在之前的文章:开发经验:如何正确设置开发环境与生产环境的配置参数中,我提到了把项目的开发环境与生产环境的配置文件分开管理这种方式。 实际上,项目的配置信息,除了用配置文件以外,还可以使用环境变量来进行...

  • <a target=一日二技:MongoDB与 Scrapy 的小技巧各一个" title="一日二技:MongoDB与 Scrapy 的小技巧各一个" width="200" height="150">

    一日二技:MongoDB与 Scrapy 的小技巧各一个

    所有内容 2025-03-31

    今天我们来讲两个小技巧。 如何更新 MongoDB 中的一个数组 我们知道,如果想给 MongoDB 的一条文档增加一个字段,我们可以使用update_one方法: import pymongo ha...