Python递归遍历文件夹搜索文件 脚本MagicSearch.py

网友投稿 922 2022-05-29

开发背景:

电脑的E盘里有很多电子书,以前对那个技术比较感兴趣就去下载很多电子书,有些看了,有些没看,电子书没有在一个地方,于是我准备写一个脚本,将这些电子书搜索出来,进行整理一下。

程序设计的思路:

定义一个搜索的根目录baseDir,一个不搜索的文件夹列表notSearhFolderArr,一个搜索的文件类型列表searchTypeArr,

判断根目录baseDir是有效的,并且不存在于notSearhFolderArr数组中,

获取文件夹下的所有文件及文件夹,

遍历,判断子元素是文件,并且文件类型存在于searchTypeArr,如果真则存在返回路径

判断子元素,是文件夹并且不属于notSearhFolderArr数组中, 执行第一步,进行递归搜索

代码:

# 根据配置好的文件,搜索文件夹

import os

import io

import sys

sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') # 处理vscode打印中文乱码问题

# 主函数

baseDir = "E:\Pang\for_search" # 搜索的根目录

notSearchFolderArr = ['node_modules'] # 不搜索的目录

searchFileTypeArr = ['.pdf','.PDF'] # 搜索的文件类型

Python递归遍历文件夹搜索文件 脚本MagicSearch.py

def searhMain():

allResArr = searchFolder(baseDir)

print('\n'.join(allResArr))

# 搜索一个文件目录 传入一个文件目录路径

def searchFolder(folderPath):

folderName = os.path.split(folderPath)[-1]

searFilePathArr = []

if os.path.exists(folderPath) and (folderName not in notSearchFolderArr): # 判断路径是有效文件夹

fileArr = os.listdir(folderPath) # 获取文件夹下的所有内容(文件和文件夹)

for item in fileArr:

currentPath = folderPath+'\\'+item

(fileName,fileType) = os.path.splitext(item)

if os.path.isfile(currentPath) and (fileType in searchFileTypeArr): # 处理文件

searFilePathArr.append(currentPath)

if os.path.isdir(currentPath) and (item not in notSearchFolderArr): # 处理文件夹

innerFileArr = searchFolder(currentPath) # 递归搜索

searFilePathArr.extend(innerFileArr)

return searFilePathArr

searhMain()

主要用到的模块和api:

模块 os: 操作文件的模块

主要api:

os.path.split  : 分割路径

os.path.exists: 路径是否存在

os.listdir: 路径是否是文件夹

os.path.splitext:拆分路径中的文件扩展名于其他

os.path.isfile: 路径是否是文件

append: 向数组中追加一个元素

extend: 向数组追加一个数组

运行结果:

程序返回的事根目录下所有的pdf文件路径列表

这个脚本稍作修改就可以查询多个文件类型,对文件进行分类,获取要查询的文件路径后,还可以对文件进行批量备份到一个文件夹下,或者将搜索结果直接打包压缩。想怎么玩都可以。

学无止境

这个小脚本,花费了我三个小时,除了关键字外,所有的api都是我一次一次百度所得,包括那个换行符,没办法,python写的少,但我相信:

虽然我走的慢,但每一步都是在前进,并且永不止步

Python 数据结构

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【愚公系列】2022年03月 .NET架构班 020-ABP vNext 虚拟文件系统
下一篇:linux重要的目录之proc和dev目录
相关文章