【愚公系列】2021年12月 Python教学课程 25-Python文件读写

网友投稿 715 2022-05-28

前言

写程序过程中,我们做的一切操作,都是在内存里进行的。如果一旦断电或发生意外,那么我们的工作成果将瞬间消失。们还缺少将数据在本地文件系统进行持久化的能力,白话讲就是文件的读写能力。

Python 内置了一个 open()方法,用于对文件进行读写操作。使用 open()方法操作文件就像把大象塞进冰箱一样,可以分三步走,一是打开文件,二是操作文件,三是关闭文件。

open()方法的返回值是一个 file 对象,可以将它赋值给一个变量。其基本语法格式为:

f = open(filename, mode)

其中,

filename:一个包含了你要访问的文件名称的字符串值,通常是一个文件路径。

【愚公系列】2021年12月 Python教学课程 25-Python文件读写

mode:打开文件的模式,有很多种,默认是只读方式 r。

一个简单的例子:

# 打开一个文件 f = open("foo.txt", "w") f.write("Python 是一种非常好的语言。\n 我喜欢 Python!!\n") # 关闭打开的文件 f.close()

打开模式:

一、 b 模式

二进制模式,通常用来读取图片、视频等二进制文件。注意,它在读写的时候是以bytes 类型读写的,因此获得的是一个 bytes 对象而不是字符串。在这个读写过程中,需要自己指定编码格式。在使用带 b 的模式时一定要注意传入的数据类型,确保为bytes 类型。

s = 'this is a test' b = bytes(s,encoding='utf-8') f = open('test.txt','w') f.write(s) ##这样没问题,正常写入了文件。 ##------------------------------------------------- s = 'this is a test' b = bytes(s,encoding='utf-8') f = open('test.txt','wb') ##注意多了个 b f.write(s) ##报错 TypeError: a bytes-like object is required, not 'str' ##意思是它需要一个 bytes 类型数据,你却给了个字符串 ##--------------------------------------------------- s = 'this is a test' b = bytes(s,encoding='utf-8') f = open('test.txt','wb') ##注意多了个 b f.write(b) ##将变量 b 传给它,b 是个 bytes 类型

二、 + 模式:

对于 w+模式,在读写之前都会清空文件的内容,建议不要使用!

对于 a+模式,永远只能在文件的末尾写入,有局限性,建议不要使用!

对于 r+模式,也就是读写模式,配合 seek()和 tell()方法,可以实现更多操作。

三、 编码问题

要读取非 UTF-8 编码的文件,需要给 open()函数传入 encoding 参数,例如,读取GBK 编码的文件:

>>> f = open('gbk.txt', 'r', encoding='gbk') >>> f.read() 'GBK'

遇到有些编码不规范的文件,可能会抛出 UnicodeDecodeError 异常,这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况,可以提供 errors 参数,表示如果遇到编码错误后如何处理。

>>> f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')

四、 文件对象操作

每当我们用 open 方法打开一个文件时,将返回一个文件对象。这个对象内置了很多操作方法。下面假设,已经打开了一个 f 文件对象。

1. f.read(size)

读取一定大小的数据, 然后作为字符串或字节对象返回。size 是一个可选的数字类型的参数,用于指定读取的数据量。当 size 被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

f = open("1.txt", "r") str = f.read() print(str) f.close()

如果文件体积较大,请不要使用 read()方法一次性读入内存,而是 read(512)这种一点一点的读。

2. f.readline()

从文件中读取一行内容。换行符为’\n’。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行,并且不能回头,只能前进,读过的行不能再读了。

f = open("1.txt", "r") str = f.readline() print(str) f.close()

3. f.readlines()

将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines 方法会一次性将文件全部读入内存,所以也存在一定的风险。但是它有个好处,每行都保存在列表里,可以随意存取。

f = open("1.txt", "r") a = f.readlines() print(a) f.close()

4. 遍历文件

实际上,更多的时候,我们将文件对象作为一个迭代器来使用。

# 打开一个文件 f = open("1.txt", "r") for line in f: print(line, end='') f.close()

这个方法很简单, 不需要将文件一次性读出,但是同样没有提供一个很好的控制,与readline 方法一样只能前进,不能回退。

几种不同的读取和遍历文件的方法比较:

如果文件很小,read()一次性读取最方便

如果不能确定文件大小,反复调用 read(size)比较保险

如果是配置文件,调用 readlines()最方便

普通情况,使用 for 循环更好,速度更快

5. f.write()

将字符串或 bytes 类型的数据写入文件内。write()动作可以多次重复进行,其实都是在内存中的操作,并不会立刻写回硬盘,直到执行 close()方法后,才会将所有的写入操作反映到硬盘上。在这过程中,如果想将内存中的修改,立刻保存到硬盘上,可以使用 f.flush()方法,但这可能造成数据的不一致。

# 打开一个文件 f = open("/tmp/foo.txt", "w") f.write("Python 是一种非常好的语言。\n 我喜欢 Python!!\n") # 关闭打开的文件 f.close()

6. f.tell()

返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了,是字节数,不是字符数。

7. f.seek()

如果要改变位置指针的位置, 可以使用 f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what 的值,如果是 0 表示从文件开头计算,如果是 1 表示从文件读写指针的当前位置开始计算,2 表示从文件的结尾开始计算,默认为 0,例如:

offset:表示偏移量。

seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符

seek(x,1) : 表示从当前位置往后移动 x 个字符

seek(-x,2):表示从文件的结尾往前移动 x 个字符

看一个例子:

>>> f = open("d:\\1.txt", "rb+") >>> f.write(b"1232312adsfalafds") 17 >>> f.tell() 17 >>> f.seek(5) 5 >>> f.read(1) b'1' >>> f.seek(-3, 2) 14 >>> f.read(1) b'f'

8. f.close()

关闭文件对象。当处理完一个文件后,调用 f.close()来关闭文件并释放系统的资源。文件关闭后,如果尝试再次调用该文件对象,则会抛出异常。忘记调用 close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了,或者更糟糕的结果。也就是说大象塞进冰箱后,一定不要忘记关上冰箱的门。

五、 with 关键字

with 关键字用于 Python 的上下文管理器机制。为了防止诸如 open 这一类文件打开方法在操作过程出现异常或错误,或者最后忘了执行 close 方法,文件非正常关闭等可能导致文件泄露、破坏的问题。Python 提供了 with 这个上下文管理器机制,保证文件会被正常关闭。在它的管理下,不需要再写 close 语句。注意缩进。

with open('test.txt', 'w') as f: f.write('Hello, world!')

with 支持同时打开多个文件:

with open('log1') as obj1, open('log2','w') as obj2: s=obj1.read() obj2.write(s)

5G教育 Python

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Python - 日志处理(logging模块)
下一篇:张小白带你玩转Atlas 200DK+CANN 5.0.4+MindStudio 3.0.4(二)分设环境之运行环境准备
相关文章