优秀的编程知识分享平台

网站首页 > 技术文章 正文

37.文件操作

nanyue 2024-11-22 18:35:26 技术文章 2 ℃

打开文件

Python中,打开文件使用的是open函数。open函数的基本语法如下:

open(file_name [, access_mode][, buffering])

参数解析:

  • file_name变量:是一个包含要访问的文件名称的字符串值。
  • access_mode变量:指打开文件的模式,对应有只读、写入、追加等。access_mode变量值不是必需的(不带access_mode变量时,要求file_name存在,否则报异常),默认的文件访问模式为只读(r)
  • buffering:如果buffering的值被设为0,就不会有寄存;如果buffering的值取1,访问文件时就会寄存行;如果将buffering的值设为大于1的整数,表示这就是寄存区的缓冲大小;如果取负值,寄存区的缓冲大小就是系统默认的值。

open函数返回一个File(文件)对象。File对象代表计算机中的一个文件,是Python中另一种类型的值,就像我们熟悉的列表和字典。

例如(file_open_1.py):

path = 'd:/test.txt'
f_name = open(path)
print(f_name.name)

执行结果如下:

d:/test.txt

执行结果告诉我们打开的是d盘下的test.txt文件(执行该程序前,已经创建了一个名为test.txt的文件)。

这里有几个概念要先弄清楚:

  • 文件路径:在该程序中,我们先定义了一个path变量,变量值是一个文件的路径。文件的路径是指文件在计算机上的位置,如该程序中的d:/test.txt是指文件在d盘、文件名为test.txt。文件路径又分为绝对路径和相对路径。
    • 绝对路径:总是从根文件夹开始。比如在Windows环境下,一般从c盘、d盘等开始,c盘、d盘被称为根文件夹,在该盘中的文件都得从根文件夹开始往下一级一级查找。在Linux环境下,一般从usr、home等根文件开始。比如在上面的示例程序中,path变量值就是一个绝对路径,在文件搜索框中输入绝对路径可以直接找到该文件。

    • 相对路径:相对于程序当前工作目录的路径。比如当前工作文件存放的绝对路径是d:\python\workspace,如果使用相对路径,就可以不写这个路径,用一个“.”号代替这个路径值。

例如(file_open_2.py):

path = './test.txt'
f_name = open(path, 'w')
print(f_name.name)

执行结果如下:

./test.txt

除了单个点(.),还可以使用两个点(..)表示父文件夹(或上一级文件夹)。此处不具体讨论,有兴趣可以自己尝试。

文件模式

我们在前面讲到,使用open函数时可以选择是否传入mode参数。在前面的示例中,mode传入了一个值为w的参数,这个参数是什么意思呢?mode可以传入哪些值呢?

mode常用的模式:

  • r:表示文件只能读取
  • w:表示文件只能写入
  • a:表示打开文件,在原有内容的基础上追加内容,在末尾写入
  • w+:表示可以对文件进行读写双重操作

mode二进制常用模式:

  • rb:以二进制格式打开一个文件,用于只读
  • wb:以二进制格式打开一个文件,用于只写
  • ab:以二进制格式打开一个文件,用于追加
  • wb+:以二进制格式打开一个文件,用于读写

使用open函数时,明确指定读模式和什么模式都不指定的效果是一样的,我们在前面的示例中已经验证。

使用写模式可以向文件写入内容。+参数可以用到其他任何模式中,指明读和写都是允许的。比如w+可以在打开一个文件时用于文件的读写。

当参数带上字母b时,表示可以用来读取一个二进制文件。Python在一般情况下处理的都是文本文件,有时也不能避免处理其他格式的文件。

基本文件方法

读和写

open函数返回的是一个File对象,有了File对象,就可以开始读取内容。如果希望将整个文件的内容读取为一个字符串值,可以使用File对象read()方法。

read()方法从一个打开的文件中读取字符串。需要注意,Python字符串可以是二进制数据,而不仅仅是文字。

语法如下:

fileObject.read([count])

fileObjectopen函数返回的File对象count参数是从已打开的文件中读取的字节计数。该方法从文件的开头开始读入,如果没有传入count,就会尝试尽可能多地读取内容,很可能一直读取到文件末尾。

比如我们在test.txt文件中写入Hello world!Welcome!,执行如下代码(file_read.py):

path = './test.txt'
f_name = open(path, 'r')
print(f'read result: {f_name.read(12)}')

执行结果如下:

read result: Hello World!

print('read result:', f_name.read(12)) 更改为 print('read result:',f_name.read()),得到的执行结果如下:

read result: Hello world!Welcome!

由执行结果看到,没有指定读取字节数时,read方法会读取打开文件中的所有字节。

除了读取数据外,我们还可以向文件中写入数据。在Python中,将内容写入文件的方式与print函数将字符串输出到屏幕上类似。

如果打开文件时使用读模式,就不能写入文件,即不能用下面这种形式操作文件:

open(path, 'rw')

Python中,用write()方法向一个文件写入数据。write()方法可将任何字符串写入一个打开的文件。需要注意,Python字符串可以是二进制数据,而不仅仅是文字。

write()方法不会在字符串结尾添加换行符('\n'),语法如下:

fileObject.write(string)

fileObjectopen函数返回的File对象string参数是需要写入文件中的内容。

该方法返回写入文件的字符串的长度。

例如(file_write.py):

f_name = open(path, 'w')
print(f"write length: {f_name.write('Hello World!')}")

执行结果如下:

write length: 12

由执行结果看到,我们向test.txt文件中写入了12个字符。下面验证一下写入的是否是我们指定的字符,在上面的程序中追加两行代码并执行:

f_name = open(path, 'r')
print('read result: ', f_name.read())

执行结果如下:

read result: Hello World!

由执行结果看到,写入文件的是我们指定的内容。不过这里有一个疑问,我们在这里执行了两次写入操作,得到的结果怎么只写入了一次?

写文件write方法的处理方式是:将覆写原有文件,从头开始,每次写入都会覆盖前面所有内容,就像用一个新值覆盖一个变量的值。若需要在当前文件的字符串后追加字符,该怎么办呢?

可以将第二个参数w更换为a,即以追加模式打开文件,例如(file_add.py):

path = './test.txt'
f_name = open(path, 'w')
print(f"write length: {f_name.write('Hello World!')}")
f_name = open(path, 'r')
print(f'read result: {f_name.read()}')

# 内容追加写入
f_name = open(path, 'a')
print(f"add length: {f_name.write('welcome!')}")
f_name = open(path, 'r')
print(f'read result: {f_name.read()}')

执行结果如下:

write length: 12
read result: Hello World!
add length: 8
read result: Hello World!welcome!

由执行结果看到,输出结果在文件末尾成功添加了对应字符串。

提示:如果传递给open函数的文件名不存在,写模式w和追加模式a就会创建一个新的空文件,然后执行写入或追加。

如果想追加的字符串在下一行,该怎么办呢?

Python中,用\n表示换行。对于上面的示例,若需要追加的内容在下一行,可以如下操作(file_change_line.py):

path = './test.txt'
f_name = open(path, 'w')
print(f"write length: {f_name.write('Hello World!')}")
f_name = open(path, 'r')
print(f'read result: {f_name.read()}')

f_name = open(path, 'a')
print('add length: ', f_name.write('\nwelcome!'))
f_name = open(path, 'r')
print(f'read result: {f_name.read()}')

执行结果如下:

write length: 12
read result: Hello World!
add length:  9
read result: Hello World!
welcome!

由执行结果看到,后面追加的内容在下一行了。

提示:若需要读或写特定编码方式的文本,则需要给open函数传入encoding参数;若需要读取GBK编码的文件,则前面的示例可以改写为f_name=open(path, 'r',encoding='gbk'),这样读取到的文件就是GBK编码方式的文件了。

读写行

我们目前对文件的读操作是按字节读或整个读取,而写操作是全部覆写或追加,这样的操作在实际应用中很不实用。

Python为我们提供了readline()readlines()writelines()等方法用于行操作,例如(file_read_write.py):

path = './test.txt'
f_name = open(path, 'w')
f_name.write('Hello World!\n')
f_name = open(path, 'a')
f_name.write('welcome!')
f_name = open(path, 'r')
print(f'readline result: {f_name.readline()}')

执行结果为:

readline result: Hello World!

由执行结果得知,readline方法会从文件中读取单独一行,换行符为\nreadline方法如果返回一个空字符串,说明已经读取到最后一行了。

readline方法也可以像read方法一样传入数值读取对应的字符数,传入小于0的数值表示整行都输出。

如果将上面示例的最后一行:

print(f'readline result: {f_name.readline()}')

更改为:

# 当前读取方式为: readlines
print(f'readlines result: {f_name.readlines()}')

得到的输出结果为:

readlines result: ['Hello World!\n', 'welcome!']

输出结果为一个字符串的列表。列表中的每个字符串就是文本中的每一行,并且换行符也会被输出。

readlines方法可以传入数值参数,当传入的数值小于等于列表中一个字符串的长度值时,该字符串会被读取;当传入小于等于0的数值时,所有字符都会被读取。

例如(file_read_lines.py):

path = './test.txt'
f_name = open(path, 'w')
str_list = ['Hello World!\n', 'welcome!\n', 'welcome!\n']
# 当前代码使用writelines进行数据写入
f_name.writelines(str_list)
f_name = open(path, 'r')
print(f'read result: {f_name.read()}')
f_name = open(path, 'r')
print(f'readline result: {f_name.readline()}')

执行结果如下:

read result: Hello World!
welcome!
welcome!

readline result: Hello World!

由执行结果看到,writelines方法和readlines方法相反,传给它一个字符串列表(任何序列或可迭代对象),它会把所有字符串写入文件。如果没有writeline方法,那么可以使用write方法代替这个方法的功能。

关闭文件

我们前面介绍了很多读取和写入文件的内容,都没有提到在读或写文件的过程中出现异常时该怎么处理。在读或写文件的过程中,出现异常的概率还是挺高的,特别对于大文件的读取和写入,出现异常更是家常便饭。在读或写文件的过程中,出现异常该怎么处理呢?

这就需要用到前面介绍的异常的知识了,用try语句捕获可能出现的异常。在捕获异常前有一个动作要执行,就是使用close方法关闭文件。

一般情况下,一个文件对象在退出程序后会自动关闭,但是为了安全起见,还是要显式地写一个close方法关闭文件。

一般显式关闭文件读或写的操作如下(file_close.py):

path = './test.txt'
f_name = open(path, 'w')
print(f"write length: {f_name.write('Hello World!')}")
f.name.close()

这段代码和没有加close方法的执行结果一样。这样处理后的函数比没有加close方法时更安全,可以避免在某些操作系统或设置中进行无用的修改,也可以避免用完系统中所打开文件的配额。

对内容更改过的文件一定要记得关闭,因为写入的数据可能被缓存,如果程序或系统因为某些原因而崩溃,被缓存部分的数据就不会写入文件了。为了安全起见,在使用完文件后一定要记得关闭。

当使用try语句出现异常时,即使使用了close方法,也可能不被执行,这时该怎么办呢?

还记得finally子句吗?可以将close方法放在finally子句中执行,从而保证无论程序是否正常执行都会调用close方法。

上面的示例可以更改成更安全的形式(file_safe_close.py):

f_name = None
path = './test.txt'
try:
    f_name = open(path, 'w')
    print(f"write length: {f_name.write('Hello World!')}")
except Exception as e:
    print(f'程序异常: {e}')
finally:
    if f_name:
        print(f_name.name)
        f_name.close()

如果每次都要这么写,就会很烦琐,是否有更简便的方式处理呢?

Python中引入了with语句自动帮我们调用close方法。可以使用with语句将上面的程序更改为(file_safer_close.py):

path = './test.txt'
with open(path, 'w') as f:
    print(f"write length: {f.write('Hello World!')}")


with open(path, 'r') as f:
    print(f'文件内容: {f.read()}')

这段代码和上面使用try/finally的效果一样,并且会自动调用close方法,不用显式地写该方法。可以发现,代码比前面简洁多了,后面可以多用这种方式编写。

最近发表
标签列表