首页 理论教育 Python中文文本分析-文件操作技巧及函数解析

Python中文文本分析-文件操作技巧及函数解析

时间:2023-11-06 理论教育 版权反馈
【摘要】:如果文件存在则直接打开,并删除原有文件的内容;如果文件不存在,则创建后再打开。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件进行写入。buffering:设置文件读取缓冲区,有三种值可选:0、1、-1。3)wirte()向文件写入字符串,并返回写入字符串的长度。6)readlines()读取文件中的所有行,返回以行为单位的列表。

Python中文文本分析-文件操作技巧及函数解析

在文本处理中,很多的文本数据是采用文件的方式存储,因此,需要掌握文件的存取技术,实现文本数据的处理。在Python中负责文件操作的对象称为文件(file),可用来实现文本文件、图像文件、视频文件、二进制文件等文件的存取操作。

在对文件进行处理过程中,需要通过open()函数打开一个文件,并返回一个文件对象,可实现文件存取操作,关闭文件可使用close()来关闭文件对象。

1.常用函数

1)open()

open函数描述如下:

参数:

(1)filename:字符串类型,是指要打开的文件名,其包含文件的存储路径,可以使用绝对路径和相对路径。

(2)mode:是指文件的打开模式,文件打开模式有很多类型,比较常用的有r、w、r+、w+、a五种。

r:以只读方式打开文件。

w:打开一个只用于写入的文件。如果文件存在则直接打开,并删除原有文件的内容;如果文件不存在,则创建后再打开。

r+:打开一个文件,既可读文件,也可写文件。

w+:打开一个文件,既可读文件,也可写文件;但是在打开一个已有的文件时会删除掉文件中的内容。

a:打开一个文件,并追加新的内容。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

(3)buffering:设置文件读取缓冲区,有三种值可选:0、1、-1。0表示不设缓冲区,1表示设置一行缓冲区,-1表示系统默认值。

(4)encoding:指定打开文件的编码方式,默认是utf-8,编码方式的选择与文件存储编码有关。

2)close()

关闭文件,不能再进行文件读写操作。

3)wirte()(www.xing528.com)

向文件写入字符串,并返回写入字符串的长度

4)writelines()

向文件写入字符串列表。

5)redline()

读取文件中的一整行,包括换行符“\n”。

6)readlines()

读取文件中的所有行,返回以行为单位的列表。

2.打开文件并进行读写操作

例如,打开文本文件text.txt,如图3-4所示。

图3-4 文本文件text.txt的内容

1)通过只读方式打开文件并读取

2)通过只写方式打开文件并写入字符串

如果以只写的方式打开,会删除原来的内容,例如:

读取原文件的内容,发现文件中的内容已经发生了变化,例如:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈