想要通过 Python 代码操作某个文件,必须要有三个元素:
path:文件的路径
mode:r / w / r+ / w+ / a
encoding:编码方式
2. 文件句柄包括:f / file / file_handler, f_h...
3. open() 是内置函数,实际上是调用操作系统对文件操作的功能
4. 各系统的默认编码方式:
Windows:GBK
Linux:UTF-8
IOS:UTF-8
5. 对文件的任何操作都需要借助文件句柄
6. f.close():打开某个文件后一定要记得关闭它,否则会一直在内存中占用资源
7.打开某个文件并读取其中内容的方法:
f = open("G:\test.txt", mode="r", encoding="utf-8") content = f.read() print(content) f.close() # 运行报错,原因解析: # 路径错误,系统会认为 \t 是一个转义字符 # 解决办法: # 1) "G:\\test.txt" # 2) r"G:\test.txt" # 另外,这里不能把反斜杠 \ 改为斜杠 /,因为不同系统之间的斜杠与反斜杠之间会有不同的定义 # 使用 open() 打开某个文件报错,除了上面提到的路径问题 # 还有一个可能的原因,即编码问题 # 比如在 Windows 系统上编写了一个 .txt 文件并保存 # 在 Pycharm 里面打开该文件就会发现内容很有可能是乱码的 # 原因就是两者的编码方式是不一样的
8. 文件操作涉及到路径问题,路径分为两种:
绝对路径:从磁盘根目录开始,直到找到文件
相对路径:从当前路径 (当前文件夹) 找到文件
9. r 模型下的五种读取方式
# 假设 test.txt 文件与本 Python 文件在同一个目录下 # test.txt 文件里的内容如下: 这是第一行的内容... 这是第二行的内容... 这是第三行的内容... 这是第四行的内容... 这是第五行的内容... ######## 1. read():全部读取出来 ######## f = open("test.txt", mode="r", encoding="utf-8") content = f.read() print(content) f.close() # 运行结果: 这是第一行的内容... 这是第二行的内容... 这是第三行的内容... 这是第四行的内容... 这是第五行的内容... ######## 2. read(n):读取 n 个字符 ######## f = open("test.txt", mode="r", encoding="utf-8") content = f.read(3) print(content) f.close() # 运行结果: 这是第 ######## 3. readline():按行读取 ######## f = open("test.txt", mode="r", encoding="utf-8") line1_content = f.readline() print(line1_content, type(line1_content)) # 这是第一行的内容... # <class 'str'> line2_content = f.readline() print(line2_content, type(line2_content)) # 这是第二行的内容... # <class 'str'> f.close() ######## 4. readlines():返回一个列表 ######## f = open("test.txt", mode="r", encoding="utf-8") content = f.readlines() print(content) f.close() # 运行结果: ['这是第一行的内容...\n', '这是第二行的内容...\n', '这是第三行的内容...\n', '这是第四行的内容...\n', '这是第五行的内容...\n'] ######## 5. for 循环:读取大文件 ######## # 当一个文件很大时,比如它有 9G,但是电脑内存只有 8G # 如果使用上面的方法一次性全部读取出来,那么电脑就会挂掉 # 解决办法就是使用 for 循环,只有每次循环时才占内存 f = open("test.txt", mode="r", encoding="utf-8") for line in f: print(line.strip()) f.close() # 运行结果: 这是第一行的内容... 这是第二行的内容... 这是第三行的内容... 这是第四行的内容... 这是第五行的内容... # 如果是直接 print(line),注意看结果: 这是第一行的内容... 这是第二行的内容... 这是第三行的内容... 这是第四行的内容... 这是第五行的内容...
以上就是Python3编码实现文件操作的方法。不知道有小伙伴一次看明白了没有,给学会了的小伙伴点个赞。没有学会的小伙伴也不要着急,代码都在上面可以慢慢尝试,相信你们一定可以的。