Python初学者学习记录——python文件操作

一、文件编码概念

        1、文件编码

              编码技术:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。

              计算机中有许多可用编码:

              · UTF-8

              · GBK

              ·  Big5

              · 等

              不同的编码,将内容翻译成二进制也是不同的。

        2、查看文件编码

              可以使用Windows系统自带的记事本,打开文件后,即可查看文件的编码是什么:

              Python初学者学习记录——python文件操作_第1张图片

              UTF - 8是目前全球通用的编码格式

              除非有特殊需求,否则,一律以UTF - 8格式进行文件编码即可。

二、文件的读取操作

        内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U盘等设备。为了便于数据的管理和检索,引入了 “文件” 的概念。

        一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别

        文件操作主要包括:打开、关闭、读、写等操作。

        文件的操作步骤,大致分为:①打开文件、②读写文件、③关闭文件

        注意:可以之打开文件和关闭文件,不进行任何读写

        1、open()打开函数

              在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下:open(name, mode, encoding)

              name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)

              mode:设置打开文件的模式(访问模式):只读、写入、追加等

              encoding:编码格式(推荐使用UTF - 8)

              示例代码:

              f = open('python.txt', 'r', encoding = 'UTF - 8')

              # encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定

              注意:此时的`f`是`open`函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问。

              mode常用的三种基础访问模式

Python初学者学习记录——python文件操作_第2张图片

        2、读操作相关方法

              ①read()方法:

              文件对象.read(num)

              num表示要从文件中读取的数据的长度(单位是字符),如果没有传入num,那么就表示读取文件中所有的数据。

              ②readlines()方法:

              readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。

              f = open('python.txt')

              content = f.readlines()

              # ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']

              print(content)

              # 关闭文件

              f.close()

              ③readline()方法:一次读取一行内容

              f = open('python.txt')

              content = f.readline()

              print(f'第一行:{content}')

              content = f.readline()

              print(f'第二行:{content}')

              # 关闭文件

              f.close()

              ④for循环读取文件行

              for line in open("python.txt", "r"):

                    print(line)

              # 每一个line临时变量,就记录了文件的一行数据

              ⑤close()方法:关闭文件对象

              f = open("python.txt", "r")

              f.close()

              # 最后通过close,关闭文件对象,也就是关闭对文件的占用

              # 如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用。

              ⑥with open 语法

              with open("python.txt", "r") as f:
                    f.readlines()

              # 通过在with open的语句块中对文件进行操作

              # 可以在操作完成后自动关闭close文件,避免遗忘掉close方法

# 打开文件
f = open("D:\code_Python\测试.txt", "r", encoding = "UTF-8")
print(type(f))

# 读取文件——read()
# print(f"读取10个字符的结果:{f.read(10)}")
# print(f"read方法读取全部内容的结果:{f.read()}")  # 从上次读取记录的位置继续读取
print("----------------------------------------------")

# 读取文件——readlines()
# lines = f.readlines() # 读取文件的全部行,封装到列表中
# print(f"lines对象的类型是:{type(lines)}")
# print(f"lines对象的内容是:{lines}")

# 读取文件——readline()
# line1 = f.readline()
# line2 = f.readline()
# line3 = f.readline()
# print(f"第一行数据是:{line1}")
# print(f"第一行数据是:{line2}")
# print(f"第一行数据是:{line3}")

# for循环读取文件行
# for line in f:
#     print(line)

# import time
# time.sleep(500000)  # 延迟500000秒

# 关闭文件
# f.close()

# with open 语法操作文件
with open("D:\code_Python\测试.txt", "r", encoding = "UTF-8") as f:
    for line in f:
        print(f"每一行数据是:{line}")

        3、操作汇总

Python初学者学习记录——python文件操作_第3张图片

三、文件读取的练习案例

        Python初学者学习记录——python文件操作_第4张图片

# 方法1:用read()语法读取全部文件,得到字符串,再用count(字符串)语法统计
with open("D:\code_Python\测试.txt", "r", encoding = "UTF-8") as f:
    content = f.read()
    print(f"read读取的内容的类型是:{type(content)}")
    count = content.count('itheima')
    print(f"方法1:文件中itheima单词出现的次数是:{count}")

# 方法2:用readline()语法每次读取一行,按照空格切分,然后用count(字符串)统计
with open("D:\code_Python\测试.txt", "r", encoding = "UTF-8") as f:
    count = 0
    for line in f:
        # words = line.strip().split(" ")  # strip()可以去掉开头和结尾的空格以及换行符
        words = line.replace("\n", "").split(" ")
        for word in words:
            if word == "itheima":
                count += 1
    print(f"方法2:文件中itheima单词出现的次数是:{count}")

 Python初学者学习记录——python文件操作_第5张图片

四、文件的写入操作

        1、写操作快速入门

              案例演示:

              Python初学者学习记录——python文件操作_第6张图片

              注意:

                  ①直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区

                  ②当调用flush的时候,内容会真正写入文件

                  ③这样做是避免繁琐的操作硬盘,导致效率下降(攒一堆,一次性写入磁盘)

# 打开文件,不存在的文件
f = open("D:/code_Python/test.txt", "w", encoding = "UTF-8")

# write写入
f.write("Hello World!!!")   # 内容写入到内存中

# flush刷新
# f.flush()   # 将内存中积攒的内容,写入到硬盘的文件中

# close关闭
f.close()   # close方法,其实内置了flush功能

# 打开一个存在的文件
f = open("D:/code_Python/test.txt", "w", encoding = "UTF-8")

# write写入,flush刷新
f.write("黑马程序员")

# close关闭
f.close()

 Python初学者学习记录——python文件操作_第7张图片

        2、注意事项:

              ①w模式,文件不存在,会创建新文件

              ②w模式,文件存在,会清空原有内容

              ③close()方法,带有flush()方法的功能

五、文件的追加写入操作

        1、追加写入操作快速入门

              案例演示:

              Python初学者学习记录——python文件操作_第8张图片

              注意:

                  ①a模式,文件不存在,会创建文件

                  ②a模式,文件存在,会在最后追加写入文件

# # 打开文件,不存在的文件
# f = open("D:/code_Python/test.txt", "a", encoding = "UTF-8")
# # write写入
# f.write("黑马程序员")
# # flush刷新
# f.flush()
# # close关闭
# f.close()
#
#
# # 打开一个存在的文件
# f = open("D:/code_Python/test.txt", "a", encoding = "UTF-8")
# # write写入,flush刷新
# f.write("学Python最佳选择")
# # close关闭
# f.close()

# 打开一个存在的文件
f = open("D:/code_Python/test.txt", "a", encoding = "UTF-8")
# write写入,flush刷新
f.write("\n月薪过万")
# close关闭
f.close()

 Python初学者学习记录——python文件操作_第9张图片

        3、注意事项:

              ①a模式,文件不存在,会创建新文件

              ②a模式,文件存在,会在原有内容后面继续写入

              ③可以使用 "\n" 来写入换行符

六、文件操作的综合案例

        Python初学者学习记录——python文件操作_第10张图片Python初学者学习记录——python文件操作_第11张图片

        1、自己写的:

# 读取文件
f = open("D:/code_Python/bill.txt", "r", encoding="UTF-8")

# 将文件写入到bill.txt.bak文件作为备份,并将文件内标记为测试的数据行丢弃
f2 = open("D:/code_Python/bill.txt.bak", "w", encoding="UTF-8")
for line in f:
    if line[-3] == "测":  # -3是因为每一行最后有"\n"字符
    # if line.split(",")[4] == "测试\n":  # 与上面的if判断语句可以替换
        continue
    f2.write(line)

# close两个文件对象
f.close()
f2.close()    # 写入文件调用close()会自动flush()

        2、黑马程序员中写的:

# 打开文件得到文件对象,准备读取
fr = open("D:/code_Python/bill.txt", "r", encoding="UTF-8")

# 打开文件得到文件对象,准备写入
fw = open("D:/code_Python/bill.txt.bak", "w", encoding="UTF-8")

# for循环读取文件
for line in fr:
    line = line.strip()  # 去掉后面的"\n"
    # 判断内容,将满足的内容写出
    if line.split(",")[4] == "测试":
        continue
    # 将内容写入
    fw.write(line)
    # 由于前面对内容进行了strip()的操作,所以要手动的写出换行符
    fw.write("\n")

# close两个文件对象
fr.close()
fw.close()    # 写入文件调用close()会自动flush()

 Python初学者学习记录——python文件操作_第12张图片

你可能感兴趣的:(学习,python,开发语言,pycharm)