016 文件处理

文章目录

    • 打开文件
    • 关闭文件
    • 读取文件
      • 方法1
      • 方法2
      • 方法3
      • 方法4
    • 写入文件
      • 方法1
      • 方法2
    • with操作
    • 读写缓冲区
    • 文件偏移量
    • os模块
      • 获取文件大小
      • 查看文件列表
      • 判断文件是否存在
      • 删除文件

文件
文件是保存在持久化存储设备上的一段数据
文件分类
文本文件:打开后会自动解码为字符
二进制文件:内部编码为二进制码,无法通过文字编码解析

byte1 = b'hello' #英文字符字节串
byte2 = "你好".encode
str2 = byte2.decode

读:从文件中获取内容
写:修改文件中的内容

打开文件

参数:file_name 文件名
access_mode 打开文件的方式,如果不写默认为’r’
buffering 1表示有行缓冲,默认则表示使用系统默认提供的缓冲机制
encoding=‘UTF-8’ 设置打开文件的编码方式,一般Linux下不需要

返回值:成功返回文件操作对象

#打开文件
file_object = open(file_name, access_mode='r', buffering=-1, encoding=None)
功能:打开一个文件,返回一个文件对象。
打开模式 效果
r 以读方式打开,文件必须存在
w 以写方式打开,文件不存在则创建,存在清空原有内容
a 以追加模式打开,文件不存在则创建,存在则继续写操作
r+ 以读写模式打开 文件必须存在
w+ 以读写模式打开 不存在则创建,存在清空原有内容
a+ 追加并可读模式,文件不存在则创建,存在则继续写操作
rb 以二进制读模式打开 同r
wb 以二进制写模式打开 同w
ab 以二进制追加模式打开 同a
rb+ 以二进制读写模式打开 同r+
wb+ 以二进制读写模式打开 同w+
ab+ 以二进制读写模式打开 同a+

关闭文件

file.close()

读取文件

1.open后每次读取都是从上次结束的位置继续读
2.读取到文件结尾后,如果继续读返回值是空字串

方法1

read([size])
功能:来直接读取文件中字符
参数:如果没有给定size参数(默认值为-1)或者size值为负,文件
将被读取直至末尾,给定size最多读取给定数目个字符(字节)
返回值:返回读取到的内容

while True:
    data = f.read(1)
    #if data == "":
    if not data:
        break#当读取到结尾,data为空字串的时候结束循环
    print(data,end="")

方法2

一次读取结束时机:遇到换行会结束,遇到指定字符(字节)个数会结束

readline([size])
功能: 用来读取文件中一行
参数: 如果没有给定size参数(默认值为-1)或者size值为负
表示读取一行,给定size表示最多读取制定的字符(字节)
返回值: 返回读取到的内容

方法3

如果读到"\n"自动返回下一行

readlines([size])
功能: 读取文件中的每一行作为列表中的一项
参数: 如果没有给定size参数(默认值为-1)或者size值为负
文件将被读取直至末尾
给定size表示读取到size字符所在行为止。
返回值:返回读取到的内容列表

方法4

文件对象本身也是一个可迭代对象,在for循环中可以迭代文件的每一行。

def query_word1(word):
    fr = open("dict.txt")# 读打开
    #逐行读取
    n = len(word)
    for line in fr:
        if line[:n] == word and line[n] == " ":
            return line


def query_word2(word):
    fr = open("dict.txt")# 读打开
    #逐行读取
    for line in fr:
        tmp = line.split(' ')#按照空格分割
        if tmp[0] > word:
            break
        elif tmp[0] == word:
            return line

写入文件

方法1

write(data)
功能: 把文本数据或二进制数据块的字符(节)串写入到文件中去
参数: 要写入的内容
返回值: 写入的字符(节)个数
如果需要换行要在写入内容中添加\n

方法2

writelines(str_list)
功能: 接受一个字符串列表作为参数,将它们写入文件。
参数: 要写入的内容列表

def copy(filename,dir):
    fr = open(filename,'rb')
    fname = filename.split('\\')[-1]
    fw = open(dir+'/'+fname,'wb')
    while True:
        data = fr.read(1024)
        if not data:
            break
        fw.write(data)
    fr.close()
    fw.close()

#copy("C:\\Users\\xxx\\Desktop\\xx.png",".")
copy(r"C:\Users\xxx\Desktop\xx.png",".")

"""
def copy(filename,dir):
    fr = open(filename,'rb')
    fname = filename.split('/')[-1]
    fw = open(dir+'/'+fname,'wb')
    while True:
        data = fr.read(1024)
        if not data:
            break
        fw.write(data)
    fr.close()
    fw.close()

copy("C:/Users/xxx/Desktop/xx.png",".")
"""

with操作

python中的with语句也可以用于访问文件,在语句块结束后会自动释放资源。
with语句格式

with context_expression [as obj]:
    with-body

with访问文件

with open('file','r+') as f:
    f.read()

注意: with语句块结束后会自动释放f所以不再需要close()

读写缓冲区

定义

系统自动的在内存中为每一个正在使用的文件开辟一个空间,在对文件读写时都是先将文件内容加载到缓冲区,再进行读写

作用:减少和硬盘的交互次数,提高读写效率

刷新缓冲区条件

1缓冲区被写满
2程序执行结束或者文件对象被关闭
3程序中调用flush()函数

缓冲区设置

类型 设置方法 注意事项
系统自定义 buffering=-1
行缓冲 buffering=1 当遇到\n时会刷新缓冲
指定缓冲区大小 buffering>1 必须以二进制方式打开
fw = open("file.txt","wb",buffering=10)
while True:
    msg = input(">>")
    if not msg:
        break
    fw.write(msg.encode())
 fw.close()

文件偏移量

定义
打开一个文件进行操作时系统会自动生成一个记录,
记录每次读写操作时所处的文件位置,每次文件的读写操作都是从这个位置开始进行的。

1r或者w方式打开,文件偏移量在文件开始位置
2a方式打开,文件偏移量在文件结尾位置

tell()

seek(offset[,whence])
功能: 移动文件偏移量位置
参数: offset 代表相对于某个位置移动的字节数。负数表示向前移动,正数表示向后移动。
whence是基准位置的默认值为0,代表从文件开头算起,1代表从当前位置算起,2代表文件末尾算起
注意:必须以二进制方式打开文件时,基准位置才能是1或者2

import time

log = open("my.log","a+",buffering=1)
#文件偏移量放开头
log.seek(0,0)
#n = 1
#for line in log:
#    n += 1
n = len(log.readlines()) + 1
while True:
    msg = "%d. %s\n"%(n,time.ctime())
    log.write(msg)
    time.sleep(2)
    n += 1

os模块

os模块是Python标准库函数,包含了大量的文件处理函数

获取文件大小

os.path.getsize(file)
功能: 获取文件大小
参数: 指定文件
返回值: 文件大小

查看文件列表

os.listdir(dir)
功能: 查看文件列表
参数: 指定目录
返回值: 目录中的文件名列表

判断文件是否存在

os.path.exists(file)
功能: 判断文件是否存在
参数: 指定文件
返回值: 布尔值

删除文件

os.remove(file)
功能: 删除文件
参数: 指定文件

你可能感兴趣的:(python,python,开发语言,文件,文件处理)