python读取文件的指定行并修改

文件是python最常操作的对象，先看文件，格式固定，每6行一组，且最后一行为空行，这是Python脚本从接口文档上取下来的数据，按固定格式自动生成的RF关键字脚本，由于接口有重复，直接用的话会报错（关键字名称有重复），故现在需要对每个关键字前面加个前缀，第一个加001，第二个加002，依次类推，

提交业务实体(标签)审批,根据业务实体ID	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/businessobject/{businessObjectId}	${d2json}	${header}	"${request[""check""]}"

提交统一审批信息,审批内容自定义	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/commit	${d2json}	${header}	"${request[""check""]}"

处理审批结果（由审批流主动调用本接口）	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/result	${d2json}	${header}	"${request[""check""]}"

新增业务实体-POST方式	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/businessobject	${d2json}	${header}	"${request[""check""]}"

期望格式是这样的

001提交业务实体(标签)审批,根据业务实体ID	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/businessobject/{businessObjectId}	${d2json}	${header}	"${request[""check""]}"

002提交统一审批信息,审批内容自定义	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/commit	${d2json}	${header}	"${request[""check""]}"

思路当然还是遍历文件，每6行取出来修改后存入新文件，具体为：①从头开始读取源文件（每次读取文件的位置很重要，即seek），②新文件先写入前缀，③读取6行，写入文件，记录文件seek,下次读的时候从该位置继续读，代码如下：

r1 = r"D:\\keyword.txt"
r2 = r"D:\\keyword1.txt"
with open(r1, 'r+', encoding="utf-8") as f1, open(r2, 'a+', encoding="utf-8") as f2:
    s = num = 0  # s:记录文件读取的偏移量，num为前缀，初始值都为0
    for k in f1:  # 遍历文件，每次读一行加载到内存
        f1.seek(s)  # 每次从上一次结束的位置开始读
        num += 1  # 自增1，实现1,2,3...
        f2.write(str(num).zfill(3))  # 转换成001,002,003....在写入正式内容之前先写入前缀
        for i in range(6):  # 循环控制读取6行
            text = f1.readline()  # 每次读一行
            f2.write(text)  # 将每次读取的一行写入新文件
            print(text, str(i), end=''),
            s = f1.tell()  # 记录每次读完的seek，供下一个6行读取时使用

当然上述代码稍微变形即可获取文件指定的行，把6行称作一个块的话，比如只想要每个块的首行，则可以这样

with open(r1, 'r+', encoding="utf-8") as f1, open(r2, 'a+', encoding="utf-8") as f2:
    s = num = 0 #s:记录文件读取的偏移量，num为前缀，初始值都为0
    for k in f1: #
        f1.seek(s) #每次从上一次结束的位置开始读
        num += 1 #自增1，实现1,2,3...
        f2.write(str(num).zfill(3)) #转换成001,002,003....在写入正式内容之前先写入前缀
        for i in range(6): #循环控制读取6行，但是不写入，只移动指针而已
            text = f1.readline() 
            #f2.write(text)
            print(text, str(i), end=''),
            s = f1.tell()#记录每次读完的seek，供下一个6行读取时使用
        f2.write(k) #将首行写入新文件

f2文件的结果如下

001提交业务实体(标签)审批,根据业务实体ID	[Arguments]	${request} 
002提交统一审批信息,审批内容自定义	[Arguments]	${request} 
003处理审批结果（由审批流主动调用本接口）	[Arguments]	${request} 
004新增业务实体-POST方式	[Arguments]	${request} 
005修改业务实体-PUT方式	[Arguments]	${request} 
006根据实体名称获取审批信息 -Get方式	[Arguments]	${request}

如果你想改变块的大小，改变循环的次数即可，

python读取文件的指定行并修改

你可能感兴趣的:(python读取文件的指定行并修改)