python读取文件的指定行并修改

文件是python最常操作的对象,先看文件,格式固定,每6行一组,且最后一行为空行,这是Python脚本从接口文档上取下来的数据,按固定格式自动生成的RF关键字脚本,由于接口有重复,直接用的话会报错(关键字名称有重复),故现在需要对每个关键字前面加个前缀,第一个加001,第二个加002,依次类推,

提交业务实体(标签)审批,根据业务实体ID	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/businessobject/{businessObjectId}	${d2json}	${header}	"${request[""check""]}"

提交统一审批信息,审批内容自定义	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/commit	${d2json}	${header}	"${request[""check""]}"

处理审批结果(由审批流主动调用本接口)	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/result	${d2json}	${header}	"${request[""check""]}"

新增业务实体-POST方式	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/businessobject	${d2json}	${header}	"${request[""check""]}"

期望格式是这样的

001提交业务实体(标签)审批,根据业务实体ID	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/businessobject/{businessObjectId}	${d2json}	${header}	"${request[""check""]}"

002提交统一审批信息,审批内容自定义	[Arguments]	${request} 
	${copydict}	copy dictionary	${request}
	Remove from Dictionary	${copydict}	check
	${d2json}	dumps	${copydict}
	http post	${IP}	/audit/commit	${d2json}	${header}	"${request[""check""]}"

思路当然还是遍历文件,每6行取出来修改后存入新文件,具体为:①从头开始读取源文件(每次读取文件的位置很重要,即seek),②新文件先写入前缀,③读取6行,写入文件,记录文件seek,下次读的时候从该位置继续读,代码如下:

r1 = r"D:\\keyword.txt"
r2 = r"D:\\keyword1.txt"
with open(r1, 'r+', encoding="utf-8") as f1, open(r2, 'a+', encoding="utf-8") as f2:
    s = num = 0  # s:记录文件读取的偏移量,num为前缀,初始值都为0
    for k in f1:  # 遍历文件,每次读一行加载到内存
        f1.seek(s)  # 每次从上一次结束的位置开始读
        num += 1  # 自增1,实现1,2,3...
        f2.write(str(num).zfill(3))  # 转换成001,002,003....在写入正式内容之前先写入前缀
        for i in range(6):  # 循环控制读取6行
            text = f1.readline()  # 每次读一行
            f2.write(text)  # 将每次读取的一行写入新文件
            print(text, str(i), end=''),
            s = f1.tell()  # 记录每次读完的seek,供下一个6行读取时使用
       

当然上述代码稍微变形即可获取文件指定的行,把6行称作一个块的话,比如只想要每个块的首行,则可以这样

with open(r1, 'r+', encoding="utf-8") as f1, open(r2, 'a+', encoding="utf-8") as f2:
    s = num = 0 #s:记录文件读取的偏移量,num为前缀,初始值都为0
    for k in f1: #
        f1.seek(s) #每次从上一次结束的位置开始读
        num += 1 #自增1,实现1,2,3...
        f2.write(str(num).zfill(3)) #转换成001,002,003....在写入正式内容之前先写入前缀
        for i in range(6): #循环控制读取6行,但是不写入,只移动指针而已
            text = f1.readline() 
            #f2.write(text)
            print(text, str(i), end=''),
            s = f1.tell()#记录每次读完的seek,供下一个6行读取时使用
        f2.write(k) #将首行写入新文件

f2文件的结果如下

001提交业务实体(标签)审批,根据业务实体ID	[Arguments]	${request} 
002提交统一审批信息,审批内容自定义	[Arguments]	${request} 
003处理审批结果(由审批流主动调用本接口)	[Arguments]	${request} 
004新增业务实体-POST方式	[Arguments]	${request} 
005修改业务实体-PUT方式	[Arguments]	${request} 
006根据实体名称获取审批信息 -Get方式	[Arguments]	${request} 

如果你想改变块的大小,改变循环的次数即可,

转载于:https://my.oschina.net/u/4188927/blog/3095670

你可能感兴趣的:(python读取文件的指定行并修改)