Excel大文件拆分

import pandas as pd

def split_excel_file(input_file, output_prefix, num_parts=10):
    # 读取Excel文件
    df = pd.read_excel(input_file)

    # 计算每部分的行数
    total_rows = len(df)
    rows_per_part = total_rows // num_parts
    remaining_rows = total_rows % num_parts

    start_row = 0
    for i in range(num_parts):
        # 计算当前部分的结束行数
        end_row = start_row + rows_per_part + (1 if i < remaining_rows else 0)
        
        # 获取当前部分的数据
        part_df = df.iloc[start_row:end_row]
        
        # 构造输出文件名
        output_file = f"{output_prefix}_part_{i+1}.xlsx"
        
        # 保存当前部分到新的Excel文件,确保表头每次都会出现
        part_df.to_excel(output_file, index=False, header=True)
        print(f"Part {i+1} saved to {output_file}")
        
        # 更新起始行号
        start_row = end_row

# 使用示例
input_file = './output_file.xlsx'  # 输入文件路径
output_prefix = 'file_split'  # 输出文件前缀

split_excel_file(input_file, output_prefix)

你可能感兴趣的:(python,excel,python,开发语言)