python处理excel的具体操作

  1. 安装相关库

    • openpyxl:用于读取和写入Excel文件(.xlsx/.xlsm)。可以使用pip install openpyxl命令进行安装。
    • pandas:提供了高效的数据结构和数据分析工具,它对openpyxl进行了封装,使操作Excel文件更加方便。安装命令是pip install pandas
  2. 使用openpyxl读取Excel文件

    • 打开工作簿
      • 首先要导入openpyxl库,然后使用load_workbook函数打开一个Excel工作簿。例如:
        import openpyxl
        workbook = openpyxl.load_workbook('example.xlsx')
        
      • 这里的example.xlsx是要打开的Excel文件的文件名,需要确保文件在当前工作目录下或者提供正确的文件路径。
    • 获取工作表
      • 可以通过工作簿对象的active属性获取当前活动的工作表,或者使用workbook['SheetName']的方式获取指定名称的工作表。例如:
        sheet = workbook.active
        # 或者
        sheet = workbook['Sheet1']
        
    • 读取单元格数据
      • 可以通过工作表对象的cell方法来读取单元格的数据。例如,要读取A1单元格的数据,可以这样做:
        cell_value = sheet.cell(row = 1, column = 1).value
        print(cell_value)
        
      • 也可以使用循环来读取整个工作表的数据。例如,下面的代码将读取一个工作表中的所有数据并打印出来:
        for row in sheet.rows:
            for cell in row:
                print(cell.value, end=" ")
            print()
        
  3. 使用openpyxl写入Excel文件

    • 创建或打开工作簿
      • 可以使用openpyxl.Workbook创建一个新的工作簿。例如:
        new_workbook = openpyxl.Workbook()
        
      • 如果要打开一个已有的工作簿进行修改,可以像前面读取文件时一样使用load_workbook函数。
    • 获取工作表并写入数据
      • 获取活动工作表或者指定名称的工作表后,可以使用cell方法来写入数据。例如,要在A1单元格写入数据“Hello”:
        sheet = new_workbook.active
        sheet.cell(row = 1, column = 1).value = "Hello"
        
    • 保存工作簿
      • 使用工作簿对象的save方法来保存文件。例如:
        new_workbook.save('new_example.xlsx')
        
  4. 使用pandas库操作Excel文件

    • 读取Excel文件
      • 导入pandas库后,使用read_excel函数读取Excel文件。例如:
        import pandas as pd
        df = pd.read_excel('example.xlsx')
        
      • 这里的df是一个DataFrame对象,它是pandas中用于存储二维数据的结构。可以像操作表格一样操作它,例如查看前几行数据可以使用df.head(),查看数据的形状(行数和列数)可以使用df.shape
    • 数据处理和分析
      • DataFrame对象上可以进行各种数据处理操作。例如,筛选数据可以使用条件表达式。如果df中有一个列名为'Age',要筛选出年龄大于30岁的数据,可以这样做:
        filtered_df = df[df['Age'] > 30]
        
      • 还可以进行分组、排序、计算统计量等操作。例如,对df按照某一列(如'Department')进行分组并计算每组的平均值:
        group_mean = df.groupby('Department').mean()
        
    • 写入Excel文件
      • 使用DataFrame对象的to_excel方法将数据写入Excel文件。例如,要将filtered_df写入一个新的Excel文件,可以这样做:
        filtered_df.to_excel('filtered_example.xlsx', index = False)
        
      • 其中index = False表示不将行索引写入Excel文件,如果想要写入行索引,可以将其设置为True

你可能感兴趣的:(tools,python)