Pandas中的连接函数汇总

如有错误欢迎指正~

文章目录

  • 前言
  • 一、concat()
    • 1. 参数详解
    • 2. 举例说明
  • 二、append()
    • 1. 参数详解
    • 2. 举例说明
  • 三、 join()
    • 1. 参数详解
    • 2. 举例说明
  • 四、merge()
    • 1. 参数详解
    • 2. 举例说明
  • 总结


前言

在数据分析的过程中数据的重构是非常重要的,本篇文章将详细讲解pandas中四个重要的连接函数:concat(), merge(), join(), append()
#我们先来导入pandas和numpy
import pandas as pd
import numpy as np

一、concat()

  • 沿特定轴(axis)连接对象,也可以在连接轴上添加层级索引(index)

1. 参数详解

pd.concat(
    objs, #对象:Series,DataFrame或Panel的序列,如果传递了字典,字典的键值将会被作为键参数
    axis=0, #选择连接轴:默认为0,代表行/index;当axis=1时,代表列/columns
    join='outer', #处理其他轴上的索引:默认为'outer',取并集;当join='inner'时,取交集
    ignore_index: bool = False, #是否重置连接轴的索引,默认为False;当ignore_index=True,将按照[0,1,……,n-1]重置连接轴上的索引
    keys=None, #用传入的键作为最外层索引。如果为多层次索引,当使用元组
    levels=None, #构建多层次索引
    names=None, #多层次索引中级别的名称
    verify_integrity: bool = False, #检查新连接的轴是否包含重复项
    sort: bool = False,
    copy: bool = True,
) 

2. 举例说明

首先建立三个数据集

df1 = pd.DataFrame([['a'

你可能感兴趣的:(python,数据分析)