Python-pandas之如何将excel中一列拆成多行

 

在处理Excel数据时,有时需要将某列数据拆分为单独个体,分行存储。手动操作过于麻烦,用Python的pandas库可以轻松解决。

例如下图是公交车站数据,每个车站存储着所经过线路名称。现在想从城市所有车站数据中提取城市所有线路数据,就可以通过pandas的stack函数实现。

Python-pandas之如何将excel中一列拆成多行_第1张图片

import pandas as pd
bussta = pd.read_excel('200m公交数据.xlsx')
bussta.head()

 

Python-pandas之如何将excel中一列拆成多行_第2张图片

使用stack粗暴地拆开:

a = bussta['address'].str.split(';',expand=True).stack().reset_index()
a

 

Python-pandas之如何将excel中一列拆成多行_第3张图片

 

再进行去重:

a[0].drop_duplicates()

 

Python-pandas之如何将excel中一列拆成多行_第4张图片

两行代码即可搞定,最终就提取到了不重复的所有公交线路数据

高阶操作可以参考 https://zhuanlan.zhihu.com/p/28337202

你可能感兴趣的:(学习笔记,Python,Pandas,数据分析)