pandas数据处理:将dataframe中某一列中的数据分割为多个或多行并按分割的结果进行分析统计,以分析电影类型占比为例,每部电影的类型有多种,统计每种类型的数量和占比。

一、数据处理目标

        有一个excel类型或者说dataframe类型的二维表格,需要将其中一列的数据分割出来多个,然后对分割出来的数据进行统计分析。比如,有一个电影类型的数据如下:

pandas数据处理:将dataframe中某一列中的数据分割为多个或多行并按分割的结果进行分析统计,以分析电影类型占比为例,每部电影的类型有多种,统计每种类型的数量和占比。_第1张图片

        希望最后统计出各个类型的电影的数量和占比。比如,科幻类型的电影有几部,冒险类型的电影有几部,分别占总电影数量的百分之几等等。


二、代码实现

       1、先将数据转为dataframe格式的数据。如果你的数据是excel格式的,则读取出来,我这里为了演示,数据只直接写死的。

import  pandas as pd

df = pd.DataFrame([['流浪地球2','科幻|冒险|灾难',8.3],
                   ['肖申克的救赎','剧情|犯罪',9.7],
                   ['银河护卫队3

你可能感兴趣的:(python项目源码100+,pandas,分割,dataframe,类型,电影)