1、pandas使用sort_values排序

在创建DataFrame前,我们先生成随机数。(随机数在练习的时候很常用。) Numpy库的randn函数能生成多个随机数。

1、pandas使用sort_values排序_第1张图片
生成随机数

还可以用Numpy的arange函数 生成一个list,可以用作DataFrame的索引。我个人比较喜欢用arange,括号里是(起点值,终点值+1,步长)

1、pandas使用sort_values排序_第2张图片
生成列表作为索引

生成一个完整的DataFrame:

1、pandas使用sort_values排序_第3张图片
生成DataFrame

DataFrame有多个参数:data就是要转换成DataFrame的内容,很多数据类型都可以转换成DataFrame,比如:Series,字典,元组等等。如果是字典转换的话,“键”就默认是列名了。index是索引,columns是列名。

如果在转换成DataFrame时,没有指定index 和columns,系统会自动设定,都是从0开始的整数。

1、pandas使用sort_values排序_第4张图片
默认索引和列名

可以使用dtypes来查看各列的数据格式,info函数可以查看整个DataFrame的属性信息。

1、pandas使用sort_values排序_第5张图片
dtypes和info函数

查看前几行和后几行数据,括号里选择行的参数:

1、pandas使用sort_values排序_第6张图片
选择前后几行

对数值数据进行统计各类指标:

1、pandas使用sort_values排序_第7张图片
数值统计描述函数describe

一般分类数据用value_counts(后续会讲),数值数据用describe,这是最常用的两个统计函数。

选择数据的行、列索引和数值:

1、pandas使用sort_values排序_第8张图片
选择行、列索引和数值

行列转换:

1、pandas使用sort_values排序_第9张图片
转置函数T

还有一个转置函数unstack,用法有些许的区别。

1、pandas使用sort_values排序_第10张图片
unstack转置

对数据进行排序,用到了sort_values,by参数可以指定根据哪一列数据进行排序,ascending是设置升序和降序(选择多列或者多行排序要加[ ],把选择的行列转换为列表,排序方式也可以同样的操作)。

1、pandas使用sort_values排序_第11张图片
排序 sort_values

sort_values其它参数:axis=0或者1 纵向排序还是横;na_position='last' 将空值排在最后;kind和inplace是排序的具体方式,一般数据用不到。

sort_values其它参数

你可能感兴趣的:(1、pandas使用sort_values排序)