python中array函数表示什么_Python数据分析-numpy 详解

提纲:生成 ndarray

数组 ndarray 的数据类型。

数组的算术运算

数组的索引和切片

数组重塑和换轴。

快速的遍历元素数组函数

数组的向量化操作

统计函数

布尔方法,排序和集合操作

伪随机数生成

Numerical Python 简称 numpy,其将数组对象作为数据交换的通用语。主要进行数据处理清理,构造子集、过滤、变换和其他的计算中进行快速的向量运算。ndarray 是一个通用的多维同类型数据容器,包含的每一个元素都为同一类型。都有一个shape 属性来表征数组维度数和一个 dtype 属性,来描述数组的数据类型。

1,生成 ndarray

通过函数 array 生成一个新的 numpy 数组,常见的列表转换为数组。

还可以通过传递参数指定数据类型

其余的函数像是 zeros,ones 和 empty 也可以生成一维数组,生成高维的数组需要通过shape指定。

还有一个arange 函数是 range 的数组版。

常见的数组生成函数见下表

2,数组 ndarray 的数据类型

通过 dtype 可以显示数据的类型。

也可以通过 astype 来显示的转换数组的数据类型。注意 astype 将要生成一个新的数组。

3, 数组的算术运算

数组的一大特点就是允许进行批量操作而无需任何的 for 循环,称其为向量化。任何两个同尺寸数组之间的算数操作都应用了逐元素操作的方式。

比如:带有标量计算的操作会把计算参数传递给每一个元素。

同尺寸数组之间的比较会产生一个布尔型数组。

4,数组的索引和切片

数组的切片是原数组的视图,即数据并不是被复制了,任何对数组的修改都是对原数据的修改。如果想拷贝的话需要使用 arr[ ].copy

A,切片索引,对于高维的数组索引可以使用 arr [x,y] 的形式,其功能相当于 arr[x][y]。 也可以使用冒号:来默认的传入开始和结束位置,同样的幅值表示从后向前索引。逗号是索引高维数组的关键。

B,布尔索引,进行轴索引。选取对应布尔值为真的轴,布尔数组的长度必须和数组对应的轴索引长度一致。注意布尔索引,生成的是数据的拷贝,对原数组没有什么改变。

C, 顺序索引, 通过列表传入要索引的行标号。

5,数组重塑和换轴。

通过元组传入要变换后的数组维数。

计算内积使用 np.dot() 操作。

6,快速的遍历元素数组函数

通用函数是对简单函数向量化的封装。常用的一元通用函数如下:

7,数组的向量化操作

利用数组表达式来代替显示循环的方法 称之为向量化。

Numpy.where 函数的三元表达式x if condition else y 的向量化的表达。

8,统计函数

常用统计函数如下:

9,布尔方法,排序和集合操作

对于布尔数组,常用的两个函数是 any 和all 检查数组中有一个为真或是全都为真。

排序函数和内建函数一样使用sort 函数。即 np.sort()可以在括号中指定排序的轴 0 或是1.

集合操作常用的为计算唯一值, np.unique()

集合操作见下表

10,伪随机数生成

使用 numpy.random 模块来生成随机数,常用函数如下

总结:

本文主要围绕着 numpy 的数据类型-数组进行展开,关于多维数组的创建、查询、删除等操作。和一些统计操作和算数操作,伪随机数的是快速产生数组的方法。numpy 是下一节pandas 的基础。

编者按: 本文主要是学习 Python 数据分析的读书笔记和操作练习,参考书书籍为《利用Python 进行数据分析》作者 Wes Mckinney 许敬一 翻译。

欢迎大家一块学习讨论。

你可能感兴趣的:(python中array函数表示什么_Python数据分析-numpy 详解)