numpy 基本操作

NumPy库入门

ndarray对象

  • 生成一个ndarray数组
In [1]: import numpy as np

In [2]: a = np.array([[0,1,2,3,4],
   ...:             [9,8,7,6,5]])
   ...:

In [3]: a
Out[3]:
array([[0, 1, 2, 3, 4],
       [9, 8, 7, 6, 5]])

In [4]: print(a)
    [[0 1 2 3 4]
    [9 8 7 6 5]]
  • ndarray对象的属性
属性 说明
.ndim 维度的数量
.shape ndarray对象的尺寸,对于矩阵,n行m列
.size ndarray对象元素的个数
.dtype ndarray对象元素类型
.itemsize ndarray对象中每个元素的大小,以字节为单位
In [5]: a.ndim
Out[5]: 2

In [6]: a.shape
Out[6]: (2, 5)

In [7]: a.dtype
Out[7]: dtype('int32')

In [8]: a.itemsize
Out[8]: 4
  • 非同质的ndarray对象
    非同质的ndarray对象的类型为Object
In [9]: x = np.array([[0,1,2,3,4],
   ...:             [9,8,7,6] ])
   ...:

In [10]: x.shape
Out[10]: (2,)

In [11]: x.dtype
Out[11]: dtype('O')

In [12]: x
Out[12]: array([list([0, 1, 2, 3, 4]), list([9, 8, 7, 6])], dtype=object)

In [13]: x.itemsize
Out[13]: 8

In [14]: x.size
Out[14]: 2

ndarray数组的创建方法

(1)从Pyhton中的列表、元组等类型

x = np.array(list/tuple)
x = np.array(list/typle, dtype=np.float32)

当np.array()不指定dtype时,numpy将根据数据情况关联一个dtype类型。

In [15]: x = np.array([0,1,2,3])  # 从列表类型创建

In [16]: print(x)
[0 1 2 3]

In [17]: x = np.array((4,5,6,7))  # 从元组类型创建

In [18]: print(x) 
[4 5 6 7]

In [19]: x = np.array([[1,2],[9,8],(0.1, 0.2)])  # 从列表和元组混合类型创建

In [20]: print(x)
[[ 1.   2. ]
 [ 9.   8. ]
 [ 0.1  0.2]]

(2)使用numpy中函数创建ndarray数组

函数 说明
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型
np.full(shape, val) 根据shape生成一个数组,每个元素值都是val
np.eye(n) 创建一个正方形的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a, val) 根据数组a形状生成一个数组,每个元素值都是val
np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组
In [21]: np.arange(10)
Out[21]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [22]: np.ones((3,6))
Out[22]: 
array([[ 1.,  1.,  1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.,  1.,  1.]])

In [23]: np.zeros((3,6),dtype=np.int32)
Out[23]: 
array([[0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0]])

In [24]: np.eye(5)
Out[24]: 
array([[ 1.,  0.,  0.,  0.,  0.],
       [ 0.,  1.,  0.,  0.,  0.],
       [ 0.,  0.,  1.,  0.,  0.],
       [ 0.,  0.,  0.,  1.,  0.],
       [ 0.,  0.,  0.,  0.,  1.]])

In [25]: x = np.ones((2,3,4))

In [26]: print(x)
[[[ 1.  1.  1.  1.]
  [ 1.  1.  1.  1.]
  [ 1.  1.  1.  1.]]

 [[ 1.  1.  1.  1.]
  [ 1.  1.  1.  1.]
  [ 1.  1.  1.  1.]]]

In [27]: x.shape
Out[27]: (2, 3, 4)

In [28]: a = np.linspace(1, 10, 4)

In [29]: a
Out[29]: array([  1.,   4.,   7.,  10.])

In [30]: b = np.linspace(1, 10, 4, endpoint=False)

In [31]: b
Out[31]: array([ 1.  ,  3.25,  5.5 ,  7.75])

In [32]: c = np.concatenate((a,b))

In [33]: c
Out[33]: array([  1.  ,   4.  ,   7.  ,  10.  ,   1.  ,   3.25,   5.5 ,   7.75])

(3)从字节流(raw bytes)中创建ndarray数组
(4)从文件中读取特定格式,创建ndarray数组

ndarray数组的变换

  • ndarray数组的维度变换
    方法 说明
    .reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
    .resize(shape) 与.reshape()功能一致,但原数组改变
    .swapaxes(ax1, ax2) 将数组n个维度中两个维度进行调换
    .flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变
In [34]: a = np.ones((2,3,4), dtype=np.int32)

In [35]: a.reshape((3,8))
Out[35]: 
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])

In [36]: a
Out[36]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [37]: a.resize((3,8))

In [38]: a
Out[38]: 
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])

In [39]: a = np.ones((2,3,4), dtype=np.int32)

In [40]: a.flatten()
Out[40]:
array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

In [41]: a
Out[41]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [42]: b = a.flatten()

In [43]: b
Out[43]: 
array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
  • ndarray数组的类型变换

new_a = a.astype(new_type)
astype()方法一定会创建新的数组(原始数据的一个拷贝),即使两个类型一致。

In [44]: a = np.ones((2,3,4), dtype=np.int)

In [45]: a
Out[45]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [46]: b = a.astype(np.float)

In [47]: b
Out[47]: 
array([[[ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.]],

       [[ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.]]])
  • ndarray数组向列表的转换

ls = a.tolist()

In [48]: a = np.full((2,3,4), 25, dtype=np.int32)

In [49]: a
Out[49]: 
array([[[25, 25, 25, 25],
        [25, 25, 25, 25],
        [25, 25, 25, 25]],

       [[25, 25, 25, 25],
        [25, 25, 25, 25],
        [25, 25, 25, 25]]])

In [50]: a.tolist()
Out[50]: 
[[[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]],
 [[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]]]

ndarray数组的操作

  • 一维数组的索引和切片

与python的列表相似

In [51]: a = np.array([9,8,7,6,5])

In [52]: a[2]
Out[52]: 7

In [53]: a[1:4:2]     # 起始编号 : 终止编号(不含) : 步长(3元素冒号分割),编号0开始从左递增,或-1开始从右递减
Out[53]: array([8, 6])
  • 多维数组的索引
In [54]: a = np.arange(24).reshape((2,3,4))

In [55]: a
Out[55]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [56]: a[1,2,3]         # 每个维度一个索引值,逗号分割
Out[56]: 23

In [57]: a[0,1,2]
Out[57]: 6

In [58]: a[-1,-2,-3] 
Out[58]: 17
  • 多维数组的切片
In [59]: a[: , 1, -3]         # 选取一个维度用
Out[59]: array([ 5, 17])

In [60]: a[: , 1:3, :]         # 每个维度切片方法与一维数组相同
Out[60]: 
array([[[ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [61]: a[: , :, ::2]         # 每个维度可以使用步长跳跃切片
Out[61]: 
array([[[ 0,  2],
        [ 4,  6],
        [ 8, 10]],

       [[12, 14],
        [16, 18],
        [20, 22]]])

ndarray数组的运算

  • numpy一元函数

对ndarray中的数据执行元素级运算的函数

函数 说明
np.abs(x), np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x), np.log10(x), np.log2(x) 计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x), np.floor(x) 计算数组各元素的ceiling值或floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x), np.cosh(x),np.sin(x), np.sinh(x),np.tan(x), np.tanh(x) 计算数组各元素的普通型和双曲型三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值,1(+),0,-1(-)
In [65]: a = np.arange(24).reshape((2,3,4))

In [66]: np.square(a)
Out[66]: 
array([[[  0,   1,   4,   9],
        [ 16,  25,  36,  49],
        [ 64,  81, 100, 121]],

       [[144, 169, 196, 225],
        [256, 289, 324, 361],
        [400, 441, 484, 529]]], dtype=int32)

In [67]: a = np.sqrt(a)

In [68]: a
Out[68]:
array([[[ 0.        ,  1.        ,  1.41421356,  1.73205081],
        [ 2.        ,  2.23606798,  2.44948974,  2.64575131],
        [ 2.82842712,  3.        ,  3.16227766,  3.31662479]],

       [[ 3.46410162,  3.60555128,  3.74165739,  3.87298335],
        [ 4.        ,  4.12310563,  4.24264069,  4.35889894],
        [ 4.47213595,  4.58257569,  4.69041576,  4.79583152]]])

In [69]: np.modf(a)
Out[69]: 
(array([[[ 0.        ,  0.        ,  0.41421356,  0.73205081],
         [ 0.        ,  0.23606798,  0.44948974,  0.64575131],
         [ 0.82842712,  0.        ,  0.16227766,  0.31662479]],
 
        [[ 0.46410162,  0.60555128,  0.74165739,  0.87298335],
         [ 0.        ,  0.12310563,  0.24264069,  0.35889894],
         [ 0.47213595,  0.58257569,  0.69041576,  0.79583152]]]),
 array([[[ 0.,  1.,  1.,  1.],
         [ 2.,  2.,  2.,  2.],
         [ 2.,  3.,  3.,  3.]],
 
        [[ 3.,  3.,  3.,  3.],
         [ 4.,  4.,  4.,  4.],
         [ 4.,  4.,  4.,  4.]]]))
  • numpy二元函数
函数 说明
+ - * / ** 两个数组各元素对应运算
np.maximum(x,y), np.fmax(), np.minimum(x,y), np.fmin() 元素级的最大值/最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == != 算术比较,产生布尔型数组
In [70]: a = np.arange(24).reshape((2,3,4))

In [71]: b = np.sqrt(a)

In [72]: a
Out[72]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [73]: b
Out[73]: 
array([[[ 0.        ,  1.        ,  1.41421356,  1.73205081],
        [ 2.        ,  2.23606798,  2.44948974,  2.64575131],
        [ 2.82842712,  3.        ,  3.16227766,  3.31662479]],

       [[ 3.46410162,  3.60555128,  3.74165739,  3.87298335],
        [ 4.        ,  4.12310563,  4.24264069,  4.35889894],
        [ 4.47213595,  4.58257569,  4.69041576,  4.79583152]]])

In [74]: np.maximum(a,b)
Out[74]: 
array([[[  0.,   1.,   2.,   3.],
        [  4.,   5.,   6.,   7.],
        [  8.,   9.,  10.,  11.]],

       [[ 12.,  13.,  14.,  15.],
        [ 16.,  17.,  18.,  19.],
        [ 20.,  21.,  22.,  23.]]])

In [75]: a > b
Out[75]: 
array([[[False, False,  True,  True],
        [ True,  True,  True,  True],
        [ True,  True,  True,  True]],

       [[ True,  True,  True,  True],
        [ True,  True,  True,  True],
        [ True,  True,  True,  True]]], dtype=bool)

numpy数据存取与函数

数据的csv文件存取

np.savetxt(frame,array,fmt='%.18e',delimiter=None)
  • frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件。
  • array:存入文件的数组。
  • fmt:写入文件的格式,例如:%d %.2f %.18e。
  • delimiter:分割字符串,默认是任何空格。
In [1]: import numpy as np

In [2]: a = np.arange(100).reshape(5,20)

In [3]: np.savetxt('a.csv', a, fmt='%d', delimiter=',')

In [4]: np.savetxt('a1.csv', a, fmt='%.1f', delimiter=',')
np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)
  • frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件。
  • dtype:数据类型,可选。
  • delimiter:分割字符串,默认是任何空格。
  • unpack:如果True,读入属性将分别写入不同变量。
In [5]: b = np.loadtxt('a1.csv', delimiter=',')

In [6]: b
Out[6]: 
array([[  0.,   1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.,  10.,
         11.,  12.,  13.,  14.,  15.,  16.,  17.,  18.,  19.],
       [ 20.,  21.,  22.,  23.,  24.,  25.,  26.,  27.,  28.,  29.,  30.,
         31.,  32.,  33.,  34.,  35.,  36.,  37.,  38.,  39.],
       [ 40.,  41.,  42.,  43.,  44.,  45.,  46.,  47.,  48.,  49.,  50.,
         51.,  52.,  53.,  54.,  55.,  56.,  57.,  58.,  59.],
       [ 60.,  61.,  62.,  63.,  64.,  65.,  66.,  67.,  68.,  69.,  70.,
         71.,  72.,  73.,  74.,  75.,  76.,  77.,  78.,  79.],
       [ 80.,  81.,  82.,  83.,  84.,  85.,  86.,  87.,  88.,  89.,  90.,
         91.,  92.,  93.,  94.,  95.,  96.,  97.,  98.,  99.]])

In [7]: b = np.loadtxt('a1.csv', dtype=np.int, delimiter=',')

In [8]: b
Out[8]: 
array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
        17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,
        37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56,
        57, 58, 59],
       [60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76,
        77, 78, 79],
       [80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96,
        97, 98, 99]])

  • csv文件的局限性:
    CSV只能有效存储一维和二维数组。np.savetxt()、np.loadtxt()只能有效存取一维和二维数组。

多维数据的存取

a.tofile(frame, sep='', format='%s')
  • frame:文件、字符串。
  • sep:数据分割字符串,如果是空串,写入文件为二进制。
  • format:写入数据的格式。
In [9]: a = np.arange(100).reshape(5,10,2)

In [10]: a.tofile('b.dat', sep=',', format='%d')

In [11]: a.tofile('b1.dat', format='%d')
np.fromfile(frame, dtype=float, count=-1, sep='')
  • frame:文件、字符串。
  • dtype:读取的数据类型。
  • count:读取元素个数,-1表示读入整个文件。
  • sep:数据分割字符串,如果是空串,写入文件为二进制。
In [9]: c = np.fromfile('b.dat', dtype=np.int, sep=',')

In [10]: c
Out[10]: 
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

In [11]: c = np.fromfile('b.dat', dtype=np.int, sep=',').reshape(5,10,2)
  • 需要注意:
    该方法需要读取时知道存入文件时数组的维度和元素类型。a.tofile()和np.fromfile()需要配合使用。可以通过元素据文件来存储额外信息。也可以通过文件名来保存数组维度和元素类型(例:b1_int_5_10_2.dat)

numpy的便捷文件存取

np.save(frame, array) 或 np.savez(fname, array)

np.load(frame)
  • fname:文件名,以.npy为扩展名,压缩扩展名为.npz
  • array:数组变量

numpy 的随机数函数

numpy的random子库

基本格式:np.random.*
np.random.rand()、np.random.randn()…

函数 说明
rand(d0,…dn) 根据d0 - dn 创建随机数组,浮点数,[0,1),均匀分布
randn(d0,…dn) 根据d0 - dn创建随机数组,标准正态分布
randint(low,hign,shape) 根据shape创建随机整数或整数数组,范围是[low,high]
seed(s) 随机数种子,s是给定的种子值
In [18]: a = np.random.rand(3,4,5)

In [19]: a
Out[19]: 
array([[[ 0.97845512,  0.90466706,  0.92576248,  0.77775142,  0.84334893],
        [ 0.39599821,  0.31917683,  0.7961439 ,  0.01324569,  0.97660396],
        [ 0.5049603 ,  0.80952265,  0.67359257,  0.89334316,  0.94496225],
        [ 0.04840473,  0.04665257,  0.20956817,  0.62255095,  0.36600489]],

       [[ 0.58059326,  0.28464266,  0.23596248,  0.16677631,  0.86467069],
        [ 0.14691968,  0.60863245,  0.71725038,  0.69206766,  0.18301705],
        [ 0.73197901,  0.99051723,  0.10489076,  0.33979432,  0.0354286 ],
        [ 0.73696453,  0.48268632,  0.99294233,  0.06285961,  0.93090147]],

       [[ 0.07853777,  0.827061  ,  0.66325364,  0.52289669,  0.96894828],
        [ 0.41912388,  0.01883408,  0.80978245,  0.93082898,  0.98095581],
        [ 0.58614214,  0.55996867,  0.37734444,  0.79280598,  0.03626233],
        [ 0.233132  ,  0.22514788,  0.32245147,  0.13739658,  0.18866422]]])

In [20]: sn = np.random.randn(3,4,5)

In [21]: sn
Out[21]: 
array([[[-0.54821321,  0.35733947,  0.74102173, -1.26679716, -0.75072289],
        [ 0.13182283,  2.32578442, -0.52208189,  2.5041796 , -0.96995644],
        [ 1.00171095,  0.97037733,  1.55386206, -0.94515087,  0.75707273],
        [-1.2481768 ,  0.53095038,  0.92527818, -0.17261088, -0.13667463]],

       [[ 2.18760173, -0.93813162,  0.19032109, -1.59605908, -0.96802666],
        [ 0.30649913,  1.32375007,  0.72547761, -1.59253182, -0.72385311],
        [-2.22923637, -1.05462649,  1.82672301,  0.47343961, -0.9786459 ],
        [-0.36857965,  0.59003624,  1.80140997,  1.00965744,  1.9037593 ]],

       [[ 0.36273071, -0.0447364 ,  1.27120325,  0.21076423, -0.40820945],
        [-1.22315321, -1.94670543,  0.17959233, -1.1020581 ,  0.17423733],
        [-1.16368644,  0.00589158,  1.19701291, -0.4255035 , -0.7508364 ],
        [-1.61788168,  0.50386607,  0.15993032,  0.36881486, -0.41457221]]])

In [22]: b = np.random.randint(100,200,(3,4))

In [23]: b
Out[23]: 
array([[163, 171, 163, 168],
       [166, 127, 160, 109],
       [135, 111, 196, 190]])

In [24]: np.random.seed(10)

In [25]: np.random.randint(100,200,(3,4))
Out[25]: 
array([[109, 115, 164, 128],
       [189, 193, 129, 108],
       [173, 100, 140, 136]])

In [26]: np.random.seed(10)

In [27]: np.random.randint(100,200,(3,4))
Out[27]: 
array([[109, 115, 164, 128],
       [189, 193, 129, 108],
       [173, 100, 140, 136]])
函数 说明
shuffle(a) 根据数组a的第1轴进行随机排列,改变数组x
permutation(a) 根据数组a的第1轴产生一个新的乱序数组,不改变数组x
choice(a,size,replace,p) 从一维数组a中以概率p抽取元素,形成size形状新数组
replace表示是否可以重用元素,默认为False
In [28]: a = np.random.randint(100,200,(3,4))

In [29]: a
Out[29]: 
array([[116, 111, 154, 188],
       [162, 133, 172, 178],
       [149, 151, 154, 177]])

In [30]: np.random.shuffle(a)

In [31]: a
Out[31]: 
array([[116, 111, 154, 188],
       [149, 151, 154, 177],
       [162, 133, 172, 178]])

In [32]: np.random.shuffle(a)

In [33]: a
Out[33]: 
array([[162, 133, 172, 178],
       [116, 111, 154, 188],
       [149, 151, 154, 177]])

In [34]: a = np.random.randint(100,200,(3,4))

In [35]: a
Out[35]: 
array([[113, 192, 186, 130],
       [130, 189, 112, 165],
       [131, 157, 136, 127]])

In [36]: np.random.permutation(a)
Out[36]: 
array([[113, 192, 186, 130],
       [130, 189, 112, 165],
       [131, 157, 136, 127]])

In [37]: a
Out[37]: 
array([[113, 192, 186, 130],
       [130, 189, 112, 165],
       [131, 157, 136, 127]])

In [38]: b = np.random.randint(100,200,(8,))

In [39]: b
Out[39]: array([177, 122, 123, 194, 111, 128, 174, 188])

In [40]: np.random.choice(b,(3,2))
Out[40]: 
array([[122, 188],
       [123, 177],
       [174, 188]])

In [41]: np.random.choice(b,(3,2),replace=False)
Out[41]: 
array([[123, 111],
       [128, 188],
       [174, 122]])

In [42]: np.random.choice(b,(3,2),p= b/np.sum(b))
Out[42]: 
array([[174, 122],
       [188, 194],
       [174, 123]])
函数 说明
uniform(low,high,size) 产生具有均匀分布的数组,low起始值,high结束值,size形状
normal(loc,scale,size) 产生具有正态分布的数组,loc均值,scale标准差,size形状
poisson(lam,size) 产生具有泊松分布的数组,lam随机事件发生率,size形状
In [43]: u = np.random.uniform(0,10,(3,4))

In [44]: u
Out[44]: 
array([[ 8.8393648 ,  3.25511638,  1.65015898,  3.92529244],
       [ 0.93460375,  8.21105658,  1.5115202 ,  3.84114449],
       [ 9.44260712,  9.87625475,  4.56304547,  8.26122844]])

In [45]: n = np.random.normal(10,5,(3,4))

In [46]: n
Out[46]: 
array([[ 12.8882903 ,   2.6251256 ,  10.39394227,  14.59206826],
       [  7.5365132 ,  10.48231186,   6.73620032,   8.89118781],
       [  4.65856717,   3.86153973,   1.00713488,   6.5739633 ]])

numpy统计函数

函数 说明
.sum(a,axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组
.mean(a,axis=None 根据给定轴axis计算数组a相关元素的期望,axis整数或元组
.average(a,axis=None,weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
.std(a,axis=None 根据给定轴axis计算数组a相关元素的标准差
.var(a,axis=None 根据给定轴axis计算数组a相关元素的方差
In [47]: a = np.arange(15).reshape(3,5)

In [48]: a
Out[48]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [49]: np.sum(a)
Out[49]: 105

In [50]: np.mean(a,axis=1)      # 2. = (0+5+10)/3
Out[50]: array([  2.,   7.,  12.])

In [51]: np.mean(a,axis=0)
Out[51]: array([ 5.,  6.,  7.,  8.,  9.]) # 7. = (2+7+12)/3

In [52]: np.average(a, axis=0, weights=[10,5,1]) #  加权平均: 4.1875 = (2*10+7*5+1*12)/(10+5+1)
Out[52]: array([ 2.1875,  3.1875,  4.1875,  5.1875,  6.1875])

In [53]: np.std(a)
Out[53]: 4.3204937989385739

In [54]: np.var(a)
Out[54]: 18.666666666666668
函数 说明
.min(a), .max(a) 计算数组a中元素的最小值、最大值
.argmin(a), .argmax(a) 计算数组a中元素最小值、最大值的降一维后下标
.unravel_index(index,shape) 根据shape将一维下标index转换成多维下标
.ptp(a) 计算数组a中元素最大值与最小值的差
.median(a) 计算数组a中元素的中位数(中值)
In [55]: b = np.arange(15,0,-1).reshape(3,5)

In [56]: b
Out[56]: 
array([[15, 14, 13, 12, 11],
       [10,  9,  8,  7,  6],
       [ 5,  4,  3,  2,  1]])

In [57]: np.max(b)
Out[57]: 15

In [58]: np.argmax(b)   # 扁平化后的下标
Out[58]: 0

In [59]: np.unravel_index(np.argmax(b), b.shape)    # 重塑成多维下标
Out[59]: (0, 0)

In [60]: np.ptp(b)
Out[60]: 14

In [61]: np.median(b)
Out[61]: 8.0

numpy的梯度函数

函数 说明
np.gradient(a) 返回数组a中元素的梯度,当a为多维度时,返回每个维度梯度

梯度:连续值之间的变化率,即斜率。 XY坐标轴连续X坐标对应的Y轴值:a,b,c,其中b的梯度是:(c-a)/2

In [62]: a = np.random.randint(0,20,(5))

In [63]: a
Out[63]: array([14, 16, 10, 17,  0])

In [64]: np.gradient(a)     # 存在两侧值:-2. = (10-14)/2
Out[64]: array([  2. ,  -2. ,   0.5,  -5. , -17. ])

In [65]: b = np.random.randint(0,20,(5))

In [66]: b
Out[66]: array([17,  9, 16,  9, 12])

In [67]: np.gradient(b)     # 只有一侧值:-8. = (9-17)/1
Out[67]: array([-8. , -0.5,  0. , -2. ,  3. ])

In [68]: c = np.random.randint(0, 50, (3,5))

In [69]: c
Out[69]: 
array([[30, 17, 17, 16,  0],
       [31, 37,  9,  0, 38],
       [22, 32,  2,  3, 31]])

In [70]: np.gradient(c)
Out[70]: 
[array([[  1. ,  20. ,  -8. , -16. ,  38. ],
        [ -4. ,   7.5,  -7.5,  -6.5,  15.5],
        [ -9. ,  -5. ,  -7. ,   3. ,  -7. ]]),
 array([[-13. ,  -6.5,  -0.5,  -8.5, -16. ],
        [  6. , -11. , -18.5,  14.5,  38. ],
        [ 10. , -10. , -14.5,  14.5,  28. ]])]

PIL库

简单使用

In [1]: from PIL import Image

In [2]: import numpy as np

In [3]: im = np.array(Image.open("img.jpg"))

In [4]: print(im.shape,im.dtype)
(435, 428, 3) uint8

In [5]: b = [255,255,255] - im

In [6]: new_im = Image.fromarray(b.astype('uint8'))

In [7]: new_im.save("img.jpg")

In [8]: a = np.array(Image.open("img.jpg").convert('L')) # 使用灰度表示图像

In [9]: b = 255 - a 

In [10]: im = Image.fromarray(b.astype('uint8'))

In [11]: im.save("img.jpg")

In [12]: c = (100/255)*a +150   # 区间变换

In [13]: im = Image.fromarray(c.astype('uint8'))

In [14]: im.save("img.jpg")

In [15]: d = 255 * (a/255)**2  # 像素平方

In [16]: im = Image.fromarray(d.astype('uint8'))

In [17]: im.save("img.jpg")

图像手绘效果

手绘效果特征:

  • 黑白灰色
  • 黑白灰色
  • 边界线条较重
  • 相同或相近色彩趋于白色
  • 略有光源效果

完整代码:

from PIL import Image
import numpy as np

a = np.asarray(Image.open('img.png').convert('L')).astype('float')

depth = 10. 						# (0-100)
grad = np.gradient(a)				#取图像灰度的梯度值
grad_x, grad_y = grad 				#分别取横纵图像梯度值
grad_x = grad_x*depth/100.
grad_y = grad_y*depth/100.
A = np.sqrt(grad_x**2 + grad_y**2 + 1.)
uni_x = grad_x/A
uni_y = grad_y/A
uni_z = 1./A

vec_el = np.pi/2.2 					# 光源的俯视角度,弧度值
vec_az = np.pi/4. 					# 光源的方位角度,弧度值
dx = np.cos(vec_el)*np.cos(vec_az) 	#光源对x 轴的影响
dy = np.cos(vec_el)*np.sin(vec_az) 	#光源对y 轴的影响
dz = np.sin(vec_el) 				#光源对z 轴的影响

b = 255*(dx*uni_x + dy*uni_y + dz*uni_z) 	#光源归一化
b = b.clip(0,255)

im = Image.fromarray(b.astype('uint8')) 	#重构图像
im.save('img2.jpg')

你可能感兴趣的:(python)