IT小生2020

Python数据分析及可视化实例之“NumPy“

一、概述

什么是Numpy：Numeric Python ？

NumPy系统是Python的一种开源的数值计算扩展

一个强大的N维数组对象Array

比较成熟的（广播）函数库

用于整合C/C++和Fortran代码的工具包

实用的线性代数、傅里叶变换和随机数生成函数

numpy和稀疏矩阵运算包scipy配合使用更加强大

二、Numpy安装与版本确认

安装

安装 NumPy 最简单的方法就是使用 pip工具：（不建议使用）

pip3 install --user numpy scipy matplotlib

--user 选项可以设置只安装在当前的用户下，而不是写入到系统目录。

默认情况使用国外线路，国外太慢，我们使用清华的镜像就可以:

pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

测试是否安装成功：

In[ ]:

from numpy import *

eye(4)

array([[1., 0., 0., 0.],

[0., 1., 0., 0.],

[0., 0., 1., 0.],

[0., 0., 0., 1.]])

导入numpy与版本确认（numpy get started）

In[ ]:

import numpy as np

#查看版本

np.__version__

'1.19.5'

三、NumPy

NumPy之Ndarray 对象

NumPy 最重要的一个特点是其N维数组对象 ndarray，它是一系列同类型数据的集合，以0下标为开始进行集合中元素的索引。

ndarray 对象是用于存放同类型元素的多维数组。（如果传进来的列表中包含不同的类型，则统一为同一类型，优先级：str > float > int）

ndarray 中的每个元素在内存中都有相同存储大小的区域。

ndarray 内部由以下内容组成：

一个指向数据（内存或内存映射文件中的一块数据）的指针。

数据类型或 dtype，描述在数组中的固定大小值的格子。

一个表示数组形状（shape）的元组，表示各维度大小的元组。

一个跨度元组（stride），其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。

ndarray 的内部结构:

跨度可以是负数，这样会使数组在内存中后向移动，切片中 obj[::-1] 或 obj[:,::-1] 就是如此。

创建一个 ndarray 只需调用 NumPy 的 array 函数即可：

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

参数说明：

名称	描述
object	数组或嵌套的数列
dtype	数组元素的数据类型，可选
copy	对象是否需要复制，可选
order	创建数组的样式，C为行方向，F为列方向，A为任意方向（默认）
subok	默认返回一个与基类类型一致的数组
ndmin	指定生成数组的最小维度

一、创建ndarray

1. 使用np.array()由python list创建

注意：

numpy默认ndarray的所有元素的类型是相同的
如果传进来的列表中包含不同的类型，则统一为同一类型，优先级：str>float>int

In[ ]:

l = [3,1,4,5,9,6] #一维的数组

n = np.array(l)

display(n,l)

array([3, 1, 4, 5, 9, 6])

[3, 1, 4, 5, 9, 6]

In[ ]:

# 多于一个维度

import numpy as np

a = np.array([[1, 2], [3, 4]])

print (a)

[[1 2]

[3 4]]

In[ ]:

# 最小维度

import numpy as np

a = np.array([1,2,3,4,5], ndmin = 2)

print (a)

[[1 2 3 4 5]]

In[ ]:

# dtype 参数

import numpy as np

a = np.array([1, 2, 3], dtype = complex)

print (a)

[1.+0.j 2.+0.j 3.+0.j]

如果要确定，数组的维度，使用np.shape方法（翻译：shape，形状）

In[ ]:

l = [3,1,4,5,9,6]

n = np.array(l) #shape()是数组的属性，需要把集合变成数组,然后np.shape

display(n.shape)

(6,)

In[ ]:

n2 = np.array([[3,4,7,1],[3,0,1,8],[2,4,6,8]])

display(n2.shape)

(3, 4)

对于数组中有不同类型的元素，则会将元素统一为同一类型

In[ ]:

n3 = np.array(['0',9.18,20])

array(['0', '9.18', '20'], dtype='

2. 使用np的routines函数创建

包含以下常见创建方法：

np.ones(shape, dtype=None, order='C')

参数说明：

用“1”来填充一个矩阵：
shape：形状，生成2行3列矩阵：shape=(2,3);
dtype：指的是数组当中数据元素的类型，如果单type，指的是整个对象的类型；默认类型是numpy.float64
order:影响数组在内存中的储存方式,不用动；（'C' 用于 C 的行数组，或者 'F' 用于 FORTRAN 的列数组）

In[ ]:

one = np.ones((2,3,5),dtype=int)

one

array([[[1, 1, 1, 1, 1],

[1, 1, 1, 1, 1],

[1, 1, 1, 1, 1]],

[[1, 1, 1, 1, 1],

[1, 1, 1, 1, 1],

[1, 1, 1, 1, 1]]])

In[ ]:

# 自定义类型

np.ones([3,3],dtype=int)

array([[1, 1, 1],

[1, 1, 1],

[1, 1, 1]])

In[ ]:

import matplotlib.pyplot as plt #图片需要导入matplotlib.pyplot

ones = np.ones(shape = (100,80,3),dtype=float)

plt.imshow(ones) #imshow是matlab中显示图像的函数,imshow(BW) 功能，显示一张二值图像BW,负责对图像进行处理，并显示其格式，但是不能显示!

plt.show #显示出来

2) np.zeros(shape, dtype=float, order='C')

返回来一个给定形状和类型的用0填充的数组；

In[ ]:

np.zeros((2,3,5))

array([[[0., 0., 0., 0., 0.],

[0., 0., 0., 0., 0.],

[0., 0., 0., 0., 0.]],

[[0., 0., 0., 0., 0.],

[0., 0., 0., 0., 0.],

[0., 0., 0., 0., 0.]]])

3) np.full(shape, fill_value, dtype=None, order='C')

返回给定维度和类型的新数组，填充 fill_value。

shape：形状：整数或整数序列新数组的形状，例如（2，3）或2；

fill_value：填充值；

dtype：返回数组的数据类型；

order：在计算机内存中的存储元素的顺序，只支持 ‘C’（按行）、‘F’（按列），默认 ‘C’；

In[ ]:

np.full((2,3),fill_value=8.88)

array([[8.88, 8.88, 8.88],

[8.88, 8.88, 8.88]])

4) np.eye(N, M=None, k=0, dtype=float)
对角线为1其他的位置为0

生成对角矩阵；
N：列数
M：行数
K：默认情况下输出的是对角线全“1”，其余全“0”的方阵，如果k为正整数，则在右上方第k条对角线全“1”其余全“0”，k为负整数则在左下方第k条对角线全“1”其余全“0”。对角线的偏移量。

In[ ]:

#矩阵，满秩矩阵

np.eye(5)

array([[1., 0., 0., 0., 0.],

[0., 1., 0., 0., 0.],

[0., 0., 1., 0., 0.],

[0., 0., 0., 1., 0.],

[0., 0., 0., 0., 1.]])

5) np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

在指定的间隔内返回均匀间隔的
start：序列的起始值
stop：序列的终止值
num：采样的数目，默认值为50
dtype：输出序列的类型

In[ ]:

# lin = linear 线性

# 00000000

# 11111111 = 127

np.linspace(start = 0,stop = 150,num = 50,endpoint=False,retstep=True,dtype=np.int8)

(array([ 0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30,

33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63,

66, 69, 72, 75, 78, 81, 84, 87, 90, 93, 96,

99, 102, 105, 108, 111, 114, 117, 120, 123, 126, -127,

-124, -121, -118, -115, -112, -109], dtype=int8),

3.0)

In[ ]:

np.linspace(start = 0,stop = 150,num = 50)

array([ 0. , 3.06122449, 6.12244898, 9.18367347,

12.24489796, 15.30612245, 18.36734694, 21.42857143,

24.48979592, 27.55102041, 30.6122449 , 33.67346939,

36.73469388, 39.79591837, 42.85714286, 45.91836735,

48.97959184, 52.04081633, 55.10204082, 58.16326531,

61.2244898 , 64.28571429, 67.34693878, 70.40816327,

73.46938776, 76.53061224, 79.59183673, 82.65306122,

85.71428571, 88.7755102 , 91.83673469, 94.89795918,

97.95918367, 101.02040816, 104.08163265, 107.14285714,

110.20408163, 113.26530612, 116.32653061, 119.3877551 ,

122.44897959, 125.51020408, 128.57142857, 131.63265306,

134.69387755, 137.75510204, 140.81632653, 143.87755102,

146.93877551, 150. ])

6) np.arange([start, ]stop, [step, ]dtype=None)

在给定间隔内返回均匀间隔的值。值在半开区间 [开始，停止]内生成（换句话说，包括开始但不包括停止的区间）,返回的是 ndarray 。

start —— 开始位置，数字，可选项，默认起始值为0

stop —— 停止位置，数字

step —— 步长，数字，可选项，默认步长为1，如果指定了step，则还必须给出start。

dtype —— 输出数组的类型。如果未给出dtype，则从其他输入参数推断数据类型。

arange：ndarray

均匀间隔值的数组。

注意：对于浮点参数（参数为浮点），结果的长度为ceil（（stop - start）/ step））由于浮点溢出，此规则可能导致最后一个元素大于stop。因此要特别注意

In[ ]:

np.arange(0,100,step = 3)

array([ 0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48,

51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 90, 93, 96, 99])

7) np.random.randint(low, high=None, size=None, dtype='l')

low—–为最小值

high—-为最大值

size—–为数组维度大小

dtype—为数据类型，默认的数据类型是np.int。

返回值：

返回随机整数或整型数组，范围区间为[low,high），包含low，不包含high；

high没有填写时，默认生成随机数的范围是[0，low），随机生成区间内的一个整数。

In[ ]:

#ndarray

np.random.randint(-100,100,size = (4,5))

array([[-21, 95, -92, -82, 18],

[ -4, -58, -85, 0, 93],

[-52, 24, -44, 94, 14],

[ 24, -42, 11, -6, -11]])

8) np.random.randn(d0, d1, ..., dn)

标准正太分布

rand函数根据给定维度生成[0,1)之间的数据，包含0，不包含1
dn表格每个维度
返回值为指定维度的array

In[ ]:

#d0,d1……dn

#dimensional 维度

np.random.randn(2,2)

array([[ 2.9323179 , -0.52229644],

[-1.57196274, -0.7304904 ]])

9) np.random.normal(loc=0.0, scale=1.0, size=None)

普通正态分布

loc：float；此概率分布的均值（对应着整个分布的中心centre）

scale：float；此概率分布的标准差（对应于分布的宽度，scale越大越矮胖，scale越小，越瘦高）

size：int or tuple of ints；输出的shape，默认为None，只输出一个值

In[ ]:

np.random.normal(175,100,56)

array([132.44700835, 124.88970839, 207.91759326, 274.91459194,

289.78342744, 316.84093516, 68.30847232, 87.22738987,

189.69581369, 173.234369 , 14.17717944, 218.68074211,

214.76200606, 359.01632704, 211.25431991, 48.06710547,

220.03881157, 176.07973654, 174.2790892 , 63.5676417 ,

204.79259998, 359.1096867 , 128.47983432, 131.99724887,

260.63815625, 266.31307691, 268.23095105, 143.55945709,

356.7349408 , 55.49789815, 62.9268791 , 307.36801101,

124.25949273, 122.28770555, 153.04858479, 304.3048676 ,

89.62540276, 218.50123029, 284.95636614, 226.81144485,

160.04816989, 238.90494062, 18.31975515, 114.71202492,

142.25181009, 232.56186049, 154.73708967, 265.10839932,

186.96409292, 219.92183863, 227.69860028, 174.5008949 ,

161.27998806, 236.44246104, 183.47538765, 290.4305708 ])

10) np.random.random(size=None)

生成0到1的随机数，左闭右开

In[ ]:

np.random.random(size = 10)

array([0.3572361 , 0.55457738, 0.25533856, 0.42303569, 0.72208673,

0.95651551, 0.49013416, 0.60802548, 0.92484268, 0.45199402])

扩展：

#使用随机数成成一张图片

In[ ]:

image = np.random.random(size = (10,20,3))

plt.imshow(image)

plt.show()

二、ndarray的属性

NumPy 数组的维数称为秩（rank），秩就是轴的数量，即数组的维度，一维数组的秩为 1，二维数组的秩为 2，以此类推。

在 NumPy中，每一个线性的数组称为是一个轴（axis），也就是维度（dimensions）。比如说，二维数组相当于是两个一维数组，其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是 NumPy 中的轴（axis），第一个轴相当于是底层数组，第二个轴是底层数组里的数组。而轴的数量——秩，就是数组的维数。

很多时候可以声明 axis。

axis=0，表示沿着第 0 轴进行操作，即对每一列进行操作；axis=1，表示沿着第1轴进行操作，即对每一行进行操作。

NumPy 的数组中比较重要 ndarray 对象属性有：

属性	说明
ndarray.ndim	秩，即轴的数量或维度的数量
ndarray.shape	数组的维度，对于矩阵，n 行 m 列
ndarray.size	数组元素的总个数，相当于 .shape 中 n*m 的值
ndarray.dtype	ndarray 对象的元素类型
ndarray.itemsize	ndarray 对象中每个元素的大小，以字节为单位
ndarray.flags	ndarray 对象的内存信息
ndarray.real	ndarray元素的实部
ndarray.imag	ndarray 元素的虚部
ndarray.data	包含实际数组元素的缓冲区，由于一般通过数组的索引获取元素，所以通常不需要使用这个属性。

4个必记参数：

ndim：维度；shape：形状（各维度的长度）；size：总长度；dtype：元素类型

1、ndarray.ndim

ndarray.ndim用于返回数组的维数，等于秩。

In[ ]:

import matplotlib.pyplot as plt

cat = plt.imread('cat.jpg')

cat.ndim

2、ndarray.shape

ndarray.shape表示数组的维度，返回一个元组，这个元组的长度就是维度的数目，即 ndim 属性(秩)。比如，一个二维数组，其维度表示"行数"和"列数"。

ndarray.shape 也可以用于调整数组大小。

In[ ]:

image.shape

(10, 20, 3)

In[ ]:

a = np.array([[1,2,3],[4,5,6]])

print (a.shape)

(2, 3)

调整数组大小：

In[ ]:

a = np.array([[1,2,3],[4,5,6]])

a.shape = (3,2) #调整数组

print (a)

[[1 2]

[3 4]

[5 6]]

NumPy 也提供了 reshape 函数来调整数组大小。

In[ ]:

a = np.array([[1,2,3],[4,5,6]])

b = a.reshape(3,2)

print (b)

[[1 2]

[3 4]

[5 6]]

3、ndarray.size

数组元素的总个数，相当于 .shape 中 n*m 的值

In[ ]:

image.size

998640

4、ndarray.dtype

ndarray 对象的元素类型

In[ ]:

image.dtype

dtype('float64')

三、ndarray的基本操作

ndarray对象的内容可以通过索引或切片来访问和修改，与 Python 中 list 的切片操作一样。

ndarray 数组可以基于 0 - n 的下标进行索引，切片对象可以通过内置的 slice 函数，并设置 start, stop 及 step 参数进行，从原数组中切割出一个新数组。

1. 索引

一维与列表完全一致多维时同理

In[ ]:

n1 = np.array([1,2,4,7,9])

n1[3]

可以根据索引修改数据

2. 切片

一维与列表完全一致多维时同理

In[ ]:

a = np.arange(10)

b = a[2:7:2]

# 从索引 2 开始到索引 7 停止，间隔为 2

print(b)

[2 4 6]

冒号 : 的解释：如果只放置一个参数，如 [2]，将返回与该索引相对应的单个元素。如果为 [2:]，表示从该索引开始以后的所有项都将被提取。如果使用了两个参数，如 [2:7]，那么则提取两个索引(不包括停止索引)之间的项。

In[ ]:

a = np.arange(10)

print(a[2:])

[2 3 4 5 6 7 8 9]

In[ ]:

a = np.arange(10)

# [0 1 2 3 4 5 6 7 8 9]

print(a[2:5])

[2 3 4]

多维数组同样适用上述索引提取方法。

切片还可以包括省略号 …，来使选择元组的长度与数组的维度相同。如果在行位置使用省略号，它将返回包含行中元素的 ndarray。

In[ ]:

a = np.array([[1,2,3],[3,4,5],[4,5,6]])

print (a[...,1]) # 第2列元素

print (a[1,...]) # 第2行元素

print (a[...,1:]) # 第2列及剩下的所有元素

[2 4 5]

[3 4 5]

[[2 3]

[4 5]

[5 6]]

将数据反转，例如[1,2,3]---->[3,2,1]

In[ ]:

n = np.random.randint(0,100,size = 10)

array([21, 1, 4, 80, 28, 62, 69, 92, 76, 42])

In[ ]:

n[::-1]

array([42, 76, 92, 69, 62, 28, 80, 4, 1, 21])

In[ ]:

n[::-2]

array([42, 92, 62, 80, 1])

两个::进行切片

3. 变形

使用reshape函数，注意参数是一个tuple！

In[ ]:

import matplotlib.pyplot as plt

cat = plt.imread('cat.jpg')

plt.imshow(cat)

plt.show()

In[ ]:

cat.shape

(456, 730, 3)

In[ ]:

s1 = cat.size

n = np.random.randint(0,255,size = s1)

image2 = n.reshape((456,730,3))

plt.imshow(image2)

plt.show()

4. 级联

np.concatenate() 级联需要注意的点：

1. 级联的参数是列表：一定要加中括号或小括号

2. 维度必须相同

3. 形状相符

4. 【重点】级联的方向默认是shape这个tuple的第一个值所代表的维度方向

5. 可通过axis参数改变级联的方向

In[ ]:

n1 = np.random.randint(0,100,size = (4,2))

n2 = np.random.randint(-100,0,size = (4,6))

display(n1,n2)

array([[80, 65],

[ 8, 10],

[53, 10],

[55, 40]])

array([[-45, -55, -9, -3, -7, -49],

[-58, -83, -41, -30, -11, -68],

[-81, -3, -52, -5, -36, -44],

[-10, -30, -90, -63, -4, -1]])

对上面数组进行拼接

In[ ]:

newn = np.concatenate((n1,n2),axis = 1)

newn

array([[ 80, 65, -45, -55, -9, -3, -7, -49],

[ 8, 10, -58, -83, -41, -30, -11, -68],

[ 53, 10, -81, -3, -52, -5, -36, -44],

[ 55, 40, -10, -30, -90, -63, -4, -1]])

In[ ]:

newn.shape #由于axis = 1,新数组对列进行了拼接,即:6+2=8

(4, 8)

对于多维数组,比如之前的图片cat和image2

In[ ]:

#cat image2

image3 = np.concatenate((cat,image2),axis = 0)

image3.shape

(912, 730, 3)

np.hstack与np.vstack
水平级联与垂直级联，处理自己，进行维度的变更

In[ ]:

n = np.random.randint(0,100,size = (4,5))

array([[ 9, 66, 25, 35, 59],

[10, 29, 56, 24, 11],

[26, 9, 35, 51, 59],

[26, 34, 33, 78, 35]])

In[ ]:

#h = horizontal 水平

np.hstack(n)

array([ 9, 66, 25, 35, 59, 10, 29, 56, 24, 11, 26, 9, 35, 51, 59, 26, 34,

33, 78, 35])

In[ ]:

n = np.random.randint(0,10,size = 5)

array([7, 1, 8, 8, 7])

In[ ]:

np.vstack(n) #垂直方向

array([[7],

[1],

[8],

[7]])

对numpy.append()和numpy.concatenate()两个函数的运行时间进行比较

示例：

>>> from time import clock as now
>>> a=np.arange(9999)
>>> b=np.arange(9999)
>>> time1=now()
>>> c=np.append(a,b)
>>> time2=now()
>>> print time2-time1
28.2316728446
>>> a=np.arange(9999)
>>> b=np.arange(9999)
>>> time1=now()
>>> c=np.concatenate((a,b),axis=0)
>>> time2=now()
>>> print time2-time1
20.3934997107

可知，concatenate()效率更高，适合大规模的数据拼接

5. 切分

与级联类似，三个函数完成切分工作：

np.split

np.vsplit

np.hsplit

split(ary, indices_or_sections, axis=0) : 把一个数组从左到右按顺序切分

参数：

ary:要切分的数组

indices_or_sections:如果是一个整数，就用该数平均切分，如果是一个数组，为沿轴切分的位置（左开右闭）

axis：沿着哪个维度进行切向，默认为0，横向切分。为1时，纵向切分

比如:

In[ ]:

x = np.arange(9.0)

array([0., 1., 2., 3., 4., 5., 6., 7., 8.])

切分为3个数组

In[ ]:

np.split(x, 3) #”3”为切分的数目,也就是,最终被切分成3个数组

[array([0., 1., 2.]), array([3., 4., 5.]), array([6., 7., 8.])]

按照指定元素位置切分:

In[ ]:

np.split(x, [3, 5, 6, 10]) #使用中括号,按照元素切分

[array([0., 1., 2.]),

array([3., 4.]),

array([5.]),

array([6., 7., 8.]),

array([], dtype=float64)]

图片也是由数据组合出来的,因此,也可以进行切分:

In[ ]:

cat.shape

(456, 730, 3)

尝试切分

In[ ]:

s_result = np.split(cat,2,axis = 1)

s_result[0].shape #列切分,730的一半,365

(456, 365, 3)

In[ ]:

len(s_result)

In[ ]:

plt.imshow(s_result[0])

plt.show()

先生成一个随机的多维数组

In[ ]:

n = np.random.randint(0,100,size = (4,6))

array([[97, 14, 86, 68, 88, 57],

[51, 75, 64, 77, 7, 21],

[99, 68, 72, 51, 74, 61],

[26, 5, 2, 64, 18, 35]])

# 垂直方向分割 vsplit

In[ ]:

np.vsplit(n,(1,2)) #按照行从进行切分，1+1,2+1(也就是第1组与第2组之间、第2组与第3组之间)

[array([[97, 14, 86, 68, 88, 57]]),

array([[51, 75, 64, 77, 7, 21]]),

array([[99, 68, 72, 51, 74, 61],

[26, 5, 2, 64, 18, 35]])]

# 水平方向分割 hsplit

In[ ]:

np.hsplit(n,(2,4)) #按照列进行切分

[array([[97, 14],

[51, 75],

[99, 68],

[26, 5]]),

array([[86, 68],

[64, 77],

[72, 51],

[ 2, 64]]),

array([[88, 57],

[ 7, 21],

[74, 61],

[18, 35]])]

6. 副本

所有赋值运算不会为ndarray的任何元素创建副本。对赋值后的对象的操作也对原来的对象生效。

In[ ]:

n = np.array([1,2,3])

n[2] = 10

array([ 1, 2, 10])

可使用copy()函数创建副本

In[ ]:

n2 = n.copy()

n2[0] = 1024

array([1024, 2, 10])

再看看n

In[ ]:

array([ 1, 2, 10])

四、ndarray的聚合操作

1. 求和np.sum

numpy的sum函数可接受的参数是:

sum(a, axis=None, dtype=None, out=None, keepdims=np._NoValue)

参数：

a是要进行加法运算的向量/数组/矩阵
axis的值有三种情况：1.None，2.整数， 3.整数元组。

（在默认/缺省的情况下，axis取None）
如果axis取None，即将数组/矩阵中的元素全部加起来，得到一个和。

In[ ]:

np.sum([0.5, 1.5])

2.0

In[ ]:

np.sum([0.5, 0.7, 0.2, 1.5], dtype=np.int32) #需要先转换为整数，1.5转换为1,其他是转换为0

In[ ]:

np.sum([[0, 1], [0, 5]])

如果axis为整数，axis的取值不可大于数组/矩阵的维度，且axis的不同取值会产生不同的结果。
先以2×2的二维矩阵为例：

In[ ]:

np.sum([[0, 1], [0, 5]], axis=0)

array([0, 6])

In[ ]:

np.sum([[0, 1], [0, 5]], axis=1)

array([1, 5])

2. 最大最小值：np.max/ np.min

min()

对于类型为array的数组，可以直接调用最小值的方法函数min()，和最大值方法函数max()。以下仅以min()为例说明，该函数具体用法与numpy.amin()类似。1

一个简单的应用实例为：

In[ ]:

from numpy import *

arrayTest = array([1,2,3,4,5])

arrayTest.min()

对于多维数组，可以对不同维度方向上的数据进行比较。数组维度为ndim，则min函数的变量即数组的方向，具体取值为小于ndim的非负整数，输出一个ndim-1维度的数组。
以二维矩阵为例，测试min(0)：

In[ ]:

arrayTest = array([[1,6,3],[4,2,5]])

arrayTest.min(0)arrayTest = array([[1,6,3],[4,2,5]])

arrayTest.min(0) #min(0)，（二位矩阵）数据取每一列的最小值

array([1, 2, 3])

In[ ]:

arrayTest = array([[1,6,3],[8,11,7],[4,2,5]])

arrayTest.min(1) #min(1)，（二位矩阵）数据取每一行的最小值

array([1, 7, 2])

总结：

1）如果直接用min(),那么返回的是整个矩阵中元素的最小值

2）如果用min(0)或者min(axis=0)),那么返回的是所有列中每一列的最小值，返回一个1*n的数组

3）如果用min(1)或者min(axis=1)),那么返回的是所有行中每一行的最小值，返回一个1*n的数组

对于max()函数，也是一样的！

3. 其他聚合操作

Function Name NaN-safe Version Description

函数名 NaN-safe版本 说明

np.sum np.nansum Compute sum of elements(计算元素之和)

np.prod np.nanprod Compute product of elements(计算元素的乘积)

np.mean np.nanmean Compute mean of elements(计算元素平均值)

np.std np.nanstd Compute standard deviation(计算标准差)

np.var np.nanvar Compute variance(计算方差)

np.min np.nanmin Find minimum value(求最小值)

np.max np.nanmax Find maximum value(求最大值)

np.argmin np.nanargmin Find index of minimum value(求最小值索引)

np.argmax np.nanargmax Find index of maximum value(求最大值索引)

np.median np.nanmedian Compute median of elements(计算元素的中值)

np.percentile np.nanpercentile Compute rank-based statistics of elements(计算基于秩的元素统计)

np.any N/A Evaluate whether any elements are true(评估是否有任何元素是真的)

np.all N/A Evaluate whether all elements are true(评估所有元素是否是真的)

np.power 幂运算

五、ndarray的矩阵操作

1. 基本矩阵操作

1) 算术运算符：

加减乘除

In[ ]:

import numpy as np

n = np.random.randint(0,10,size = (4,5))

array([[2, 9, 1, 1, 2],

[2, 4, 5, 0, 2],

[6, 5, 8, 5, 5],

[8, 2, 8, 4, 1]])

In[ ]:

n + 10 #加10

array([[12, 19, 11, 11, 12],

[12, 14, 15, 10, 12],

[16, 15, 18, 15, 15],

[18, 12, 18, 14, 11]])

In[ ]:

n - 10 #减10

array([[ -8, -1, -9, -9, -8],

[ -8, -6, -5, -10, -8],

[ -4, -5, -2, -5, -5],

[ -2, -8, -2, -6, -9]])

In[ ]:

n * 6 #乘以6

array([[12, 54, 6, 6, 12],

[12, 24, 30, 0, 12],

[36, 30, 48, 30, 30],

[48, 12, 48, 24, 6]])

In[ ]:

n / 2 #除以2

array([[1. , 4.5, 0.5, 0.5, 1. ],

[1. , 2. , 2.5, 0. , 1. ],

[3. , 2.5, 4. , 2.5, 2.5],

[4. , 1. , 4. , 2. , 0.5]])

In[ ]:

#如果需要有值的变化，重新赋值给新的变量

n2 = n / 3

array([[0.66666667, 3. , 0.33333333, 0.33333333, 0.66666667],

[0.66666667, 1.33333333, 1.66666667, 0. , 0.66666667],

[2. , 1.66666667, 2.66666667, 1.66666667, 1.66666667],

[2.66666667, 0.66666667, 2.66666667, 1.33333333, 0.33333333]])

In[ ]:

#也可以通过数学运算符，比如加运算函数add()

np.add(n,3)

array([[ 5, 12, 4, 4, 5],

[ 5, 7, 8, 3, 5],

[ 9, 8, 11, 8, 8],

[11, 5, 11, 7, 4]])

矩阵积np.dot()

In[ ]:

#数组n1乘以n2，也就是矩阵的乘法

np.dot(n1,n2)

#[[ 7*3+6*7+1*8, 7*1+6*8+1*6],[5*3+2*7+9*8, 5*1+2*8+9*6]]

array([[ 71, 61],

[101, 75]])

2. 广播机制

【重要】ndarray广播机制的两条规则

规则一：为缺失的维度补1
规则二：假定缺失元素用已有值填充

例1： m = np.ones((2, 3)) a = np.arange(3) 求M+a

In[ ]:

m = np.ones((2, 3))

a = np.arange(3)

print(m,a)

display(m,a)

[[1. 1. 1.]

[1. 1. 1.]] [0 1 2]

array([[1., 1., 1.],

[1., 1., 1.]])

array([0, 1, 2])

我们对m加a，看看会怎样？

In[ ]:

#numpy广播，机制，维度不对应，自动补全

m + a

array([[1., 2., 3.],

[1., 2., 3.]])

广播的规则:

让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在前面加 1 补齐。
输出数组的形状是输入数组形状的各个维度上的最大值。
如果输入数组的某个维度和输出数组的对应维度的长度相同或者其长度为 1 时，这个数组能够用来计算，否则出错。
当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值。

简单理解：对两个数组，分别比较他们的每一个维度（若其中一个数组没有当前维度则忽略），满足：

数组拥有相同形状。
当前维度的值相等。
当前维度的值有一个是 1。

若条件不满足，抛出 "ValueError: frames are not aligned" 异常。

比如：
In[ ]:

a = np.array([[ 0, 0, 0], [10,10,10], [20,20,20], [30,30,30]])

b = np.array([1,2,3])

print(a + b)

[[ 1 2 3]

[11 12 13]

[21 22 23]

[31 32 33]]

下面的图片展示了数组 b 如何通过广播来与数组 a 兼容。

4x3 的二维数组与长为 3 的一维数组相加，等效于把数组 b 在二维上重复 4 次再运算：
In[ ]:

a = np.array([[ 0, 0, 0], [10,10,10], [20,20,20], [30,30,30]])

b = np.array([1,2,3])

bb = np.tile(b, (4, 1)) # 重复 b 的各个维度

print(a + bb)

[[ 1 2 3]

[11 12 13]

[21 22 23]

[31 32 33]]

例2： a = np.arange(3).reshape((3, 1)) b = np.arange(3) 求a+b

习题 a = np.ones((4, 1)) b = np.arange(4) 求a+b

In[ ]:

a = np.arange(3).reshape((3, 1))

b = np.arange(3)

display(a,b)

print(a+b)

array([[0],

[1],

[2]])

array([0, 1, 2])

[[0 1 2]

[1 2 3]

[2 3 4]]

In[ ]:

a = np.ones((4, 1))

b = np.arange(4)

display(a,b)

print(a+b)

array([[1.],

[1.],

[1.]])

array([0, 1, 2, 3])

[[1. 2. 3. 4.]

[1. 2. 3. 4.]

[1. 2. 3. 4.]]

六、ndarray的排序

小测验：使用以上所学numpy的知识，对一个ndarray对象进行选择排序。

def Sortn(x):

代码越短越好

In[ ]:

n1 = np.array([2,5,1,7,4])

display(n1,n1.size)

array([2, 5, 1, 7, 4])

In[ ]:

def sortn(nd):

for i in range(nd.size):

for j in range(i,nd.size):

if nd[i] > nd[j]:

nd[i],nd[j] = nd[j],nd[i]

return nd

sortn(n1)

array([1, 2, 4, 5, 7])

如何增加运行效率，需要考虑！

In[ ]:

#之前已经对n1排序，重新定义

n1 = np.array([2,5,1,7,4])

#降低运算的空间复杂度和时间复杂度

def sortnd(nd):

for i in range(nd.size):

#由于使用切片，索引是不对应的

min_index = np.argmin(nd[i:]) + i

print(min_index)

sortnd(n1)

上面只是确定“min_index”

In[ ]:

#之前已经对n1排序，重新定义

n1 = np.array([2,5,1,7,4])

#降低运算的空间复杂度和时间复杂度

def sortnd(nd):

for i in range(nd.size):

#由于使用切片，索引是不对应的

min_index = np.argmin(nd[i:]) + i

# print(min_index)

nd[i],nd[min_index] = nd[min_index],nd[i]

return nd

sortnd(n1)

array([1, 2, 4, 5, 7])

1. 快速排序

np.sort()与ndarray.sort()都可以，但有区别：

np.sort()不改变输入

ndarray.sort()本地处理，不占用空间，但改变输入

In[ ]:

n1 = np.random.randint(0,150,size = 10)

n2 = np.sort(n1)

print("最初的n1：")

display(n1)

print("\n")

print("使用np.sort(n1)方法之后，n1：")

display(n1)

print("n2：")

display(n2)

print("使用n1.sort()方法之后，注意n1的变化！")

n3 = n1.sort() #不可以将原列表排序后，直接拷贝给新列表

print("n1：")

display(n1)

print("n3：")

display(n3)

最初的n1：

array([ 4, 86, 90, 79, 88, 118, 22, 139, 119, 10])

使用np.sort(n1)方法之后，n1：

array([ 4, 86, 90, 79, 88, 118, 22, 139, 119, 10])

n2：

array([ 4, 10, 22, 79, 86, 88, 90, 118, 119, 139])

使用n1.sort()方法之后，注意n1的变化！

n1：

array([ 4, 10, 22, 79, 86, 88, 90, 118, 119, 139])

n3：

None

不可以将原列表排序后，直接拷贝给新列表；但是可以在排序后，再赋值给新列表，分两步完成:

In[ ]:

ls=[1,2,3,4,1,4,4]

new_ls=[]

ls.sort(reverse=True)

new_ls=ls

print(new_ls)

[4, 4, 4, 3, 2, 1, 1]

2. 部分排序

np.partition(a,k)

有的时候我们不是对全部数据感兴趣，我们可能只对最小或最大的一部分感兴趣。

当k为正时，我们想要得到最小的k个数

当k为负时，我们想要得到最大的k个数

In[ ]:

n1 = np.random.randint(0,150,size = 10)

print("最初的n1：")

display(n1)

print("选出最小的5个数...")

n2 = np.partition(n1,-5)

print("不进行筛选的：")

print(n2)

print("筛选的5个数：")

print(n2[:5])

最初的n1：

array([ 7, 56, 29, 76, 28, 148, 78, 31, 146, 80])

选出最小的5个数...

不进行筛选的：

[ 7 28 29 31 56 76 78 80 146 148]

筛选的5个数：

[ 7 28 29 31 56]

仅供参考学习，严禁转载！

你可能感兴趣的:(开发应用-Python)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。