灯不怕冷

Python数据分析04：Numpy——数组运算、排序、输入输出、矩阵运算、随机数生成

CHAPTER 4 NumPy Basics: Arrays and Vectorized Computation

文章目录

CHAPTER 4
NumPy Basics: Arrays and Vectorized Computation

4.3 数组导向编程（Array-Oriented Programming with Arrays）

4.3.1 将条件逻辑表述为数组运算（Expressing Conditional Logic as Array Operations）
4.3.2 数学和统计方法（Mathematical and Statistical Methods）
4.3.3 用于布尔型数组的方法（Methods for Boolean Arrays）
4.3.4 排序（Sorting）
4.3.5 单一性和其他集合逻辑（Unique and Other Set Logic）

4.4 用于数组的文件输入输出（File Input and Output with Arrays）
4.5 线性代数（Linear Algebra）
4.6 生成伪随机数（Pseudorandom Number Generation）
4.7 栗子：随机漫步（Example: Random Walks）

4.7.1 ⼀次模拟多个随机漫步（Simulating Many Random Walks at Once）

4.3 数组导向编程（Array-Oriented Programming with Arrays）

向量化的数组运算比纯python同等程度的运算要快很多。

一个简单的例子，假设我们想要评价函数sqrt(x^2 + y^2)。np.meshgrid函数取两个1维的数组，产生一个2维的矩阵，对应于所有两个数组中(x, y)的组合：

import numpy as np

先看个栗子，说明meshgrid的效果。meshgrid函数用两个坐标轴上的点在平面上画网格。用法：

[X,Y]=meshgrid(x,y)
[X,Y]=meshgrid(x)与[X,Y]=meshgrid(x,x)是等同的
[X,Y,Z]=meshgrid(x,y,z)生成三维数组，可用来计算三变量的函数和绘制三维立体图

这里，主要以[X,Y]=meshgrid(x,y)为例，来对该函数进行介绍。

[X,Y] = meshgrid(x,y) 将向量(x,y)定义的区域转换成矩阵X和Y,其中矩阵X的行向量是向量x的简单复制，而矩阵Y的列向量是向量y的简单复制(注：下面代码中X和Y均是数组，在文中统一称为矩阵了)。

假设x是长度为m的向量，y是长度为n的向量，则最终生成的矩阵X和Y的维度都是 nm （注意不是mn）。

>>>m, n = (5, 3)
>>>x = np.linspace(0, 1, m)
>>>y = np.linspace(0, 1, n)
>>>X, Y = np.meshgrid(x, y)
>>>x
array([0.  , 0.25, 0.5 , 0.75, 1.  ])
>>>y
array([0. , 0.5, 1. ])
>>>X
array([[0.  , 0.25, 0.5 , 0.75, 1.  ],
       [0.  , 0.25, 0.5 , 0.75, 1.  ],
       [0.  , 0.25, 0.5 , 0.75, 1.  ]])
>>>Y
array([[0. , 0. , 0. , 0. , 0. ],
       [0.5, 0.5, 0.5, 0.5, 0.5],
       [1. , 1. , 1. , 1. , 1. ]])

可以看到X和Y的shape都是3x5，用图的话更好理解：

把X和Y画出来后，就可以看到网格了：

>>>import matplotlib.pyplot as plt
>>>%matplotlib inline
>>>plt.style.use('ggplot')

>>>plt.plot(X, Y, marker='.', color='blue', linestyle='none')
[<matplotlib.lines.Line2D at 0x1d2a83192c8>,
 <matplotlib.lines.Line2D at 0x1d2a8328648>,
 <matplotlib.lines.Line2D at 0x1d2a8328048>,
 <matplotlib.lines.Line2D at 0x1d2a8328808>,
 <matplotlib.lines.Line2D at 0x1d2a8328a08>]

可以用zip得到网格平面上坐标点的数据：

>>>z = [i for i in zip(X.flat, Y.flat)]
>>>z
[(0.0, 0.0),
 (0.25, 0.0),
 (0.5, 0.0),
 (0.75, 0.0),
 (1.0, 0.0),
 (0.0, 0.5),
 (0.25, 0.5),
 (0.5, 0.5),
 (0.75, 0.5),
 (1.0, 0.5),
 (0.0, 1.0),
 (0.25, 1.0),
 (0.5, 1.0),
 (0.75, 1.0),
 (1.0, 1.0)]

下面是书中内容

>>>points = np.arange(-5, 5, 0.01) # 1000 equally spaced points
>>>xs, ys = np.meshgrid(points, points)  #xs, ys是一样的
>>>ys
array([[-5.  , -5.  , -5.  , ..., -5.  , -5.  , -5.  ],
       [-4.99, -4.99, -4.99, ..., -4.99, -4.99, -4.99],
       [-4.98, -4.98, -4.98, ..., -4.98, -4.98, -4.98],
       ...,
       [ 4.97,  4.97,  4.97, ...,  4.97,  4.97,  4.97],
       [ 4.98,  4.98,  4.98, ...,  4.98,  4.98,  4.98],
       [ 4.99,  4.99,  4.99, ...,  4.99,  4.99,  4.99]])

>>>z = np.sqrt(xs ** 2 + ys ** 2)
>>>z
array([[7.07106781, 7.06400028, 7.05693985, ..., 7.04988652, 7.05693985,
        7.06400028],
       [7.06400028, 7.05692568, 7.04985815, ..., 7.04279774, 7.04985815,
        7.05692568],
       [7.05693985, 7.04985815, 7.04278354, ..., 7.03571603, 7.04278354,
        7.04985815],
       ...,
       [7.04988652, 7.04279774, 7.03571603, ..., 7.0286414 , 7.03571603,
        7.04279774],
       [7.05693985, 7.04985815, 7.04278354, ..., 7.03571603, 7.04278354,
        7.04985815],
       [7.06400028, 7.05692568, 7.04985815, ..., 7.04279774, 7.04985815,
        7.05692568]])

这里我们用matplotlib把图画出来：

>>>import matplotlib.pyplot as plt
>>>plt.imshow(z, cmap=plt.cm.gray); plt.colorbar()
>>>plt.title("Image plot of $\sqrt{x^2 + y^2}$ for a grid of values")
Text(0.5, 1.0, 'Image plot of $\\sqrt{x^2 + y^2}$ for a grid of values')

>>>plt.draw()
>>>plt.close('all')

4.3.1 将条件逻辑表述为数组运算（Expressing Conditional Logic as Array Operations）

numpy.where函数是一个向量版的三元表达式，x if condition else y。假设我们有一个布尔数组和两个数组：

>>>xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
>>>yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
>>>cond = np.array([True, False, True, True, False])

假设如果cond中为true，取xarr中对应的值，否则就取yarr中的值。列表表达式的话会这么写：

>>>result = [(x if c else y)
             for x, y, c in zip(xarr, yarr, cond)]
>>>result
[1.1, 2.2, 1.3, 1.4, 2.5]

这么做的话会有很多问题。首先，对于很大的数组，会比较慢。第二，对于多维数组不起作用。但np.where能让我们写得更简洁：

>>>result = np.where(cond, xarr, yarr)
>>>result
array([1.1, 2.2, 1.3, 1.4, 2.5])

np.where中第二个和第三个参数不用必须是数组。where在数据分析中一个典型的用法是基于一个数组，产生一个新的数组值。假设我们有一个随机数字生成的矩阵，我们想要把所有的正数变为2，所有的负数变为-2。用where的话会非常简单：

>>>arr = np.random.randn(4, 4)
>>>arr
array([[-0.86617612,  0.20749266,  0.79432893,  1.37933292],
       [ 0.16468301,  1.33738792,  0.48931202, -1.93456647],
       [-1.04318554,  0.35130318,  1.93013893, -0.49548614],
       [ 0.06879538,  0.14403184, -0.6829035 , -0.15724614]])
>>>arr > 0
array([[False,  True,  True,  True],
       [ True,  True,  True, False],
       [False,  True,  True, False],
       [ True,  True, False, False]])
>>>np.where(arr > 0, 2, -2)
array([[-2,  2,  2,  2],
       [ 2,  2,  2, -2],
       [-2,  2,  2, -2],
       [ 2,  2, -2, -2]])

我们可以结合标量和数组。比如只把整数变为2，其他仍未原来的数字：

>>>np.where(arr > 0, 2, arr) # set only positive values to 2
array([[-0.86617612,  2.        ,  2.        ,  2.        ],
       [ 2.        ,  2.        ,  2.        , -1.93456647],
       [-1.04318554,  2.        ,  2.        , -0.49548614],
       [ 2.        ,  2.        , -0.6829035 , -0.15724614]])

4.3.2 数学和统计方法（Mathematical and Statistical Methods）

一些能计算统计值的数学函数能基于整个数组，或者沿着一个axis（轴）。可以使用aggregations(often called reductions，汇总，或被叫做降维)，比如sum, mean, std(标准差).

下面是一些aggregate statistics（汇总统计）：

>>>arr = np.random.randn(5, 4)
>>>arr
array([[-0.65977766,  0.10657405, -0.30306886,  1.6113779 ],
       [ 1.38028712,  0.19333709,  0.27204392,  0.57891583],
       [-1.68330481, -1.13381567,  2.40248441,  0.15887473],
       [ 1.14870515,  0.21836443,  0.48274068, -0.49030261],
       [ 0.03152238,  1.95722114,  1.15613118, -1.28873975]])
>>>arr.mean()
0.30697853186336255
>>>np.mean(arr)
0.30697853186336255
>>>arr.sum()
6.139570637267251

mean, sum这样的函数能接受axis作为参数来计算统计数字，返回的结果维度更少：

>>>arr.mean(axis=1)
array([ 0.18877635,  0.60614599, -0.06394034,  0.33987691,  0.46403374])
>>>arr.sum(axis=0)
array([0.21743217, 1.34168105, 4.01033133, 0.57012609])

这里arr.mean(1)表示，compute mean acros the rows(计算各行之间的平均值)。arr.sum(0)表示，compute sum down the columns(计算各行总和)。

其他一些方法，像cumsum和cumprod不做汇总，而是产生一个中间结果的数组：

>>>arr = np.array([0, 1, 2, 3, 4, 5, 6, 7])
>>>arr.cumsum()  #累加
array([ 0,  1,  3,  6, 10, 15, 21, 28], dtype=int32)

上面的计算是一个累加的结果，0+1=1，1+2=3，3+3=6以此类推。

>>>arr = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
>>>arr
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>>arr.cumsum(axis=0)
array([[ 0,  1,  2],
       [ 3,  5,  7],
       [ 9, 12, 15]], dtype=int32)
>>>arr.cumprod(axis=1)
array([[  0,   0,   0],
       [  3,  12,  60],
       [  6,  42, 336]], dtype=int32)

数组的基本统计方法

方法	说明
`sum`	对数组中全部或某轴上的元素求和。零长度的数组sum为0
`mean`	算术平均数。零长度的数组mean为NaN
`std`、`var`	分别为标准差和方差，自由度可调（默认为n）
`min`、`max`	最大值和最小值
`argmin`、`argmax`	分别为最大和最小元素的索引
`cumsum`	所有元素累计和
`cumprod`	所有元素累计积

4.3.3 用于布尔型数组的方法（Methods for Boolean Arrays）

sum对象是布尔型数组时，它是用来计算布尔数组中有多少个true的：

>>>arr = np.random.randn(100)
>>>(arr > 0).sum() # Number of positive values
46

有两个其他方法，any和all，对于布尔数组特别有用。any检测数组中只要有一个ture返回就是true，而all检测数组中都是true才会返回true。

>>>bools = np.array([False, False, True, False])
>>>bools.any()
True
>>>bools.all()
False

4.3.4 排序（Sorting）

numpy中也有sort方法：

>>>np.random.randn?  #返回符合正态分布的数值
>>>arr = np.random.randn(6)
>>>arr
array([-1.47806717, -0.13365593,  0.58858679, -2.3985419 , -0.96422824,
        0.04325962])
>>>arr.sort()
>>>arr
array([-2.3985419 , -1.47806717, -0.96422824, -0.13365593,  0.04325962,
        0.58858679])

如果是多维数组，还可以按axis来排序：

>>>arr = np.random.randn(5, 3)
>>>arr
array([[ 0.78097059, -0.72495837,  0.73126231],
       [ 0.03407071,  1.15173636,  0.03578452],
       [-0.89827663,  2.26539341, -0.68835086],
       [ 0.15338572,  0.47898484,  0.47362358],
       [ 0.4391983 ,  0.30683821,  0.97400495]])
>>>arr.sort(1)
>>>arr
array([[-0.72495837,  0.73126231,  0.78097059],
       [ 0.03407071,  0.03578452,  1.15173636],
       [-0.89827663, -0.68835086,  2.26539341],
       [ 0.15338572,  0.47362358,  0.47898484],
       [ 0.30683821,  0.4391983 ,  0.97400495]])

上面是直接调用数组的sort方法，会改变原有数组的顺序。但如果使用np.sort()函数的话，会生成一个新的排序后的结果。

一个计算分位数的快捷方法是先给数组排序，然后选择某个排名的值：

>>>large_arr = np.random.randn(1000)
>>>large_arr.sort()
>>>large_arr[int(0.05 * len(large_arr))] # 5% quantile
-1.5547315605495498

4.3.5 单一性和其他集合逻辑（Unique and Other Set Logic）

Numpy也有一些基本的集合操作用于一维数组。np.unique，能返回排好序且不重复的值：

>>>names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
>>>np.unique(names)
array(['Bob', 'Joe', 'Will'], dtype=')
>>>ints = np.array([3, 3, 3, 2, 2, 1, 1, 4, 4])
>>>np.unique(ints)
array([1, 2, 3, 4])

如果用纯python代码来实现的话，要这么写：

>>>sorted(set(names))
['Bob', 'Joe', 'Will']

np.in1d, 测试一个数组的值是否在另一个数组里，返回一个布尔数组：

>>>values = np.array([6, 0, 0, 3, 2, 5, 6])
>>>np.in1d(values, [2, 3, 6])
array([ True, False, False,  True,  True, False,  True])

数组的集合运算

方法	说明
unique(x)	计算x中的唯一元素，并返回有序结果
intersect1d(x, y)	计算x和y中公共元素，并返回有序结果
union1d(x, y)	计算x和y的并集，并返回有序结果
in1d(x, y)	得到一个表示“x的元素是否包含于y”的布尔型数组
setdiff1d(x, y)	集合的差，即元素在x中且不再y种
setxor1d(x, y)	集合的对称差，即存在于一个数组中但不同时存在于两个数组中的元素

4.4 用于数组的文件输入输出（File Input and Output with Arrays）

Numpy能从磁盘直接存储和加载数据，不论是文本格式还是二进制模式。这里我们只考虑Numpy的二进制模式，因为大多数用户更喜欢用pandas或其他工具来加载text或tabular数据。

np.save和np.load。数组会以未压缩的原始二进制模式被保存，后缀为.npy:

>>>import numpy as np

>>>arr = np.arange(10)
>>>np.save('some_array', arr)

即使保存的时候没有加后缀，也会被自动加上。可以用np.load来加载数组。

>>>np.load('some_array.npy')
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

用np.savez能保存多个数组，还可以指定数组对应的关键字，不过是未压缩的npz格式：

>>>np.savez('array_archive.npz', a=arr, b=arr)

加载.npz文件的时候，得到一个dict object：

>>>arch = np.load('array_archive.npz')
>>>arch['b']
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

可以用np.savez_compressed来压缩文件：

>>>np.savez_compressed('arrays_compressed.npz', a=arr, b=arr)

4.5 线性代数（Linear Algebra）

在MATLAB里，* 代表矩阵乘法。但是在numpy里，*表示element-wise prodct。要想做到矩阵乘法，要用多函数dot：

>>>import numpy as np
>>>x = np.array([[1., 2., 3.], [4., 5., 6.]])
>>>y = np.array([[6., 23.], [-1, 7], [8, 9]])
>>>x
array([[1., 2., 3.],
       [4., 5., 6.]])
>>>y
array([[ 6., 23.],
       [-1.,  7.],
       [ 8.,  9.]])
>>>x.dot(y)
array([[ 28.,  64.],
       [ 67., 181.]])

x.dot(y)等同于np.dot(x, y):

>>>np.dot(x, y)
array([[ 28.,  64.],
       [ 67., 181.]])

一个二维数组和一个一维数组的矩阵乘法，得到一个一维数组：

>>>np.dot(x, np.ones(3))
array([ 6., 15.])

@作为一个中缀计算符，也能实现矩阵乘法：

>>>x @ np.ones(3)
array([ 6., 15.])

np.linalg能用来做矩阵分解，以及比如转置和求秩之类的事情：

>>>from numpy.linalg import inv, qr
>>>X = np.random.randn(5, 5)
#X = np.round(np.random.randn(5, 5), 3)  #这里我们用np.round控制小数点后的位数，看起来更舒服一些
>>>X
array([[-1.21810897, -0.29265147, -0.17907474, -0.24168411, -2.25091962],
       [-0.58843199, -0.61295374,  0.59243325,  0.6684168 ,  0.32061682],
       [-0.18505361,  0.93213111, -1.77880663,  1.23613944,  0.42735645],
       [ 0.94444125, -0.76661742, -2.40385328,  0.08920931, -0.33557356],
       [-1.47261914,  0.05994258, -1.54126795, -0.08375278, -1.52619611]])
>>>mat = X.T.dot(X)  #X转置乘以X
>>>np.round(mat, 2)
array([[ 4.92, -0.27,  0.2 , -0.12,  4.4 ],
       [-0.27,  1.92, -0.22,  0.74,  1.03],
       [ 0.2 , -0.22, 11.7 , -1.84,  2.99],
       [-0.12,  0.74, -1.84,  2.05,  1.38],
       [ 4.4 ,  1.03,  2.99,  1.38,  7.79]])
>>>np.round(inv(mat), 2)
array([[ 1.19,  0.39,  0.42,  1.03, -1.07],
       [ 0.39,  0.75,  0.13,  0.13, -0.39],
       [ 0.42,  0.13,  0.29,  0.55, -0.46],
       [ 1.03,  0.13,  0.55,  1.75, -1.12],
       [-1.07, -0.39, -0.46, -1.12,  1.16]])
>>>np.round(mat.dot(inv(mat)), 2)
array([[ 1.,  0.,  0.,  0.,  0.],
       [ 0.,  1.,  0., -0.,  0.],
       [-0., -0.,  1., -0.,  0.],
       [-0., -0., -0.,  1.,  0.],
       [-0., -0.,  0.,  0.,  1.]])
>>>q, r = qr(mat)
>>>np.round(r, 2)
array([[ -6.62,  -0.39,  -2.53,  -0.71,  -8.49],
       [  0.  ,  -2.29,   1.  ,  -1.97,  -2.56],
       [  0.  ,   0.  , -11.91,   1.78,  -3.15],
       [  0.  ,   0.  ,   0.  ,  -1.59,  -1.81],
       [  0.  ,   0.  ,   0.  ,   0.  ,   0.49]])

X.T.dot(X)计算的是X和X的转置的矩阵乘法。

一些常用的numpy.linalg函数

函数	描述
diag	以一维数组的形式返回方阵的对角线(或非对角线)元素，或将一维数组转换为方阵（非对角线元素为零）
dot	矩阵乘法
trace	计算对角线元素和（即矩阵的迹）
det	计算方阵行列式
eig	计算方阵特征值和特征向量
inv	计算矩阵的逆
pinv	计算矩阵的Moore-Penrose伪逆
qr	计算QR分解
svd	计算奇异值分解（SVD）
solve	解线性方程组Ax=b，其中A为一个方阵
lstsq	计算Ax=b的最小二乘解

4.6 生成伪随机数（Pseudorandom Number Generation）

numpy.random模块提供了很多生成随机数的函数，可以选择生成符合某种概率分布的随机数。比如我们可以用normal得到一个4 x 4的，符合标准正态分布的数组：

>>>import numpy as np
>>>samples = np.random.normal(size=(4, 4))
>>>samples
array([[ 0.40335566,  0.49012624,  0.51915573,  4.03131376],
       [ 1.14935054, -0.33330548, -0.31231616,  0.40892981],
       [-1.5456503 ,  0.52125239, -0.37211993,  1.18562307],
       [-1.67826879, -0.91838905,  0.65828423,  0.65344736]])

相对的，python内建的random模块一次生成一个样本。在生成大量样本方法，numpy.random是非常快的：

>>>from random import normalvariate
>>>N = 1000000
>>>%timeit samples = [normalvariate(0, 1) for _ in range(N)]
1.19 s ± 112 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
>>>%timeit np.random.normal(size=N)
38.1 ms ± 3.75 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

之所以称之为伪随机数，是因为随机数生成算法是根据seed来生成的。也就是说，只要seed设置一样，每次生成的随机数是相同的：

>>>np.random.seed(1234)

当然，这个seed是全局的，如果想要避免全局状态，可以用numpy.random.RandomState来创建一个独立的生成器：

>>>rng = np.random.RandomState(1234)
>>>rng.randn(10)
array([ 0.47143516, -1.19097569,  1.43270697, -0.3126519 , -0.72058873,
        0.88716294,  0.85958841, -0.6365235 ,  0.01569637, -2.24268495])

numpy.random部分函数表

函数	描述
seed	确定随机数生成器的种子
permutation	返回一个序列的随机排列，或返回一个排列范围
shuffle	对一个序列随机排序
rand	从均匀分布中抽取样本
randint	从给定的上下限范围内抽取整数
randn	产生标准正态分布样本值
binomial	产生二项分布样本值
normal	产生正态（高斯）分布样本值
beta	产生Beta分布样本值
chisquare	产生卡方分布样本值
gamma	产生Gamma分布样本值
uniform	产生[0,1]均匀分布样本值

4.7 栗子：随机漫步（Example: Random Walks）

这个例子让我了解一个在实际任务中如何利用数组操作。首先一个最简单的随机漫步：从0开始，步幅为1和-1，以相同的概率出现。

下面是纯python的实现方法，1000步：

>>>import random
>>>position = 0
>>>walk = [position]
>>>steps = 1000
>>>for i in range(steps):
>>>    step = 1 if random.randint(0, 1) else -1
>>>    position += step
>>>    walk.append(position)

>>>plt.figure()
<Figure size 432x288 with 0 Axes>
<Figure size 432x288 with 0 Axes>

>>>plt.plot(walk[:100])
[<matplotlib.lines.Line2D at 0x1a0f9d34a08>]

其中随机游动的前100个值的示例图：

随机漫步其实就是一个简单的累加。而用np.random能更快：

>>>import numpy as np
>>>np.random.seed(12345)

>>>nsteps = 1000
>>>draws = np.random.randint(0, 2, size=nsteps)
>>>steps = np.where(draws > 0, 1, -1)
>>>walk = steps.cumsum()

我们能直接从中得到一些统计数据，比如最大值和最小值：

>>>walk.min()
-5
>>>walk.max()
24

一个更复杂的统计值是在哪一步random walk到达了一个指定值。我们想知道从0走出10步用了多久，不论是正方向还是负方向。np.abs(walk) >= 10给我们一个布尔数组，walk已经到达或超过10的位置，但是我们需要第一个10或-10的索引。因此，可以使用argmax来计算，它返回布尔数组中最大值的第一个索引(True是最大值)：

>>>(np.abs(walk) >= 10).argmax()
119

注意，使用argmax并不总是高效的，因为它总会搜索整个数组。在这里例子里，一旦True被找到了，我们就返回为最大值。

4.7.1 ⼀次模拟多个随机漫步（Simulating Many Random Walks at Once）

>>>nwalks = 5000
>>>nsteps = 1000
>>>draws = np.random.randint(0, 2, size=(nwalks, nsteps)) # 0 or 1
>>>steps = np.where(draws > 0, 1, -1)
>>>walks = steps.cumsum(1)
>>>walks
array([[  1,   2,   3, ...,  50,  51,  50],
       [ -1,   0,  -1, ..., -12, -11, -10],
       [ -1,   0,   1, ...,  10,   9,   8],
       ...,
       [ -1,   0,   1, ...,  48,  47,  48],
       [ -1,   0,   1, ..., -28, -29, -28],
       [ -1,   0,   1, ...,  72,  71,  72]], dtype=int32)

找到所有漫步中的最大值和最小值：

>>>walks.max()
108
>>>walks.min()
-119

在这些漫步模拟中，我们想找到30步以上的。用any方法：

>>>hits30 = (np.abs(walks) >= 30).any(1)
>>>hits30
array([ True, False, False, ...,  True,  True,  True])
>>>hits30.sum() # Number that hit 30 or -30
3353

然后我们利用这个布尔型数组选出那些穿越了30（绝对值）的随机漫步（⾏），并调⽤argmax在轴1上获取穿越时间：

>>>crossing_times = (np.abs(walks[hits30]) >= 30).argmax(1)
>>>crossing_times.mean()
504.5872353116612

参考资料：

利用Python进行数据分析学习笔记（有惊喜^_^）

书籍：《Python for Data Analysis》

你可能感兴趣的:(利用Python进行数据分析)

python数据分析张俊红_Python数据分析实战基础 | 初识Pandas weixin_39678531 python数据分析张俊红
这是Python数据分析实战基础的第一篇内容，主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学，可以加快手速滑动浏览或者直接略过本文。01重要的前言这段时间和一些做数据分析的同学闲聊，我发现数据分析技能入门阶段存在一个普遍性的问题，很多凭着兴趣入坑的同学，都能够很快熟悉Python基础语法，然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中，硬着头皮啃完之后，好像
技术书籍推荐(002) 陌尘(MoChen) 技术书籍 c++Python Java JavaScript Go
20.利用Python进行数据分析免费电子书PDF下载书籍简介：本书聚焦于使用Python进行数据处理和分析。详细介绍了Python中用于数据分析的重要库，如NumPy（提供高效的数值计算功能，包括数组操作、数学函数等）、pandas（用于数据清洗、分析和结构化处理，具备数据导入导出、数据分组聚合等强大功能）以及matplotlib（用于数据可视化，可创建各种类型的图表，如折线图、柱状图、散点图等
numpy将所有数据变为0和1_《利用python进行数据分析》1.0——Numpy库 weixin_39849888 numpy将所有数据变为0和1
目录：Tab键自动完成%run命令“Ctri-C”中断正在执行的代码忘记输入和输出文本怎么办创建数组zero和onesarange()，生成一定长度的数量dtype,将一块内存解释为TED数据类型所需的信息astype,转换dtype切片布尔型索引花式索引：利用整数数组进行索引数据转置和轴兑换通用函数np.meshgrid函数(接受两个一维数组，并产生两个二维矩阵)np.where函数(根据另一个
如何利用Python进行数据分析与可视化的具体操作指南 Stanford_1106 学习关于Python python twitter 微信开放平台微信小程序微信公众平台 c++开发语言
成长路上不孤单【14后///C++爱好者///持续分享所学///如有需要欢迎收藏转发///】今日分享关于如何利用Python进行数据分析与可视化的具体操作的相关内容！数据可视化是数据分析中的关键步骤，旨在通过图表和图形将数据的规律和趋势直观地展示出来。Python作为一种强大的编程语言，提供了丰富的库和工具来处理数据分析和可视化任务。如Matplotlib和Seaborn，使得数据可视化变得简单而
怎么在python中读取电脑里的数据集_利用Python读取外部数据文件 weixin_39724004
不论是数据分析，数据可视化，还是数据挖掘，一切的一切全都是以数据作为最基础的元素。利用Python进行数据分析，同样最重要的一步就是如何将数据导入到Python中，然后才可以实现后面的数据分析、数据可视化、数据挖掘等。在本期的Python学习中，我们将针对Python如何获取外部数据做一个详细的介绍，从中我们将会学习以下4个方面的数据获取：1、读取文本文件的数据，如txt文件和csv文件2、读取电
技术书籍推荐(002):电子书免费下载 c++
20.利用Python进行数据分析免费电子书PDF下载下载地址：http://t-book.sunlogging.com/2025/03/24/book/book_0020/书籍简介：本书聚焦于使用Python进行数据处理和分析。详细介绍了Python中用于数据分析的重要库，如NumPy（提供高效的数值计算功能，包括数组操作、数学函数等）、pandas（用于数据清洗、分析和结构化处理，具备数据导入
说一些python的技术干货，不能再干了 Helena__a python 开发语言
今天我们主要来详细讲解一下Pyhon从基础语法到高级的应用，例如如何利用Python进行数据分析、搭建Web应用，示例代码丰富且讲解清晰，对于这些想学习Python的新手小白有着很高的吸引力哦！一、Python基础语法精要（一）变量与数据类型Python无需提前声明变量类型，赋值即定义。例如：pythonname="John"#字符串类型age=25#整数类型height=1.75#浮点数类型is
利用python进行数据分析（重点、易忘点）---第五章Pandas基础学习 tenderjets 利用python进行数据分析 pandas
之前看的pandas的教材和课程里，内容参差不齐，实际使用很少的方法的内容有点多，导致很乱而且记不住那么多，这个帖子尽量用最少的文字，最精炼的语言来总结比较实用的方法，内容主要来源于《利用python进行数据分析》。1.创建Series直接给列表，加index。obj=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])也可以用字典sdata={'O
《利用python进行数据分析》——3.1数据结构和序列——元组、列表、字典、集合——读书笔记 pillow_L python数据分析
第3章Python的数据结构、函数和文件3.1数据结构和序列Python中常见的数据结构可以统称为容器。序列（如列表和元组）、映射（如字典）以及集合（set）是三类主要的容器。1.元组——tuple元组是一个固定长度，不可改变的Python序列对象。元组与列表一样，也是一种序列，唯一不同的是元组不能被修改（字符串其实也有这种特点）元组Tuple，一经初始化，就不能修改，没有列表List中的appe
打卡第13天：《利用python进行数据分析》学习笔记且不了了
第7章——数据规整化：清理、转换、合并、重塑数据变换http://nbviewer.jupyter.org/github/qiebuliaoliao/data_analysis_python/blob/master/ch7/20180405.ipynb
matplotlib和seaborn绘图 Oliveee
https://www.jianshu.com/p/7a0eafdd1340《利用Python进行数据分析·第2版》第9章绘图和可视化matplotlib引入%matplotlibnotebookimportmatplotlib.pyplotasplt简单示例fig=plt.figure()ax1=fig.add_subplot(2,2,1)ax2=fig.add_subplot(2,2,2)ax
《利用Python进行数据分析》附录 A.3 广播 CCC考研
附录A高阶NumpyA.3广播广播描述了算法如何在不同形状的数组之间进行运算。它是一个强大的功能，但可能会导致混淆，即使对于有经验的用户也是如此。1.最简单的广播示例发生在将标量值与数组组合的时候（见图A-1）图A-1:简单广播注：有关此操作的说明，请参见图A-2。对行进行减均值的广播需要更小心。幸运的是，只要遵循规则，就可以在数组的任何维度上对潜在较低维度值进行广播（例如从二维数组的每一列中减去
Week 02 Python初步图小加
本周是Python的基本使用，从真正小白零接触，跟着大神们开始学习参考书：利用Python进行数据分析（原书第2版）中第三章和第五章一、Python基础1）Python环境安装（1）下载anaconda是python的包管理器和环境管理器，是在conda（一个包管理器和环境管理器）上发展出来的。在数据分析中，将会用到很多第三方的包，而conda（包管理器）可以很方便地在计算机上安装和管理这些包，包
《利用Python进行数据分析》 14.2 MovieLens 1M数据集 CCC考研
第十四章数据分析示例注：本章示例数据集可在附带的GitHub仓库（http://github.com/wesm/pydata-book）中找到14.2MovieLens1M数据集GroupLens实验室（http://www.grouplens.org/node/73）提供了一些从MovieLens用户那里收集的20世纪90年代末和21世纪初的电影评分数据的集合。这些数据提供了电影的评分、电影的元
2018-11-28 wangyou2550
python书籍入门：python基础教程第二版，笨方法学python进阶：流畅的python，effictivepython，Python编程实战，编写高质量代码：python，python核心编程第三版，PythonCookbook中文版第3版计算：python科学计算，利用Python进行数据分析前端：FlaskWeb开发：基于Python的Web应用开发实战，DjangoWeb开发指南网络
【读书笔记】《利用Python进行数据分析》第2版_第二章：Python语言基础、IPython及Jupyternotebook is_colorful python python pytorch 深度学习
推荐使用IPython命令行和Jupyternotebook来实验代码示例，以及探索各种类型、函数和方法的文档。和其他键盘控制的命令行环境一样，练就常用命令的肌肉记忆也是学习曲线的一部分。优秀Python书籍推荐《PythonCookbook》（第3版），作者为DavidBeazley和BrianK.Jones（O’Reilly）《FluentPython》，作者为LucianoRamalho（O
利用python进行数据分析(第二版)_第十四章 shifanfashi 数据分析数据分析
本书正文的最后一章，我们来看一些真实世界的数据集。对于每个数据集，我们会用之前介绍的方法，从原始数据中提取有意义的内容。展示的方法适用于其它数据集，也包括你的。本章包含了一些各种各样的案例数据集，可以用来练习。案例数据集可以在Github仓库找到，见第一章。#14.1来自Bitly的USA.gov数据2011年，URL缩短服务Bitly跟美国政府网站USA.gov合作，提供了一份从生成.gov或.
利用Python进行数据分析的学习笔记——chap10 调停者จุ๊บ 笔记 python 开发语言后端
时间序列日期和时间数据类型及工具fromdatetimeimportdatetimenow=datetime.now()nowdatetime.datetime(2022,3,4,8,23,31,842698)now.year,now.month,now.day(2022,3,4)#时间差delta=datetime(2022,3,3)-datetime(1998,10,20,8,10)delta
利用python进行数据分析(1) Doter
第一章一.数据的类型表格数据多维数据(矩阵)多张表数据(主外键关联)时间序列二.重要的Python库NumPy基础数据结构和函数pandas高级数据结构和函数matplotlib二维数据可视化IPython和Jupyter交互Scipy科学计算领域scikit-learn机器学习包statsmodels统计分析包第二章Python基础略第三章NumPy菜鸟教程比书详细第四章pandas易百教程最简
学习python数据分析必看，《利用Python进行数据分析》新潮看世界
利用Python进行数据分析pdf:讲述了从pandas库的数据分析工具开始利用高性能工具、matpIotlib、pandas的groupby功能等处理各种各样的时间序列数据。
NumPy教程（一）—— ndarray：多维数组对象 m0_61766362 Numpy python学习笔记 numpy python 学习方法
前言该numpy学习笔记参考了菜鸟教程网、b站up主孙兴华zz的《孙兴华中文讲python数据分析三部曲》以及《北理-python数据分析与展示》，课本推荐使用《利用python进行数据分析》Numpy简介：NumPy(NumericalPython)是Python语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。1.数组(array)的介绍数组是相同数据
字符串与正则表达式python实验报告分析_《利用Python进行数据分析》第7章字符串操作与正则表达式... weixin_39615257
字符串操作Python有简单易用的字符串和文本处理功能，大部分文本运算都直接做成了字符串对象的内置方法。对于更为复杂的模式匹配和文本操作，则可能需要用到正则表达式。字符串对象方法以逗号分隔的字符串可以用split拆分成数段In[4]:val='a,bc,c,gudio'In[5]:val.split(',')Out[5]:['a','bc','c','gudio']In[6]:val='a,bc,
chatgpt赋能python：Python统计总分——利用Python进行数据分析 laingziwei ChatGpt python chatgpt 开发语言计算机
Python统计总分——利用Python进行数据分析Python是一门流行的编程语言，有着广泛的应用领域。其中，Python在数据分析和统计领域也发挥着重要作用。本文将介绍如何利用Python进行数据分析，进而实现统计总分的功能。什么是数据分析？数据分析是指用各种统计方法对数据进行处理和分析，以获取数据中的信息和规律，并进行有效的决策。在现代社会中，数据分析已经成为了各行各业必备的技能之一。而Py
打卡第11天：《利用python进行数据分析》学习笔记且不了了
第五章——pandas入门第二部分：pandas主要功能（四）http://nbviewer.jupyter.org/github/qiebuliaoliao/data_analysis_python/blob/master/ch5/20180403.ipynb
day14：《利用python进行数据分析》学习笔记且不了了
第7章——数据规整化：清理、转换、合并、重塑字符串处理http://nbviewer.jupyter.org/github/qiebuliaoliao/data_analysis_python/blob/master/ch7/20180406.ipynb
《利用Python进行数据分析》 13.1pandas与建模代码的结合 CCC考研
第十三章Python建模库介绍13.1pandas与建模代码的结合使用pandas用于数据载入和数据清洗，之后切换到模型库去建立模型是一个常见的模型开发工作流。在机器学习中，特征工程是模型开发的重要部分之一。特征工程是指从原生数据集中提取可用于模型上下文的有效信息的数据转换过程或分析，书中会展示一些可以在利用pandas进行数据操作和建模之间无痛切换的方法。1.panas和其他分析库的结合点通常是
利用python进行数据分析第十四章 14.3 1880-2010年间全美婴儿姓名小猞猁啥都学利用Python进行数据分析 python 数据分析开发语言
14.31880-2010年间全美婴儿姓名美国社会保障总署（SSA）ᨀ供了一份从1880年到现在的婴儿名字频率数据。HadleyWickham（许多流行R包的作者）经常用这份数据来演示R的数据处理功能。我们要做一些数据规整才能加载这个数据集，这么做就会产生一个如下的DataFrame：In[4]:names.head(10)Out[4]:namesexbirthsyear0MaryF7065188
利用python进行数据分析第十四章 14.5 2012联邦选举委员会数据库小猞猁啥都学利用Python进行数据分析 python 数据分析开发语言
14.52012联邦选举委员会数据库美国联邦选举委员会发布了有关政治竞选赞助方面的数据。其中包括赞助者的姓名、职业、雇主、地址以及出资额等信息。我们对2012年美国总统大选的数据集比较感兴趣（http://www.fec.gov/disclosurep/PDownload.do）。我在2012年6月下载的数据集是一个150MB的CSV文件（P00000001-ALL.csv），我们先用pandas
利用python进行数据分析第十章数据聚合与分组运算小猞猁啥都学利用Python进行数据分析 python 数据分析开发语言
对数据集进行分组并对各组应用一个函数（无论是聚合还是转换），通常是数据分析工作中的重要环节。在将数据集加载、融合、准备好之后，通常就是计算分组统计或生成透视表。pandasᨀ供了一个灵活高效的gruopby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。关系型数据库和SQL（StructuredQueryLanguage，结构化查询语言）能够如此流行的原因之一就是其能够方便地对数
利用python进行数据分析第十三章 Python建模库介绍小猞猁啥都学利用Python进行数据分析 python 数据分析开发语言
本书中，我已经介绍了Python数据分析的编程基础。因为数据分析师和科学家总是在数据规整和准备上花费大量时间，这本书的重点在于掌握这些功能。开发模型选用什么库取决于应用本身。许多统计问题可以用简单方法解决，比如普通的最小二乘回归，其它问题可能需要复杂的机器学习方法。幸运的是，Python已经成为了运用这些分析方法的语言之一，因此读完此书，你可以探索许多工具。本章中，我会回顾一些pandas的特点，
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe