欢乐的小猪

Numpy基础之索引和切片

Numpy数组的索引是一个内容丰富的主题，因为选取数据子集和单个元素的方式有很多。一维数组很简单。从表面上看，它们跟Python列表的功能差不多：

In [109]: arr=np.arange(10)

In [110]: arr
Out[110]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [111]: arr[5]
Out[111]: 5

In [112]: arr[5:8]
Out[112]: array([5, 6, 7])

In [113]: arr[5:8]=12

In [114]: arr
Out[114]: array([ 0,  1,  2,  3,  4, 12, 12, 12,  8,  9])

如上所示，当你将一个标量赋值给一个切片时（如arr[5;8]=12）,该值会自动广播到整个选区。跟列表最重要的区别在于，数组切片是原始数组的视图。这意味着数据不会被复制，视图上的任何修改都会直接反映到原数组上：

In [117]: arr_slice=arr[5:8]

In [118]: arr_slice[1]=12345

In [119]: arr
Out[119]: array([    0,     1,     2,     3,     4,    12, 12345,    12,     8,
    9])

In [120]: arr_slice[:]=64

In [121]: arr
Out[121]: array([ 0,  1,  2,  3,  4, 64, 64, 64,  8,  9])

如果你刚开始接触Python，可能会对此感到惊讶（尤其是当你曾经用过其他热衷于复制数组数据的语言）。由于Numpy的设计目的是处理大数据，所以你可以想象一下，假如Numpy坚持要将数据复制来复制去的话会产生何等性能和内存问题。

当然，如果你想要得到的是ndarray切片的一份副本而非视图，就需要显示地进行复制操作，例如arr[5:8].copy()。

对于高维数组，能做的事情更多。在一个二维数组中，各索引位置上的元素不再是标量而是一维数组：

In [122]: arr2d=np.array([[1,2,3],[4,5,6],[7,8,9]])

In [123]: arr2d[2]
Out[123]: array([7, 8, 9])

因此，可以对各个元素进行递归访问，但这样需要做的事情有点多。你可以传入一个以逗号隔开的索引列表来选取单个元素。也就是说，下面两种方式是等价的：

In [124]: arr2d[0][2]
Out[124]: 3

In [125]: arr2d[0,2]
Out[125]: 3

在多维数组中，如果省略了后面的索引，则返回对象会是一个维度低一点的ndarray。因此，在2*2*3数组arr3d中：

In [126]: arr3d=np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])

In [127]: arr3d
Out[127]:
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

arr3d[0]是一个2*3数组：

In [128]: arr3d[0]
Out[128]:
array([[1, 2, 3],
       [4, 5, 6]])

标量值和数组都可以被赋值给arr3d[0]：

In [129]: old_values=arr3d[0].copy()

In [130]: arr3d[0]=42

In [131]: arr3d
Out[131]:
array([[[42, 42, 42],
        [42, 42, 42]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

In [132]: arr3d[0]=old_values

In [133]: arr3d
Out[133]:
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

以此类推，arr3d[1,0]可以访问索引以（1,0）开头的那些值（以一维数组的形式返回）：

In [134]: arr3d[1,0]
Out[134]: array([7, 8, 9])

切片索引

ndarray的切片语法跟Python列表这样的一维对象差不多：

In [136]: arr[1:6]
Out[136]: array([ 1,  2,  3,  4, 64])

高维度对象的花样更多，你可以在一个或多个轴上进行切片，也可以跟整数索引混合使用。对于上面那个二维数组arr2d，其切片方式稍显不同：

In [137]: arr2d
Out[137]:
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [138]: arr2d[:2]
Out[138]:
array([[1, 2, 3],
       [4, 5, 6]])

可以看书，它是沿着第0轴（即第一个轴）切片的。也就是说，切片是沿着一个轴向选取元素的。你可以一次传入多个切片，就像传入多个索引那样：

In [139]: arr2d[:2,:1]
Out[139]:
array([[1],
       [4]])

这样选取切片时，只能得到相同维数的数组视图。通过将整数索引和切片混合，可以得到低维度的切片：

In [140]: arr2d[1,:2]
Out[140]: array([4, 5])

注意：“只有冒号”表示选取整个轴，因此你可以像下面这样只对高维数组进行切片：

In [141]: arr2d[:,:1]
Out[141]:
array([[1],
       [4],
       [7]])

自然，对切片表达式的赋值操作也会被扩散到整个选区：

In [142]: arr2d[:2,1:]=0

In [143]: arr2d
Out[143]:
array([[1, 0, 0],
       [4, 0, 0],
       [7, 8, 9]])

布尔型索引

来看这样一个例子，假设我们有一个用于存储数据的数组以及一个存储姓名的数组（含有重复项）。在这里，我将使用numpy.random中的randn函数生成一些正态分布的随机数据：

In [144]: names=np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe'])

In [145]: data=randn(7,4)

In [146]: names
Out[146]:
array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'],
      dtype='|S4')

In [147]: data
Out[147]:
array([[-1.04671318, -1.61005019,  0.7341528 ,  0.50755629],
       [-0.61720538, -1.05656481,  0.51147741, -0.11091961],
       [ 0.13172863, -1.82681829,  0.25647457,  0.75193541],
       [ 1.77991999, -1.07012481,  0.40510516,  1.23841188],
       [-1.01946802,  0.99361739, -0.54690575,  0.63130108],
       [ 1.18127863, -0.20092513, -0.3435272 , -0.01927443],
       [ 0.35822422, -0.3245485 , -1.41210765, -0.96058923]])

假设每个名字都对应data数组的一行，而我们想要选出对应于名字“Bob”的所有行。跟算术运算一样，数组的比较操作（如==）也是矢量化的。因此，对names和字符串“Bob”的比较运算将会产生一个布尔型数组：

In [148]: names=='Bob'
Out[148]: array([ True, False, False,  True, False, False, False], dtype=bool)

这个布尔型数组可用于数组索引：

In [149]: data[names=='Bob']
Out[149]:
array([[-1.04671318, -1.61005019,  0.7341528 ,  0.50755629],
       [ 1.77991999, -1.07012481,  0.40510516,  1.23841188]])

布尔型数组的长度必须跟被索引数组的长度一直。此外，还可以将布尔型数组跟切片、整数（或整数序列，稍后将对此进行详细讲解）混合使用：

In [150]: data[names=='Bob',:2]
Out[150]:
array([[-1.04671318, -1.61005019],
       [ 1.77991999, -1.07012481]])

In [151]: data[names=='Bob',3]
Out[151]: array([ 0.50755629,  1.23841188])

要选择除‘Bob’以为的其他值，既可以使用不等于符号（！=），也可以通过负号（~）对条件进行否定：

In [156]: names!='Bob'
Out[156]: array([False,  True,  True, False,  True,  True,  True], dtype=bool)

In [157]: data[~(names=='Bob')]
Out[157]:
array([[-0.61720538, -1.05656481,  0.51147741, -0.11091961],
       [ 0.13172863, -1.82681829,  0.25647457,  0.75193541],
       [-1.01946802,  0.99361739, -0.54690575,  0.63130108],
       [ 1.18127863, -0.20092513, -0.3435272 , -0.01927443],
       [ 0.35822422, -0.3245485 , -1.41210765, -0.96058923]])

选取三个名字中的两个需要组合应用多个布尔条件，使用&（和）、|（或）之类的布尔算术运算符即可：

In [158]: mask=(names=='Bob')|(names=='Will')

In [159]: mask
Out[159]: array([ True, False,  True,  True,  True, False, False], dtype=bool)

In [160]: data[mask]
Out[160]:
array([[-1.04671318, -1.61005019,  0.7341528 ,  0.50755629],
       [ 0.13172863, -1.82681829,  0.25647457,  0.75193541],
       [ 1.77991999, -1.07012481,  0.40510516,  1.23841188],
       [-1.01946802,  0.99361739, -0.54690575,  0.63130108]])

通过布尔型索引选取数组中的数据，将总是创建数据的副本，即使返回一模一样的数组也是如此。举个例子，如下：

In [197]: data=randn(4,4)

In [198]: data
Out[198]:
array([[-0.39535105,  0.53360207,  1.2005151 ,  0.32416725],
       [-0.24823878,  0.7545432 ,  1.56430848, -0.1740108 ],
       [ 1.01638718, -0.56379031,  0.49237574,  0.61092716],
       [ 0.95138555,  0.61950592, -0.03049269,  1.71516366]])

In [199]: data_bool=data[data>0]

In [200]: data_bool
Out[200]:
array([ 0.53360207,  1.2005151 ,  0.32416725,  0.7545432 ,  1.56430848,
        1.01638718,  0.49237574,  0.61092716,  0.95138555,  0.61950592,
        1.71516366])

In [201]: data_bool[:]=0

In [202]: data_bool
Out[202]: array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.])

In [203]: data
Out[203]:
array([[-0.39535105,  0.53360207,  1.2005151 ,  0.32416725],
       [-0.24823878,  0.7545432 ,  1.56430848, -0.1740108 ],
       [ 1.01638718, -0.56379031,  0.49237574,  0.61092716],
       [ 0.95138555,  0.61950592, -0.03049269,  1.71516366]])

In [204]: data[data>0]
Out[204]:
array([ 0.53360207,  1.2005151 ,  0.32416725,  0.7545432 ,  1.56430848,
        1.01638718,  0.49237574,  0.61092716,  0.95138555,  0.61950592,
        1.71516366])

In [205]: data[data>0]=0

In [206]: data
Out[206]:
array([[-0.39535105,  0.        ,  0.        ,  0.        ],
       [-0.24823878,  0.        ,  0.        , -0.1740108 ],
       [ 0.        , -0.56379031,  0.        ,  0.        ],
       [ 0.        ,  0.        , -0.03049269,  0.        ]])

注意：Python关键字 and 和 or 在布尔型数组中无效。

通过布尔型数组设置值是一种经常用到的手段。为了将data中的所有负值都设置为0，我们只需：

In [161]: data[data<0]=0

In [162]: data
Out[162]:
array([[ 0.        ,  0.        ,  0.7341528 ,  0.50755629],
       [ 0.        ,  0.        ,  0.51147741,  0.        ],
       [ 0.13172863,  0.        ,  0.25647457,  0.75193541],
       [ 1.77991999,  0.        ,  0.40510516,  1.23841188],
       [ 0.        ,  0.99361739,  0.        ,  0.63130108],
       [ 1.18127863,  0.        ,  0.        ,  0.        ],
       [ 0.35822422,  0.        ,  0.        ,  0.        ]])

通过一维布尔数组设置整行或整列的值也很简单：

In [163]: data[names!='Joe']=7

In [164]: data
Out[164]:
array([[ 7.        ,  7.        ,  7.        ,  7.        ],
       [ 0.        ,  0.        ,  0.51147741,  0.        ],
       [ 7.        ,  7.        ,  7.        ,  7.        ],
       [ 7.        ,  7.        ,  7.        ,  7.        ],
       [ 7.        ,  7.        ,  7.        ,  7.        ],
       [ 1.18127863,  0.        ,  0.        ,  0.        ],
       [ 0.35822422,  0.        ,  0.        ,  0.        ]])

花式索引

花式索引（Fancy indexing）是一个Numpy术语，它指的是利用整数数组进行索引。假设我们有一个8*4数组：

In [165]: arr=np.empty((8,4))

In [166]: for i in range(8):
   .....:     arr[i]=i
   .....:

In [167]: arr
Out[167]:
array([[ 0.,  0.,  0.,  0.],
       [ 1.,  1.,  1.,  1.],
       [ 2.,  2.,  2.,  2.],
       [ 3.,  3.,  3.,  3.],
       [ 4.,  4.,  4.,  4.],
       [ 5.,  5.,  5.,  5.],
       [ 6.,  6.,  6.,  6.],
       [ 7.,  7.,  7.,  7.]])

为了以特定顺序选取行子集，只需传入一个用于指定顺序的证书列表或ndarray即可：

In [168]: arr[[4,3,0,6]]
Out[168]:
array([[ 4.,  4.,  4.,  4.],
       [ 3.,  3.,  3.,  3.],
       [ 0.,  0.,  0.,  0.],
       [ 6.,  6.,  6.,  6.]])

这段代码确实打到我们的要求了！使用负数索引将会从末尾开始选取行：

In [169]: arr[[-3,-5,-7]]
Out[169]:
array([[ 5.,  5.,  5.,  5.],
       [ 3.,  3.,  3.,  3.],
       [ 1.,  1.,  1.,  1.]])

一次传入多个索引数组会有一点特别。它返回的是一个一维数组，其中的元素对应各个索引元组：

In [170]: arr=np.arange(32).reshape((8,4))

In [171]: arr
Out[171]:
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

In [172]: arr[[1,5,7,2],[0,3,1,2]]
Out[172]: array([ 4, 23, 29, 10])

我们来看看具体是怎么一回事。最终选出的是元素（1,0）、（5,3）、（7,1）和（2,2）。这个花式索引的行为可能会跟某些用户的预期不一样（包括我在内），选取矩阵的行列子集应该是矩形区域的形式才对。下面是得到该结果的一个办法：

In [173]: arr[[1,5,7,2]][:,[0,3,1,2]]
Out[173]:
array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

另外一个办法是使用np.ix_函数，它可以将两个一维数组转换为一个用于选取方形区域的索引器：

In [175]: arr[np.ix_([1,5,7,2],[0,3,1,2])]
Out[175]:
array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

记住：花式索引和切片不一样，它总是将数据复制到新数组中（和布尔型索引类似，不再举例说明）。

机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
python进行常见的数学计算（方差，一元二次方程，求导，积分等等） ccut 第一混 python
代码如下：importnumpyasnpimportmathimportcmathimportscipy#平均数defaverage(lst):sum_lst=0forninlst:sum_lst=sum_lst+nreturnsum_lst/len(lst)#方差defvariance(lst):average_lst=average(lst)sum_variance=0forninlst:su
解决：FFmpeg推流时报错：Broken Pipe -米兰的小铁匠 ffmpeg python
最初利用如下代码进行FFmpeg推流：importsubprocessimportcv2importnumpyasnpimporttimeclassRTMPStreamer:def__init__(self,rtmp_url,width,height,fps=30):self.rtmp_url=rtmp_urlself.width=widthself.height=heightself.fps=f
轻松入门 NumPy（二）：数组的升维降维操作 Sunhen_Qiletian numpy
目录引言一.数组的维度、形状和轴1.1数组的维度（Dimensions）1.2数组的形状（Shape）1.3数组的轴（Axes）二.数组的升维（DimensionalityExpansion）2.1升维的操作方法2.2升维的实际应用三.数组的降维（DimensionalityReduction）3.1降维的操作方法1.使用reshape()降维2.flatten()方法3.2降维的实际应用四.总结
pandas.to_sql mysql_pandas to_sql weixin_39929595 pandas.to_sql mysql
实例：importpymysqlimportpandasaspdimportnumpyasnpfromsqlalchemyimportcreate_enginedf=pd.DataFrame([[1,"Bob",0],[2,"Kim",1]],columns=["id","name","sex"])dfidnamesex01Bob012Kim1fromsqlalchemyimportcreate_
Cpython
先编译在运行fromdistutils.coreimportsetup,ExtensionfromCython.Buildimportcythonizeimportnumpysetup(ext_modules=cythonize(Extension('dot_cython',sources=['dot_cython.pyx'],language='c',include_dirs=[numpy.ge
Python代码库OpenCV之11 切割碑文 iCloudEnd
本文代码来自https://blog.csdn.net/u010095372/article/details/79420641源代码适用于python2，我做个简单修改测试图片测试图片代码#-*-coding:utf-8-*-importosimportnumpyasnpimportcv2.cv2ascvfrommatplotlibimportpyplotaspltimportheapqimpor
day 34 打卡 weixin_39908253 AI学习笔记 python 机器学习
day21常见的降维算法#先运行之前预处理好的代码importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsimportwarningswarnings.filterwarnings('ignore')#设置中文字体plt.rcParams['font.sans-serif']=['SimHei']pl
svm支持向量机实例--线性非线性实例代码可运行
fromsklearnimportsvmimportnumpyasnpimportsklearn#因为Python中的sklearn库也集成了SVM算法，所以在Python中一样可以使用支持向量机做分类#取数据集path=r'D:\svm\iris.data'#Iris.data的数据格式如下：共5列，前4列为样本特征，第5列为类别，分别有三种类别Iris-setosa，Iris-versicol
论文复现 Rank consistent ordinal regression for neural networks withapplication to age estimation DeniuHe Pytorch 算法
importtorchimporttorch.nn.functionalasFfromtorchimportnnfromtorch.autogradimportVariableimportpandasaspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccurac
Pytorch实现目标检测
importosimportrandomimportpandasaspdimportnumpyasnpimportcv2fromsklearn.model_selectionimporttrain_test_splitimporttorchfromtorch.utils.dataimportDataset,DataLoaderimporttorch.nnasnnimporttorch.nn.fun
Python中如何打开查看.npz文件 SEVEN是7 python 开发语言
.npz文件是NumPy的压缩存档格式，可以包含多个数组（一个.npz文件包含几个数组）一、导入包importnumpyasnp二、数据加载poem=np.load('tang.npz',allow_pickle=True)使用NumPy的load()函数加载.npz文件：file_path：指定要加载的文件路径allow_pickle=True：允许加载包含Python对象(pickle)的数据
Python 数据科学与可视化工具箱 (一) - 数组创建：array(), arange(), zeros(), ones(), linspace()
文章目录1.为什么需要NumPy数组创建函数？2.核心数组创建函数详解2.1`np.array()`：从现有数据创建数组2.2`np.arange()`：创建等差序列2.3`np.zeros()`：创建全零数组2.4`np.ones()`：创建全一数组2.5`np.linspace()`：创建等间隔序列3.其他常用数组创建函数(简要提及)总结练习题练习题答案创作不易，请各位看官顺手点点关注，不胜感
PyZDDE：Python控制Zemax光学设计软件的实践指南鄧寜
本文还有配套的精品资源，点击获取简介：Zemax软件广泛应用于光学设计领域，提供DDE接口实现与外部程序交互。PyZDDE是一个Python库，允许用户通过DDE通信协议控制Zemax，以自动化执行设计、优化和分析任务。本压缩包包含Python脚本实例，展示如何利用PyZDDE进行文件操作、模型构建、优化与分析、数据提取以及自动化流程，旨在提升光学工程师的工作效率。结合NumPy、SciPy和ma
Python ffmpeg视频处理程序媛一枚~ 视频处理 Python OpenCV ffmpeg python 音视频
2.源码#coding=utf-8importffmpegimportgetpassimportsubprocessimportmatplotlib.pyplotaspltimportcv2importnumpyasnpimportos#ffmpeg相关的音视频操作指令函数#程序列表：'''comband_av音频视频合并comband_aa音频合并pick_v视频静音acceler
层次分析法代码笔记骑驴看星星a numpy python 开发语言笔记
层次分析法一、核心在层次分析法中，通过算术平均法、几何平均法、特征值法计算指标权重，再通过一致性检验确保判断矩阵逻辑合理，为多准则决策提供量化依据。二、代码（一）一致性检验（判断矩阵合理性）importnumpyasnp#1.定义判断矩阵A=np.array([[1,2,3,5],[1/2,1,1/2,2],[1/3,2,1,1/2],[1/5,1/2,1/2,1]])#2.获取矩阵阶数（指标数量
排名前十的编程语言及其详细对比 NurDroid 开发语言
根据2025年4月的最新TIOBE排行榜以及其他综合榜单，当前排名前十的编程语言及其详细对比如下：1.Python•排名：第1位•核心特点：简洁语法、动态类型、丰富的生态库（如NumPy、TensorFlow）。•应用领域：AI/机器学习、数据分析、自动化脚本、Web开发（Django/Flask框架）。•性能：解释型语言，执行速度较慢，但开发效率极高，适合快速原型设计。•趋势：持续领跑AI领域，
如何解决pip安装报错ModuleNotFoundError: No module named ‘numpy’问题万粉变现经纪人全栈Bug解决方案专栏 pip numpy pycharm python pandas scrapy beautifulsoup
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘numpy’问题摘要在使用PyCharm开发Python项目时，常常需要通过pipinstall安装各类第三方包。然而，当安装完毕后，控制台仍然提示ModuleNotFoundError:Nomodulenamed‘numpy’，这让许
深度学习-数据操作
数据操作首先，我们来介绍n维数组，也称为张量（tensor）。GPU很好地支持加速计算，而NumPy仅支持CPU计算；并且张量类支持自动微分。这些功能使得张量类更适合深度学习。张量表示一个由数值组成的数组，这个数组可能有多个维度。具有一个轴的张量对应数学上的向量（vector）；具有两个轴的张量对应数学上的矩阵（matrix）；具有两个轴以上的张量没有特殊的数学名称。上图分别是1维到5维的张量的表
python学习DAY22打卡星仔编程 python学习打卡学习
作业：自行学习参考如何使用kaggle平台，写下使用注意点，并对下述比赛提交代码kaggle泰坦尼克号人员生还预测importwarningswarnings.filterwarnings("ignore")#忽略警告信息#数据处理清洗包importpandasaspdimportnumpyasnpimportrandomasrnd#可视化包importseabornassnsimportmatp
推荐系统如何开发一行代码通万物 python 人工智能推荐系统
推荐系统实现了基于协同过滤的推荐功能支持两种推荐模式：基于用户的协同过滤（寻找相似用户喜欢的物品）基于物品的协同过滤（寻找相似物品）主要功能：数据加载（支持自定义数据或内置的MovieLens数据集）模型训练模型评估（计算RMSE和MAE指标）为指定用户生成推荐列表使用前需要安装依赖库：pipinstallsurprisepandasnumpy可以通过修改sim_options参数来调整相似度计算
pandas库 DataFrame的常见操作
目录一.Pandas库的核心特点与应用场景1.表格数据处理2.与NumPy的区别3.数据转换二.Pandas与OpenPyXl的对比三.DataFrame与Series数据类型四.DataFrame常用操作排序：df.sort_values(by='列名',ascending=False)按指定列降序排序，整行数据同步调整，当参数值为ture时则为升序排序或默认升序排序数据替换：df['列名'].
OpenCV快速入门【OpenCV环境安装与基本操作】欧阳小猜人工智能 opencv 人工智能计算机视觉
文章目录前言一、OpenCV简介与环境搭建1.OpenCV介绍2.OpenCV环境安装与验证二、图像的基本表示：NumPy数组1.图像在计算机的储存方式2.图像的访问（显示）和修改像素值3.图像的基本属性（高度、宽度、通道数）三、图像的读取与存储1.读取图像（cv2.imread）2.保存图像（cv2.imwrite）四、图像的基本操作1.图像切片2.图片的缩放3.图像的绘制3.1绘制直线3.2绘
机器学习-SVM支持向量机
支持向量机是一类监督学习算法，实现二分类，其决策边界是对学习样本求解的最大边距超平面。课程代码：importnumpyasnpmy_seed=2017np.random.seed(my_seed)importrandomrandom.seed(my_seed)importmatplotlibimportmatplotlib.pyplotaspltmatplotlib.rcParams['font.
C++实战：数据标准化高效实现
DBSCAN基本DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，适用于发现任意形状的簇并识别噪声点。核心参数包括：eps：邻域半径，决定样本的邻域范围。min_samples：核心点所需的最小邻域样本数。Python实现步骤安装依赖库pipinstallnumpymatplotlibscikit-l
Scikitlearn：Python机器学习库 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战 AI实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
-Scikit-learn：Python机器学习库1.背景介绍1.1什么是Scikit-learnScikit-learn是一个基于Python语言的开源机器学习库。它建立在NumPy、SciPy和matplotlib等优秀的科学计算库之上,为用户提供了一系列高效的数据挖掘和数据分析工具,涵盖了分类、回归、聚类、降维、模型选择和预处理等机器学习的各个方面。Scikit-learn的目标是提供一个高
【OpenCV-Python】——图像处理基础&读写及显示图像&读写及播放视频&灰度图/彩色图/图像通道操作、运算柯宝最帅 OpenCV学习 python opencv 图像处理
目录前言：1、读并显示图像、写图像2、读并播放视频、写视频3、操作灰度图和彩色图、图像通道操作、运算总结：前言：在Python中，OpenCV使用NumPy数组存储图像，Numpy是使用Python进行数组计算的软件包，提供强大的N维数组对象，支持复杂的广播功能（数组运算），集成了C/C++和Fortran代码工具，支持线性代数、傅里叶变换和随机数等特性，还可作为通用数据的高效多维容器，如在Ope
基于 NumPy 的高效数值计算技术解析与实践指引二向箔reverse numpy
在数据处理与科学计算领域，高效是核心诉求。NumPy作为Python生态高效数值计算的基石，以高性能多维数组对象及配套函数，成为数据从业者的必备工具。其数组支持算术、比较、逻辑等丰富运算，通过向量化操作直接处理每个元素，无需循环，大幅提升代码效率与简洁度。算术运算NumPy数组可以直接进行加减乘除等算术运算，运算规则是对应元素之间进行操作。a=np.array([1,2,3,4,5])b=np.a
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

Numpy基础之 索引和切片

你可能感兴趣的:(numpy)

Numpy基础之索引和切片