人工智障之深度瞎学

使用支持向量机（SVM）检测行人-基于opencv和python的学习笔记（十八）

SVM的明确目标是将一个类的数据点和另一个类的数据点的边缘最大化。这也是SVM有时被叫作最大边缘分类器的原因。

一、支持向量机的线性实现

利用sklearn可以自己生成可控大小和复杂度的随机数据集。

datasets.make_classification([n_samples, ...]): This function
generates a random n-class classification problem, where we can
specify the number of samples, the number of features, and the number
of target labels
datasets.make_regression([n_samples, ...]): This function generates a
random regression problem
datasets.make_blobs([n_samples, n_features, ...]): This function
generates a number of Gaussian blobs we can use for clustering

`svm.setKernel(cv2.ml.SVM_LINEAR)` # 可以设置不同的模式（直线）操作

`np.c_`是按行连接两个矩阵，就是把两矩阵左右相加，要求行数相等。

无论`plt.contour`还是`plt.contourf`，都是绘制三维图，其中前两个参数x和y为两个等长一维数组，第三个参数z为二维数组（表示平面点xi,yi映射的函数值）

from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as np
from sklearn import model_selection as ms
import cv2
from sklearn import metrics


# 数据集生成
x , y = datasets.make_classification(n_samples=100,n_features=2,n_redundant=0,n_classes=2,random_state=7816)
# 数据集可视化
plt.scatter(x[:,0],x[:,1],c=y, s=100)          # 目标标签作为色彩值传入 c=y
plt.xlabel('x1 values')
plt.ylabel('x2 values')
plt.show()
# 数据预处理
x = x.astype(np.float32)               # 使数据兼容OpenCv
y = y * 2 - 1
x_train , x_test , y_train , y_test = ms.train_test_split(x , y , test_size= 0.2, random_state=42)
# 构建支持向量机
svm = cv2.ml.SVM_create()
svm.setKernel(cv2.ml.SVM_LINEAR)                    # 可以设置不同的模式（直线）操作
svm.train(x_train, cv2.ml.ROW_SAMPLE, y_train)      # 调用分类器的train方法来找到最优决策边界
_ , y_pred = svm.predict(x_test)                    # 调用分类器的predict方法来预测测试数据集中所有数据样本的目标标签
print(metrics.accuracy_score(y_test, y_pred))
# 决策边界可视化
def plot_decision_boundary (svm, x_test, y_test):
    x_min, x_max = x_test[:,0].min()-1, x_test[:,0].max()+1          # 使得所有的点在方格子内
    y_min, y_max = x_test[:,0].min()-1, x_test[:,0].max()+1
    h = 0.02      # 取样步长
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h),np.arange(y_min, y_max, h))    # 创建网格
    # np.c_是按行连接两个矩阵，就是把两矩阵左右相加，要求行数相等。
    # 把这些（xx,yy）坐标值当作假设的数据点。因此可以把它们叠成为一个Nx2的矩阵
    x_hypo = np.c_[xx.ravel().astype(np.float32),yy.ravel().astype(np.float32)]   #最终的数据为一个Nx2的矩阵
    _, zz = svm.predict(x_hypo)
    # 得到的结构目标标签zz将会被用来创建一个特征结构的颜色映射
    zz = zz.reshape(xx.shape)
    plt.contourf(xx, yy, zz, cmap=plt.cm.coolwarm, alpha=0.8)    # 绘制三维图
    plt.scatter(x_test[:,0],x_test[:,1], c=y_test,s=200)
plot_decision_boundary(svm, x_test, y_test)
plt.show()

下图是随机生成的用于二分类问题的数据：

下图是线性决策边界可视化：

二、支持向量机的非线性实现(创建不同的核函数)

处理线性不可分的数据基本思路是创建原始特征的非线性组合。与把数据投影到更高维空间，在高维空间中的数据突然变得线性可分的说法是一样的。

N维空间的线性决策边界叫作超平面。在六维空间中的决策边界时一个五维的超平面，三维空间的决策边界是一个二维平面，在二维空间中，是一条直线。

而在高维空间中，因为它增加了维度之间的数学投影要处理大量的额外单元。因此采用核机制来解决这个问题。

其中一类核函数叫作，径向基函数（Radial basis function）：是一个取值仅仅依赖于离原点距离的实值函数。更常见的例子是高斯函数（也叫作贝尔曲线），通过调节高斯函数的标准差（也就是从中心距离下降的程度），可以创建大量复杂的决策边界，尤其是在更高维空间中。

常用的核函数：

- `cv2.ml.SVM_LINEAR:` 提供一个线性的决策边界。

- `cv2.ml.SVM_POLY:` 这个核在原始特征空间提供一个多项式的函数作为决策边界，通过 `svm.setCoef0` (通常为0) 指定一个系数，通过 `svm.setDegree`.指定多项式的项数。

- `cv2.ml.SVM_RBF:` 高斯函数类型

- `cv2.ml.SVM_SIGMOID:` sigmoid函数类型

- `cv2.ml.SVM_INTER:` 由 OpenCV 3 新提供的. 它根据类别的直方图的相似性来分类。

# 创建不同的核函数
kernels = [cv2.ml.SVM_LINEAR, cv2.ml.SVM_INTER, cv2.ml.SVM_SIGMOID, cv2.ml.SVM_RBF]
kernels1 = ['LINEAR','INTER','SIGMOID','RBF']
for idx, kernel in enumerate(kernels):
    svm = cv2.ml.SVM_create()                             # 创建SVM
    svm.setKernel(kernel)                                 # 设置核函数
    svm.train(x_train, cv2.ml.ROW_SAMPLE, y_train)        # 训练数据集
    _1, y_pred1 = svm.predict(x_test)                     # 评分
    accuracy1 = metrics.accuracy_score(y_test, y_pred1)
    plt.subplot(2,2,idx + 1)
    plot_decision_boundary(svm, x_test, y_test)
    title1='% s : accuracy = %.2f' % (kernels1[idx], accuracy1)   print(title1)
    plt.title(title1)
plt.show()

不同核函数的边缘分界不一样：

三、行人检测

检测和识别的区别，识别：对象是什么，检测：对象是否存在。

The basic idea behind most detection algorithms is to split up an image into many small patches, and then classify each image patch as either containing a pedestrian or not. This is exactly what we are going to do in this section. In order to arrive at our own pedestrian detection algorithm, we need to perform the following steps:

1. Build a database of images containing pedestrians.These will be ourpositivedata samples.

2. Build a database of images not containing pedestrians. These will be our negative data samples.

3. Train an SVM on the dataset.

4. Apply the SVM to every possible patch of a test image in order to decide whether the overall image contains a pedestrian.

获取数据集，从http://cbcl.mit.edu/software-datasets/PedestrianData.html下载，点击下载一个叫作http://cbcl.mit.edu/projects/cbcl/software-datasets/pedestrians128x64.tar.gz的文件。

方向梯度直方图(histogram of oriented gradients ，HOG)，基本思想：图像中对象的局部形状和外观可以使用边缘方向的分布来表示。图像被分为多个连接在一起的小区域，然后编译其中的方向梯度直方图（或者边缘直方图），接下来，通过把不同的直方图连接起来就得到了描述符。下图所示：

HOG特别适合纹理丰富的数据，为了提升性能，局部直方图可以按照对比度进行归一化，这个操作会让光照和阴影下的变化保持更好的不变性。

在OpenCv中HOG描述符可以通过`cv2.HOGDescriptor`来设置，

`win_size` = (48, 96) ，检测窗口大小（检测对象的最小尺寸48 * 96）对HOG影响最大

`block_size` = (16, 16)，块的大小（每个块最大为16 * 16）

`block_stride` = (8, 8) ，单元格尺寸

`cell_size` = (8, 8)，单元格步长（从一个单元格移动8*8像素到另外一个单元格）

`num_bins` = 9 ，对于每一个单元格，统计9个方向的梯度直方图。

正样本：行人（64*128）

负样本：图像看起来像正样本，但不包括行人

import cv2
import matplotlib.pyplot as plt
import numpy as np
import random
import os
from sklearn import model_selection as ms
from sklearn import metrics

random.seed(42)

# 设置正负数据集所在的位置
datadir = "data-new/chapter6"
dataset = "pedestrians128x64"
datafile = "%s/%s.tar.gz" % (datadir, dataset)
extractdir = "%s/%s" % (datadir, dataset)
negset = "pedestrians_neg"
negfile = "%s/%s.tar.gz" % (datadir, negset)
negdir = "%s/%s" % (datadir, negset)

# 解压数据集
def extract_tar(datafile, extractdir):                 # 定义解压缩文件函数   datafile待解压的文件，
    try:
        import tarfile
    except ImportError:
        raise ImportError("You do not have tarfile installed. "
                          "Try unzipping the file outside of Python.")

    tar = tarfile.open(datafile)
    tar.extractall(path=extractdir)
    tar.close()
    print("%s successfully extracted to %s" % (datafile, extractdir))
extract_tar(datafile, datadir)               # 解压正样本数据集至指定位置
extract_tar(negfile, datadir)                # 解压负样本数据集至指定位置
for i in range(5):
    filename = "%s/per0010%d.ppm" % (extractdir, i)     # 读取文件中第100到104的5张图片
    img = cv2.imread(filename)
    plt.subplot(1,5,i+1)
    plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    plt.axis('off')
plt.show()
# 设置HOG描述符参数
win_size = (48, 96)            # 检测窗口大小（检测对象的最小尺寸48 * 96）
block_size = (16, 16)          #（每个块最大为16 * 16）
block_stride = (8, 8)          # 单元格尺寸
cell_size = (8, 8)             #（从一个单元格移动8*8像素到另外一个单元格）
num_bins = 9                   # 对于每一个单元格，统计9个方向的梯度直方图。
hog = cv2.HOGDescriptor(win_size, block_size, block_stride, cell_size, num_bins)     # 设置HOG描述符参数
# 构建正样本
x_pos = []
for i in random.sample(range(900), 400):                   # 在0到900张图片中随机挑选400张图片
    filename = "%s/per%05d.ppm" % (extractdir, i)
    img = cv2.imread(filename)
    if img is None:
        print('Could not find image %s' % filename)
        continue
    x_pos.append(hog.compute(img, (64, 64)))                   # 利用HOG进行计算
x_pos = np.array(x_pos, dtype=np.float32)                      # 数据类型转换，兼容OpenCv
y_pos = np.ones(x_pos.shape[0], dtype=np.int32)                # 将训练样本赋值给y_pos
print (x_pos.shape, y_pos.shape)                               # (399, 1980, 1) (399,)     399个训练样本，1980特征值
# 构建负样本  图像尺寸与正样本一样
hroi = 128
wroi = 64
x_neg = []
for negfile in os.listdir(negdir):
    filename = '%s/%s' % (negdir, negfile)
    img = cv2.imread(filename)
    img = cv2.resize(img, (512, 512))
    for j in range(5):
        rand_y = random.randint(0, img.shape[0] - hroi)    # uniform:随机浮点数 randint:随机整数 randrange:随机偶数
        rand_x = random.randint(0, img.shape[1] - wroi)
        roi = img[rand_y:rand_y + hroi, rand_x:rand_x + wroi, :]    # 随机选择左上角的坐标来切出一个64*128像素的感兴趣区域
        x_neg.append(hog.compute(roi, (64, 64)))                    # 利用HOG进行计算
x_neg = np.array(x_neg, dtype=np.float32)                           # 数据类型转换，兼容OpenCv
y_neg = -np.ones(x_neg.shape[0], dtype=np.int32)                    # 将训练样本赋值给y_neg
print(x_neg.shape, y_neg.shape)                                     # (250, 1980, 1) (250,)   250个训练样本，1980特征值
# 将X 和Y （正样本和负样本）合并
x = np.concatenate((x_pos, x_neg))
y = np.concatenate((y_pos, y_neg))
x_train, x_test, y_train, y_test = ms.train_test_split( x, y, test_size=0.2, random_state=42)
# 实现支持向量机
def train_svm(X_train, y_train):                                  # 把训练过程封装为一个函数
    svm = cv2.ml.SVM_create()
    svm.train(X_train, cv2.ml.ROW_SAMPLE, y_train)
    return svm
def score_svm(svm, X, y):                                         # 把评分过程封装为一个函数
    _, y_pred = svm.predict(X)
    return metrics.accuracy_score(y, y_pred)
svm = train_svm(x_train, y_train)                                 # 训练
print('训练集分数：%.5f  ，测试集分数：%.5f' %  (score_svm(svm, x_train, y_train),score_svm(svm, x_test, y_test)))            # 在训练集上的评分

由于使用了HOG特征描述子，虽然在训练数据集上没有错误出现，然而，其泛化能力非常差（64%）。因为比训练表现差太多（100%）。表明模型在数据集上过拟合。为了提升性能，采用模型自举。

3.1模型自举

自举：想法很简单，在训练集上训练完SVM后，他们对模型进行评分，发现模型得到了一些假正的结果。记住假正意味着模型预测为一个正样本（+），但实际上是一个负样本（-）.在我们的场景中，这就表明SVM错误地认为图像中包含一个行人。如果是在数据集中一张特定的图像上发生这种情况，这个样本显然是有问题的。因此，我们应该把它添加到训练数据集中，并使用这些额外有问题的图像重新训练SVM，这样算法就可以学习到如何把这个图像正确分类。这个过程可以一直重复直到SVM得到一个满意的表现。

# 模型自举
score_train = []
score_test = []
for i in range(3):
    svm = train_svm(x_train, y_train)                    # 训练评估模型
    score_train.append(score_svm(svm, x_train, y_train))
    score_test.append(score_svm(svm, x_test, y_test))

    _, y_pred = svm.predict(x_test)                      # 从测试数据集中找到假正的图片，如果没有，就完成了训练
    false_pos = np.logical_and((y_test.ravel() == -1), (y_pred.ravel() == 1))  # 都为真，即存在假正  false_pos为布尔值
    if not np.any(false_pos):
        print('no more false positives : done')
        break
    x_train = np.concatenate((x_train, x_test[false_pos, :]), axis=0)         # 把假正图片添加到训练数据集中，重复过程
    y_train = np.concatenate((y_train, y_test[false_pos]), axis=0)
print('训练集分数：%s  ，测试集分数：%s' %  (score_train,score_test))

3.2 在更大的图像中检测行人

剩下要做的就是将SVM分类过程与检测过程连接起来。这样做的方法是对图像中的每一个可能的块重复进行我们的分类。这与我们之前可视化决策边界时所做的类似;我们创建了一个精细的网格，并对网格上的每个点进行分类。同样的想法也适用于这里。我们将图像分割成小块，并将每个小块检测是否包含行人。

因此，如果我们想这样做，我们必须在图像中遍历所有可能的块，每次将我们感兴趣的区域移动一个小的stride像素点。

行人可能出现在不同的图像中的区域，且大小不一样需要对图像进行缩放`detectMultiScale`

# 行人可能出现在不同的图像中的区域，且大小不一样需要对图像进行缩放
hog = cv2.HOGDescriptor(win_size, block_size, block_stride, cell_size, num_bins)
rho, _, _ = svm.getDecisionFunction(0)                     # 返回决策函数的参数，从核响应的加权和减去的一个标量
sv = svm.getSupportVectors()                               # 以浮点矩阵的形式返回所有的支持向量
hog.setSVMDetector(np.append(sv[0, :].ravel(), rho))       # 为线性分类器设置系数

"""
# 使用默认的SVM分类
hogdef = cv2.HOGDescriptor()                               # 设置HOG默认参数
hogdef.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())      # 用于人员检测的分类器(64x128窗口)的简短返回系数
"""
found, _ = hog.detectMultiScale(img_test)               # 调用检测函数 ，返回检测到行人的框的列表

fig = plt.figure(figsize=(10, 6))                          # 画出测试图像
ax = fig.add_subplot(111)
ax.imshow(cv2.cvtColor(img_test, cv2.COLOR_BGR2RGB))
for f in found:                                            # 标记图像中检测到的行人
    ax.add_patch(patches.Rectangle((f[0], f[1]), f[2], f[3], color='y', linewidth=3, fill=False))
plt.savefig('detected.png')
plt.show()

完整代码：

import cv2
import matplotlib.pyplot as plt
import numpy as np
import random
import os
from sklearn import model_selection as ms
from sklearn import metrics
from matplotlib import patches

random.seed(42)

# 设置正负数据集所在的位置
datadir = "data-new/chapter6"
dataset = "pedestrians128x64"
datafile = "%s/%s.tar.gz" % (datadir, dataset)
extractdir = "%s/%s" % (datadir, dataset)
negset = "pedestrians_neg"
negfile = "%s/%s.tar.gz" % (datadir, negset)
negdir = "%s/%s" % (datadir, negset)

# 解压数据集
def extract_tar(datafile, extractdir):                 # 定义解压缩文件函数   datafile待解压的文件，
    try:
        import tarfile
    except ImportError:
        raise ImportError("You do not have tarfile installed. "
                          "Try unzipping the file outside of Python.")

    tar = tarfile.open(datafile)
    tar.extractall(path=extractdir)
    tar.close()
    print("%s successfully extracted to %s" % (datafile, extractdir))
extract_tar(datafile, datadir)               # 解压正样本数据集至指定位置
extract_tar(negfile, datadir)                # 解压负样本数据集至指定位置
for i in range(5):
    filename = "%s/per0010%d.ppm" % (extractdir, i)     # 读取文件中第100到104的5张图片
    img = cv2.imread(filename)
    plt.subplot(1,5,i+1)
    plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    plt.axis('off')
plt.show()
# 设置HOG描述符参数
win_size = (48, 96)            # 检测窗口大小（检测对象的最小尺寸48 * 96）
block_size = (16, 16)          #（每个块最大为16 * 16）
block_stride = (8, 8)          # 单元格尺寸
cell_size = (8, 8)             #（从一个单元格移动8*8像素到另外一个单元格）
num_bins = 9                   # 对于每一个单元格，统计9个方向的梯度直方图。
hog = cv2.HOGDescriptor(win_size, block_size, block_stride, cell_size, num_bins)     # 设置HOG描述符参数
# 构建正样本
x_pos = []
for i in random.sample(range(900), 400):                   # 在0到900张图片中随机挑选400张图片
    filename = "%s/per%05d.ppm" % (extractdir, i)
    img = cv2.imread(filename)
    if img is None:
        print('Could not find image %s' % filename)
        continue
    x_pos.append(hog.compute(img, (64, 64)))                   # 利用HOG进行计算
x_pos = np.array(x_pos, dtype=np.float32)                      # 数据类型转换，兼容OpenCv
y_pos = np.ones(x_pos.shape[0], dtype=np.int32)                # 将训练样本赋值为1给y_pos
print (x_pos.shape, y_pos.shape)                               # (399, 1980, 1) (399,)     399个训练样本，1980特征值
# 构建负样本  图像尺寸与正样本一样
hroi = 128
wroi = 64
x_neg = []
for negfile in os.listdir(negdir):
    filename = '%s/%s' % (negdir, negfile)
    img = cv2.imread(filename)
    img = cv2.resize(img, (512, 512))
    for j in range(5):
        rand_y = random.randint(0, img.shape[0] - hroi)    # uniform:随机浮点数 randint:随机整数 randrange:随机偶数
        rand_x = random.randint(0, img.shape[1] - wroi)
        roi = img[rand_y:rand_y + hroi, rand_x:rand_x + wroi, :]    # 随机选择左上角的坐标来切出一个64*128像素的感兴趣区域
        x_neg.append(hog.compute(roi, (64, 64)))                    # 利用HOG进行计算
x_neg = np.array(x_neg, dtype=np.float32)                           # 数据类型转换，兼容OpenCv
y_neg = -np.ones(x_neg.shape[0], dtype=np.int32)                    # 将训练样本赋值给y_neg   np.ones 填充1
print(x_neg.shape, y_neg.shape)                                     # (250, 1980, 1) (250,)   250个训练样本，1980特征值
# 将X 和Y （正样本和负样本）合并
x = np.concatenate((x_pos, x_neg))
y = np.concatenate((y_pos, y_neg))
x_train, x_test, y_train, y_test = ms.train_test_split( x, y, test_size=0.2, random_state=42)
# 实现支持向量机
def train_svm(X_train, y_train):                                  # 把训练过程封装为一个函数
    svm = cv2.ml.SVM_create()
    svm.train(X_train, cv2.ml.ROW_SAMPLE, y_train)
    return svm
def score_svm(svm, X, y):                                         # 把评分过程封装为一个函数
    _, y_pred = svm.predict(X)
    return metrics.accuracy_score(y, y_pred)
svm = train_svm(x_train, y_train)                                 # 训练
print('训练集分数：%.5f  ，测试集分数：%.5f' %  (score_svm(svm, x_train, y_train),score_svm(svm, x_test, y_test)))            # 在训练集上的评分

# 模型自举
score_train = []
score_test = []
for i in range(3):
    svm = train_svm(x_train, y_train)                    # 训练评估模型
    score_train.append(score_svm(svm, x_train, y_train))
    score_test.append(score_svm(svm, x_test, y_test))

    _, y_pred = svm.predict(x_test)                      # 从测试数据集中找到假正的图片，如果没有，就完成了训练
    false_pos = np.logical_and((y_test.ravel() == -1), (y_pred.ravel() == 1))  # 都为真，即存在假正  false_pos为布尔值
    if not np.any(false_pos):
        print('no more false positives : done')
        break
    x_train = np.concatenate((x_train, x_test[false_pos, :]), axis=0)         # 把假正图片添加到训练数据集中，重复过程
    y_train = np.concatenate((y_train, y_test[false_pos]), axis=0)
print('训练集分数：%s  ，测试集分数：%s' %  (score_train,score_test))

# 在更大的图像中检测行人
img_test = cv2.imread('data-new/chapter6/pedestrian_test.jpg')
stride = 16                            # 设置需要移动的像素点
found = []                             # 检测列表
for ystart in np.arange(0, img_test.shape[0], stride):
    for xstart in np.arange(0, img_test.shape[1], stride):      # 每次将感兴趣的区域移动一个小的stride像素点
        if ystart + hroi > img_test.shape[0]:                   # 确保不会超过图像的边界
            continue
        if xstart + wroi > img_test.shape[1]:      #当xstart + wroi > img_test.shape[1]时，结束当前循环进入下一个循环
            continue
        roi = img_test[ystart:ystart + hroi, xstart:xstart + wroi, :]    # 切下来roi区域预处理并且分类
        feat = np.array([hog.compute(roi, (64, 64))])
        _2, ypred = svm.predict(feat)
        if np.allclose(ypred, 1):                                        # 如果检测到是行人则添加至列表
            found.append((ystart, xstart, hroi, wroi))

# 行人可能出现在不同的图像中的区域，且大小不一样需要对图像进行缩放
hog = cv2.HOGDescriptor(win_size, block_size, block_stride, cell_size, num_bins)
rho, _, _ = svm.getDecisionFunction(0)                     # 返回决策函数的参数，从核响应的加权和减去的一个标量
sv = svm.getSupportVectors()                               # 以浮点矩阵的形式返回所有的支持向量
hog.setSVMDetector(np.append(sv[0, :].ravel(), rho))       # 为线性分类器设置系数

"""
# 使用默认的SVM分类
hogdef = cv2.HOGDescriptor()                               # 设置HOG默认参数
hogdef.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())      # 用于人员检测的分类器(64x128窗口)的简短返回系数
"""
found, _ = hog.detectMultiScale(img_test)               # 调用检测函数 ，返回检测到行人的框的列表

fig = plt.figure(figsize=(10, 6))                          # 画出测试图像
ax = fig.add_subplot(111)
ax.imshow(cv2.cvtColor(img_test, cv2.COLOR_BGR2RGB))
for f in found:                                            # 标记图像中检测到的行人
    ax.add_patch(patches.Rectangle((f[0], f[1]), f[2], f[3], color='y', linewidth=3, fill=False))
plt.savefig('detected.png')
plt.show()

Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
Python 4.0新特性解析：性能优化与语法升级知识产权13937636601 计算机 python 性能优化开发语言
本文针对Python4.0的核心升级展开系统性分析，从性能优化与语法革新两个维度揭示其技术突破。首先解析新型解释器架构对运算效率的提升路径，其次探讨模式匹配、异步编程简化和类型系统强化等语法特性，最后结合机器学习与高并发场景验证新版本的实践价值。研究发现，Python4.0通过JIT编译器与内存管理重构实现3倍以上性能跃升，同时静态类型推导的完善显著提升大型项目维护效率，标志着Python从"胶水
Python,C++,go语言开发社会犯罪人群回归社会跟踪与辅助管理APP Geeker-2025 python c++golang
开发一款用于**社会犯罪人群回归社会跟踪与辅助管理**的App，结合Python、C++和Go语言的优势，可以实现高效的数据处理、实时的跟踪监控以及用户友好的前端界面。以下是一个详细的开发方案，涵盖技术选型、功能模块、开发步骤等内容。##技术选型###后端（Python+Go）-**编程语言**：-**Python**：用于数据处理、机器学习（如风险评估、行为预测）、脚本编写等。-**Go**：用
IoTDB智能分析节点AINode：时序数据分析的新引擎时序数据说 iotdb 数据分析数据挖掘时序数据库数据库大数据 ai
在大数据与物联网的驱动下，时序数据处理需求激增，如何高效存储、管理并实时分析海量时序数据成为技术挑战。作为专为时序数据设计的数据库，IoTDB通过引入智能分析节点（AINode），将机器学习能力原生集成到数据库中，实现了“数据存储-分析-决策”的一体化闭环。本文将深入解析AINode的核心功能、技术优势及实际应用场景。AINode：IoTDB的智能分析引擎AINode是IoTDB推出的第三种内生节
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python 的 GIL 时代即将终结，迈向真正的多线程时代技术狂潮AI Python开发实战 AI编程实战 AI应用实战开发语言 GIL Python
Python功能强大、灵活且对程序员友好，广泛应用于从Web开发到机器学习的各个领域。根据引用次数最多的两项指标，Python甚至超越了Java和C等语言，成为最流行的编程语言。经过多年的流行，Python似乎势不可挡。但Python作为一种编程语言的未来发展至少面临一个重大障碍。它被称为GIL，即全局解释器锁，几十年来，Python开发人员一直试图将其从Python的默认实现中删除。虽然GIL在
如何从零开始入行机器学习
在当今的科技浪潮中，机器学习无疑是最耀眼的明星之一。它不仅引领了人工智能的发展，还在各个行业中催生了大量的创新和变革。对于那些对技术充满热情、渴望在这个领域有所作为的人来说，“如何从零开始入行机器学习”成为了最热门的话题之一。这不仅仅是技术上的挑战，更是一个职业生涯的新起点。想象一下，在未来的工作中，你能够开发出自动识别图像的应用程序，或者设计一个可以预测市场趋势的智能系统，这一切都源于你现在迈出
如何评价开课吧机器学习特训营这个课程？ cda2024 机器学习人工智能
开场：点明主题，吸引眼球在当今数据驱动的时代，机器学习（MachineLearning）已经成为各个行业不可或缺的技术之一。无论是金融、医疗、制造还是零售，机器学习的应用都为这些领域带来了巨大的变革。面对这样的趋势，许多人都希望能够掌握这门技术，从而提升自己的职业竞争力。那么，当我们谈论“如何评价开课吧机器学习特训营这个课程”时，实际上是在探讨一个非常具体且重要的问题：对于那些希望进入或深入机器学
Anaconda（AI生成测试） harrio_ python
技术文章大纲：Anaconda插件开发挑战赛引言Anaconda作为数据科学与机器学习的核心工具，其插件生态系统的扩展性为开发者提供了广阔的创新空间。插件开发挑战赛旨在激励开发者探索Anaconda的潜力，解决实际场景中的技术痛点。以下为技术文章的核心框架。Anaconda插件开发的核心价值插件开发能够增强Anaconda的功能模块化，例如集成新的编程语言支持、优化包管理流程或扩展可视化工具。通过
Python与机器学习库Scikit-learn进阶 master_chenchengg python python Python python开发 IT
Python与机器学习库Scikit-learn进阶Scikit-learn进阶之旅：从新手到高手的必经之路为什么选择Scikit-learn？安装与环境设置特征工程的艺术：打造更强大的预测模型数据清洗特征构造模型调优秘籍：网格搜索与交叉验证的最佳实践网格搜索交叉验证集成学习的魅力：提升模型性能的组合拳随机森林梯度提升机堆叠实战案例解析：使用Scikit-learn解决真实世界问题数据准备模型训练
表征学习：机器认知世界的核心能力与前沿突破大千AI助手人工智能 #OTHER Python 学习人工智能机器学习神经网络表征学习 RL 特征工程
一、定义与背景：从特征工程到自动化学习表征学习（RepresentationLearning），又称特征学习（FeatureLearning），是机器学习的核心技术领域，其核心目标是通过算法自动学习数据的内在特征表示，将复杂多变的原始数据（如图像、文本、语音）转化为低维、富含语义信息的向量形式，从而提升下游任务（如分类、回归、聚类）的效率和精度。与传统依赖人工设计特征的特征工程（FeatureEn
踏上人工智能之旅（一）-----机器学习之knn算法 Sunhen_Qiletian 人工智能机器学习算法 python
目录一、机器学习是什么（1）概述（2）三种类型1.监督学习（SupervisedLearning）：2.无监督学习（UnsupervisedLearning）：3.强化学习（ReinforcementLearning）：二、KNN算法的基本原理：1.距离度量：2.K值的选择：3.投票机制和投票：三、Python实现KNN算法1.导入必要的库和数据：2.提取特征和标签：3.导入KNN分类器并训练模型
【Python】pandas.cut()函数的用法
pandas.cut()函数是一个非常有用的工具，用于将数值型数据按照指定的分箱或区间进行分割，从而将连续的数值变量转换为离散的类别变量。这在数据分析和机器学习的特征工程中尤其有用，因为它可以帮助揭示不同区间内的数据分布特征，或者简化模型的输入。基本用法pandas.cut()的基本语法如下：pandas.cut(x,bins,right=True,labels=None,retbins=Fals
以AI人工智能为核心，发展空间智能 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
以AI人工智能为核心，发展空间智能关键词：人工智能、空间智能、智能系统、机器学习、计算机视觉、物联网、自动化技术摘要：本文围绕"以AI人工智能为核心发展空间智能"这一主题，系统解析空间智能的技术架构与实现路径。通过揭示AI与空间智能的核心关联，深入探讨机器学习、计算机视觉、数字孪生等关键技术如何赋能空间数据的感知、处理与决策。结合智能建筑、智慧城市等实际场景，展示从算法原理到工程落地的完整技术链条
Python金融分析：情感分析在量化价值投资中的完整实现 AI量化价值投资入门到精通 python 金融开发语言 ai
Python金融分析：情感分析在量化价值投资中的完整实现关键词：Python金融分析、情感分析、量化投资、价值投资、自然语言处理、机器学习、金融文本挖掘摘要：本文系统解析如何将情感分析技术深度整合到量化价值投资体系中，通过Python实现从金融文本数据采集、预处理、情感建模到策略回测的完整流程。详细阐述基于规则引擎、机器学习和深度学习的多维度情感分析方法，结合财务指标构建复合投资模型，并通过实战案
通用图片 OCR 到 Word API 数据接口 2301_78772565 ocr
通用图片OCR到WordAPI数据接口高可用图像识别引擎，基于机器学习，超精准识别率。1.产品功能通用的识别接口，支持多种图片格式；支持中英文字符混合识别；支持Base64以及网络地址传参；基于机器学习不断提高的识别率；输出的Word文件永久存储；数据持续更新与维护；全接口支持HTTPS（TLSv1.0/v1.1/v1.2/v1.3）；全面兼容AppleATS；全国多节点CDN部署；接口极速响应，
机器学习模型评估：交叉验证、混淆矩阵、ROC曲线及其在医学影像领域的应用猿享天开机器学习矩阵人工智能 DICOM医学影像模型评估
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
深入详解：决策树在医学影像分割特征选择中的应用与实现猿享天开决策树算法机器学习人工智能
深入详解：决策树在医学影像分割特征选择中的应用与实现决策树（DecisionTree）作为一种经典的机器学习算法，以其简单、直观和可解释性强的特点，在医学影像分割的特征选择中扮演了重要角色。医学影像分割（如分割脑肿瘤、肝脏、肺结节等）需要从高维影像数据中提取关键特征，以提升分割模型的精度和效率。决策树通过构建树形结构，筛选对分割任务最重要的特征，降低数据维度，同时提供可解释的规则。本文将从原理、实
机器学习概述炀水机器学习人工智能
一、机器学习算法与流程（一）、机器学习的主要流程：1.明确分析目标，2.数据收集，3.数据预处理，4.建模分析，5.结果评估，6.部署使用以及学习更新。1.明确分析目标：客观反映用户需求，通过对各类人群的深入分析，为相关部门制订资费、服务、市场策略提供基础。2.数据收集：收集相关的数据，充足、全面的高质量数据是机器学习的基础。3.数据预处理：数据可能存在着噪声、不一致、异常、个人隐私保护等各类问题
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

使用支持向量机（SVM）检测行人-基于opencv和python的学习笔记（十八）

SVM的明确目标是将一个类的数据点和另一个类的数据点的边缘最大化。这也是SVM有时被叫作最大边缘分类器的原因。

一、支持向量机的线性实现

利用sklearn可以自己生成可控大小和复杂度的随机数据集。

svm.setKernel(cv2.ml.SVM_LINEAR) # 可以设置不同的模式（直线）操作

np.c_是按行连接两个矩阵，就是把两矩阵左右相加，要求行数相等。

无论plt.contour还是plt.contourf，都是绘制三维图，其中前两个参数x和y为两个等长一维数组，第三个参数z为二维数组（表示平面点xi,yi映射的函数值）

下图是随机生成的用于二分类问题的数据：

下图是线性决策边界可视化：

二、支持向量机的非线性实现(创建不同的核函数)

处理线性不可分的数据基本思路是创建原始特征的非线性组合。与把数据投影到更高维空间，在高维空间中的数据突然变得线性可分的说法是一样的。

N维空间的线性决策边界叫作超平面。在六维空间中的决策边界时一个五维的超平面，三维空间的决策边界是一个二维平面，在二维空间中，是一条直线。

而在高维空间中，因为它增加了维度之间的数学投影要处理大量的额外单元。因此采用核机制来解决这个问题。

常用的核函数：

- cv2.ml.SVM_LINEAR: 提供一个线性的决策边界。

- cv2.ml.SVM_POLY: 这个核在原始特征空间提供一个多项式的函数作为决策边界，通过 svm.setCoef0 (通常为0) 指定一个系数，通过 svm.setDegree.指定多项式的项数。

- cv2.ml.SVM_RBF: 高斯函数类型

- cv2.ml.SVM_SIGMOID: sigmoid函数类型

- cv2.ml.SVM_INTER: 由 OpenCV 3 新提供的. 它根据类别的直方图的相似性来分类。

不同核函数的边缘分界不一样：

三、行人检测

检测和识别的区别，识别：对象是什么，检测：对象是否存在。

1. Build a database of images containing pedestrians.These will be ourpositivedata samples.

2. Build a database of images not containing pedestrians. These will be our negative data samples.

3. Train an SVM on the dataset.

4. Apply the SVM to every possible patch of a test image in order to decide whether the overall image contains a pedestrian.

获取数据集，从http://cbcl.mit.edu/software-datasets/PedestrianData.html下载，点击下载一个叫作http://cbcl.mit.edu/projects/cbcl/software-datasets/pedestrians128x64.tar.gz的文件。

HOG特别适合纹理丰富的数据，为了提升性能，局部直方图可以按照对比度进行归一化，这个操作会让光照和阴影下的变化保持更好的不变性。

在OpenCv中HOG描述符可以通过cv2.HOGDescriptor来设置，

win_size = (48, 96) ，检测窗口大小（检测对象的最小尺寸48 * 96）对HOG影响最大

block_size = (16, 16)， 块的大小（每个块最大为16 * 16）

block_stride = (8, 8) ， 单元格尺寸

cell_size = (8, 8)， 单元格步长（从一个单元格移动8*8像素到另外一个单元格）

num_bins = 9 ， 对于每一个单元格，统计9个方向的梯度直方图。

正样本：行人（64*128）

负样本：图像看起来像正样本，但不包括行人

由于使用了HOG特征描述子，虽然在训练数据集上没有错误出现，然而，其泛化能力非常差（64%）。因为比训练表现差太多（100%）。表明模型在数据集上过拟合。为了提升性能，采用模型自举。

3.1模型自举

3.2 在更大的图像中检测行人

因此，如果我们想这样做，我们必须在图像中遍历所有可能的块，每次将我们感兴趣的区域移动一个小的stride像素点。

行人可能出现在不同的图像中的区域，且大小不一样需要对图像进行缩放detectMultiScale

完整代码：

你可能感兴趣的:(机器学习)

`svm.setKernel(cv2.ml.SVM_LINEAR)` # 可以设置不同的模式（直线）操作

`np.c_`是按行连接两个矩阵，就是把两矩阵左右相加，要求行数相等。

无论`plt.contour`还是`plt.contourf`，都是绘制三维图，其中前两个参数x和y为两个等长一维数组，第三个参数z为二维数组（表示平面点xi,yi映射的函数值）

- `cv2.ml.SVM_LINEAR:` 提供一个线性的决策边界。

- `cv2.ml.SVM_POLY:` 这个核在原始特征空间提供一个多项式的函数作为决策边界，通过 `svm.setCoef0` (通常为0) 指定一个系数，通过 `svm.setDegree`.指定多项式的项数。

- `cv2.ml.SVM_RBF:` 高斯函数类型

- `cv2.ml.SVM_SIGMOID:` sigmoid函数类型

- `cv2.ml.SVM_INTER:` 由 OpenCV 3 新提供的. 它根据类别的直方图的相似性来分类。

在OpenCv中HOG描述符可以通过`cv2.HOGDescriptor`来设置，

`win_size` = (48, 96) ，检测窗口大小（检测对象的最小尺寸48 * 96）对HOG影响最大

`block_size` = (16, 16)，块的大小（每个块最大为16 * 16）

`block_stride` = (8, 8) ，单元格尺寸

`cell_size` = (8, 8)，单元格步长（从一个单元格移动8*8像素到另外一个单元格）

`num_bins` = 9 ，对于每一个单元格，统计9个方向的梯度直方图。

行人可能出现在不同的图像中的区域，且大小不一样需要对图像进行缩放`detectMultiScale`