郜太素

深度学习中的正则化方法与卷积神经网络基础

笔记

1 正则化方法

1.1 什么是正则化

防止模型过拟合(训练集效果好, 测试集效果差), 提高模型泛化能力
一种防止过拟合, 提高模型泛化能力的策略
- L1正则: 需要通过手动写代码实现
- L2正则: SGD(weight_decay=)
- dropout
- BN

1.2 Dropout正则化

让神经元以p概率随机死亡, 每批次样本训练模型时, 死亡的神经元都是随机, 防止预测结果受某个神经元影响(防止过拟合)
p概率->[0.2, 0.5], 简单模型概率低, 复杂模型概率高
不失活的神经元计算结果除以(1-p), 让训练时输出结果和测试时(dropout不生效)结果一致
- 训练模型 -> model.train()
- 测试模型 -> model.eval()

dropout是在激活层后使用

import torch
import torch.nn as nn


# dropout随机失活: 每批次样本训练时,随机让一部分神经元死亡,防止一些特征对结果影响大(防止过拟合)
def dm01():
    # todo:1-创建隐藏层输出结果
    # float(): 转换成浮点类型张量
    t1 = torch.randint(low=0, high=10, size=(1, 4)).float()
    print('t1->', t1)
    # todo:2-进行下一层加权求和计算
    linear1 = nn.Linear(in_features=4, out_features=4)
    l1 = linear1(t1)
    print('l1->', l1)
    # todo:3-进行激活值计算
    output = torch.sigmoid(l1)
    print('output->', output)
    # todo:4-对激活值进行dropout处理  训练阶段
    # p: 失活概率
    dropout = nn.Dropout(p=0.4)
    d1 = dropout(output)
    print('d1->', d1)


if __name__ == '__main__':
    dm01()

1.3 批量归一正则化(Batch Normalization)

计算每个batch样本的均值和标准差, 利用均值和标准差计算出标准化的值
每个batch的均值和标准差都不一样, 会引入噪声样本数据, 降低训练模型效果(防止过拟合)
引入两个自学习的γ和β参数, 让每层的样本分布不一样(每层的激活函数可以不一样)
加速模型训练效果, 数据分布越均匀, 加权求和结果落入到合理区间(导数最大)

训练时进行标准化, 测试时不进行标准化

"""
正则化: 每批样本的均值和方差不一样, 引入噪声样本
加快模型收敛: 样本标准化后, 落入激活函数的合理区间, 导数尽可能最大
"""
import torch
import torch.nn as nn


# nn.BatchNorm1d(): 处理一维样本, 每批样本数最少是2个, 否则无法计算均值和标准差
# nn.BatchNorm2d(): 处理二维样本, 图像(每个通道由二维矩阵组成), 计算二维矩阵每列均值和标准差
# nn.BatchNorm3d(): 处理三维样本, 视频
# 处理二维数据
def dm01():
    # todo:1-创建图像样本数据集 2个通道,每个通道3*4列特征图, 卷积层处理的特征图样本
    # 数据集只有一张图像, 图像是由2个通道组成, 每个通道由3*4像素矩阵
    input_2d = torch.randn(size=(1, 2, 3, 4))
    print('input_2d->', input_2d)
    # todo:2-创建BN层, 标准化 ->一定是在激活函数前进行标准化
    # num_features: 输入样本的通道数
    # eps: 小常数, 避免除0
    # momentum: 指数移动加权平均值
    # affine: 默认True, 引入可学习的γ和β参数
    bn2d = nn.BatchNorm2d(num_features=2, eps=1e-5, momentum=0.1, affine=True)
    ouput_2d = bn2d(input_2d)
    print('ouput_2d->', ouput_2d)

# 处理一维数据
def dm02():
    # 创建样本数据集
    input_1d = torch.randn(size=(2, 2))
    # 创建线性层
    linear1 = nn.Linear(in_features=2, out_features=4)
    l1 = linear1(input_1d)
    print('l1->', l1)
    # 创建BN层
    bn1d = nn.BatchNorm1d(num_features=4)
    # 对线性层的结果进行标准化处理
    output_1d = bn1d(l1)
    print('output_1d->', output_1d)



if __name__ == '__main__':
    # dm01()
    dm02()

2 手机价格分类案例

2.1 案例需求

分类问题 0,1,2,3 四个类别
实现步骤
- 准备数据集 -> 数据集分割, 转换成张量数据集
- 构建神经网络模型 -> 继承nn.module
- 模型训练
- 模型评估

2.2 构建张量数据集

# 导入相关模块
import torch
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
import torch.nn as nn
from torchsummary import summary
import torch.optim as optim
from sklearn.model_selection import train_test_split
import numpy as np
import pandas as pd
import time


# todo:1-构建数据集
def create_dataset():
    print('===========================构建张量数据集对象===========================')
    # todo:1-1 加载csv文件数据集
    data = pd.read_csv('data/手机价格预测.csv')
    print('data.head()->', data.head())
    print('data.shape->', data.shape)
    # todo:1-2 获取x特征列数据集和y目标列数据集
    # iloc属性 下标取值
    x, y = data.iloc[:, :-1], data.iloc[:, -1]
    # 将特征列转换成浮点类型
    x = x.astype(np.float32)
    print('x->', x.head())
    print('y->', y.head())
    # todo:1-3 数据集分割 8:2
    x_train, x_valid, y_train, y_valid = train_test_split(x, y, train_size=0.8, random_state=88)
    # todo:1-4 数据集转换成张量数据集
    # x_train,y_train类型是df对象, df不能直接转换成张量对象
    # x_train.values():获取df对象的数据值, 得到numpy数组
    # torch.tensor(): numpy数组对象转换成张量对象
    train_dataset = TensorDataset(torch.tensor(data=x_train.values), torch.tensor(data=y_train.values))
    valid_dataset = TensorDataset(torch.tensor(data=x_valid.values), torch.tensor(data=y_valid.values))
    # todo:1-5 返回训练数据集, 测试数据集, 特征数, 类别数
    # shape->(行数, 列数) [1]->元组下标取值
    # np.unique()->去重 len()->去重后的长度 类别数
    print('x.shape[1]->', x.shape[1])
    print('len(np.unique(y)->', len(np.unique(y)))
    return train_dataset, valid_dataset, x.shape[1], len(np.unique(y))


if __name__ == '__main__':
    train_dataset, valid_dataset, input_dim, class_num = create_dataset()

2.3 构建分类神经网络模型

# todo:2-构建神经网络分类模型
class PhonePriceModel(nn.Module):
    print('===========================构建神经网络分类模型===========================')
    # todo:2-1 构建神经网络  __init__()
    def __init__(self, input_dim, output_dim):
        # 继承父类的构造方法
        super().__init__()
        # 第一层隐藏层
        self.linear1 = nn.Linear(in_features=input_dim, out_features=128)
        # 第二层隐藏层
        self.linear2 = nn.Linear(in_features=128, out_features=256)
        # 输出层
        self.output = nn.Linear(in_features=256, out_features=output_dim)
    # todo:2-2 前向传播方法 forward()
    def forward(self, x):
        # 第一层隐藏层计算
        x = torch.relu(input=self.linear1(x))
        # 第二层隐藏层计算
        x = torch.relu(input=self.linear2(x))
        # 输出层计算
        # 没有进行softmax激活计算, 后续创建损失函数时CrossEntropyLoss=softmax+损失计算
        output = self.output(x)
        return output
# todo:3-模型训练
# todo:4-模型评估

if __name__ == '__main__':
    # 创建张量数据集对象
    train_dataset, valid_dataset, input_dim, class_num = create_dataset()
    # 创建模型对象
    model = PhonePriceModel(input_dim=input_dim, output_dim=class_num)
    # 计算模型参数
    # input_size: 输入层样本形状
    summary(model, input_size=(16, input_dim))

2.4 模型训练

# todo:3-模型训练
def train(train_dataset, input_dim, class_num):
    print('===========================模型训练===========================')
    # todo:3-1 创建数据加载器 批量训练
    dataloader = DataLoader(dataset=train_dataset, batch_size=8, shuffle=True)
    # todo:3-2 创建神经网络分类模型对象, 初始化w和b
    model = PhonePriceModel(input_dim=input_dim, output_dim=class_num)
    print("======查看模型参数w和b======")
    for name, parameter in model.named_parameters():
        print(name, parameter)
    # todo:3-3 创建损失函数对象 多分类交叉熵损失=softmax+损失计算
    criterion = nn.CrossEntropyLoss()
    # todo:3-4 创建优化器对象 SGD
    optimizer = optim.SGD(params=model.parameters(), lr=1e-3)
    # todo:3-5 模型训练 min-batch 随机梯度下降
    # 训练轮数
    num_epoch = 50
    for epoch in range(num_epoch):
        # 定义变量统计每次训练的损失值, 训练batch数
        total_loss = 0.0
        batch_num = 0
        # 训练开始的时间
        start = time.time()
        # 批次训练
        for x, y in dataloader:
            # 切换模型模式
            model.train()
            # 模型预测 y预测值
            y_pred = model(x)
            # print('y_pred->', y_pred)
            # 计算损失值
            loss = criterion(y_pred, y)
            # print('loss->', loss)
            # 梯度清零
            optimizer.zero_grad()
            # 计算梯度
            loss.backward()
            # 更新参数 梯度下降法
            optimizer.step()
            # 统计每次训练的所有batch的平均损失值和和batch数
            # item(): 获取标量张量的数值
            total_loss += loss.item()
            batch_num += 1
        # 打印损失变换结果
        print('epoch: %4s loss: %.2f, time: %.2fs' % (epoch + 1, total_loss / batch_num, time.time() - start))
    # todo:3-6 模型保存, 将模型参数保存到字典, 再将字典保存到文件
    torch.save(model.state_dict(), 'model/phone.pth')


if __name__ == '__main__':
    # 创建张量数据集对象
    train_dataset, valid_dataset, input_dim, class_num = create_dataset()
    # 创建模型对象
    # model = PhonePriceModel(input_dim=input_dim, output_dim=class_num)
    # 计算模型参数
    # input_size: 输入层样本形状
    # summary(model, input_size=(16, input_dim))
    # 模型训练
    train(train_dataset=train_dataset, input_dim=input_dim, class_num=class_num)

2.5 模型评估

# todo:4-模型评估
def test(valid_dataset, input_dim, class_num):
    # todo:4-1 创建神经网络分类模型对象
    model = PhonePriceModel(input_dim=input_dim, output_dim=class_num)
    # todo:4-2 加载训练模型的参数字典
    model.load_state_dict(torch.load(f='model/phone.pth'))
    # todo:4-3 创建测试集数据加载器
    # shuffle: 不需要为True, 预测, 不是训练
    dataloader = DataLoader(dataset=valid_dataset, batch_size=8, shuffle=False)
    # todo:4-4 定义变量, 初始值为0, 统计预测正确的样本个数
    correct = 0
    # todo:4-5 按batch进行预测
    for x, y in dataloader:
        print('y->', y)
        # 切换模型模式为预测模式
        model.eval()
        # 模型预测 y预测值 -> 输出层的加权求和值
        output = model(x)
        print('output->', output)
        # 根据加权求和值得到类别, argmax() 获取最大值对应的下标就是类别 y->0,1,2,3
        # dim=1:一行一行处理, 一个样本一个样本
        y_pred = torch.argmax(input=output, dim=1)
        print('y_pred->', y_pred)
        # 统计预测正确的样本个数
        print(y_pred == y)
        # 对布尔值求和, True->1 False->0
        print((y_pred == y).sum())
        correct += (y_pred == y).sum()
        print('correct->', correct)
    # 计算预测精度 准确率
    print('Acc: %.5f' % (correct.item() / len(valid_dataset)))


if __name__ == '__main__':
    # 创建张量数据集对象
    train_dataset, valid_dataset, input_dim, class_num = create_dataset()
    # 创建模型对象
    # model = PhonePriceModel(input_dim=input_dim, output_dim=class_num)
    # 计算模型参数
    # input_size: 输入层样本形状
    # summary(model, input_size=(16, input_dim))
    # 模型训练
    # train(train_dataset=train_dataset, input_dim=input_dim, class_num=class_num)
    # 模型评估
    test(valid_dataset=valid_dataset, input_dim=input_dim, class_num=class_num)

2.6 网络性能优化

输入层数据进行标准化
神经网络层数增加, 神经元个数增加
梯度下降优化方法由SGD调整为Aam
学习率由1e-3调整为1e-4
正则化
增加训练轮数
...

3 图像基础知识

3.1 图像概念

计算机中图像分类表示
- 二值图像 1通道(1个二维矩阵) 像素值:0或1
- 灰度图像 1通道像素值:0-255
- 索引图像 1通道索引值->RGB二维矩阵行下标彩色图像像素值:0-255
- RGB真彩色图像(最常用) 3通道(3个二维矩阵) R G B三个二维矩阵像素值:0-255

3.2 图像加载

import numpy as np
import matplotlib.pyplot as plt
import torch


# 创建全黑和全白图片
def dm01():
    # 全黑图片
    # 创建3通道二维矩阵, 黑色 0像素点
    # H W C: 200, 200, 3
    # 高 宽 通道
    img1 = np.zeros(shape=(200, 200, 3))
    print('img1->', img1)
    print('img1.shape->', img1.shape)
    # 展示图像
    plt.imshow(img1)
    plt.show()

    # 全白图片
    # 放到全连接层就是 200*200*3=120000个特征值的一维向量
    img2 = torch.full(size=(200, 200, 3), fill_value=255)
    print('img2->', img2)
    print('img2.shape->', img2.shape)
    # 展示图像
    plt.imshow(img2)
    plt.show()


def dm02():
    # 加载图片
    img1 = plt.imread(fname='data/img.jpg')
    print('img1->', img1)
    print('img1.shape->', img1.shape)
    # 保存图像
    plt.imsave(fname='data/img1.png', arr=img1)
    # 展示图像
    plt.imshow(img1)
    plt.show()


if __name__ == '__main__':
    # dm01()
    dm02()

4 卷积神经网络(CNN)介绍

4.1 什么是CNN

包含卷积层,池化层以及全连接层的神经网络计算模型
组成
- 卷积层: 提取图像特征图
- 池化层: 降维, 减少特征图的特征值, 减少模型参数
- 全连接层: 进行预测, 只能接受二维数据集, 1个样本就是1维向量
  - 将池化层的特征图(1张图像)转换成一维 200*200*3->120000个特征值

4.2 CNN应用场景

图像分类
目标检测
面部解锁
自动驾驶
...

5 卷积层

作用: 提取特征图

5.1 卷积计算

卷积计算等同于线性层加权求和计算

通过带有权重的卷积核和图像的特征值进行点乘运算, 得到新特征图上的一个特征值
卷积核/滤波器 -> 带有权重参数的神经元
w1x1 + w2x2 + .... + b
- w1->卷积核一个权重参数
- x1->特征图的一个特征值(像素点)

5.2 Padding(填充)

在原图像特征图周围补充特征值(默认补0)
作用
- 使新特征图和原特征图形状保持一致
- 减少边缘特征值信息丢失问题
  - 未padding, 边缘特征值只参与一次计算, 经过padding后, 边缘特征值参与多次计算
实现方式
- 不进行padding处理: 新特征图比原图像特征图小
- same padding: 原图像特征图形状和新特征图形状一致
- full padding: 新特征图形状比原图像特征图大, 新增特征

5.3 Stride(步长)

stride指卷积核(神经元)在特征图上滑动的步伐默认1
作用:
- 减少计算量
- 减少特征, 新特征图特征值减少(降维)
一般默认1, 可以设置2或4
原图像特征图5*5, stride=1->新特征图3*3, stride=2->新特征图2*2

5.4 多通道卷积计算

RGB彩色图像是由3个通道组成 -> 3个二维矩阵, 每个矩阵分别代表R/G/B
卷积核通道数和原图像通道数一致
卷积计算 -> 对应通道二维矩阵进行卷积计算, 将每个通道卷积计算的结果加到一起, 得到新特征图的一个特征值
新特征图是1个二维矩阵, 不是3个二维矩阵

5.5 多卷积核卷积计算

有多少个卷积核就是有多少个神经元, 就会提取到多少个二维的特征图

5.6 特征图大小计算

N = (W-F+2P)/S + 1
N: 新特征图高或宽
W: 原特征图高或宽
F: 卷积核高或宽
P: padding值
S: stride值
N如果为小数, 向下取整, 内部封装floor函数

5.7 卷积层API使用

import torch
import torch.nn as nn
import matplotlib.pyplot as plt

"""
in_channels:原图像的通道数,RGB彩色图像是3
out_channels:卷积核/神经元个数 输出的新图像是由n个通道的二维矩阵组成
kernel_size:卷积核形状 (3,3) (3,5)
stride:步长 默认为1
padding:填充圈数 默认为0  1  same->stride=1  2,3...
nn.Conv2d(in_channels=,out_channels=,kernel_size=,stride=,padding=)
"""


def dm01():
    # todo:1-加载RGB彩色图像 (H,W,C)
    img = plt.imread(fname='data/img.jpg')
    print('img->', img)
    print('img.shape->', img.shape)
    # todo:2-将图像的形状(H,W,C)转换成(C,H,W)  permute()方法
    img2 = torch.tensor(data=img, dtype=torch.float32).permute(dims=(2, 0, 1))
    print('img2->', img2)
    print('img2.shape->', img2.shape)
    # todo:3-将这张图像保存到数据集中 (batch_size,C,H,W)  unsqueeze()方法
    # 数据集只有一个样本
    img3 = img2.unsqueeze(dim=0)
    print('img3->', img3)
    print('img3.shape->', img3.shape)
    # todo:4-创建卷积层对象, 提取特征图
    conv = nn.Conv2d(in_channels=3,
                     out_channels=4,
                     kernel_size=(3, 3),
                     stride=2,
                     padding=0)
    conv_img = conv(img3)
    print('conv_img->', conv_img)
    print('conv_img.shape->', conv_img.shape)

    # 查看提取到的4个特征图
    # 获取数据集中第一张图像
    img4 = conv_img[0]
    # 转换形状 (H,W,C)
    img5 = img4.permute(1, 2, 0)
    print('img5->', img5)
    print('img5.shape->', img5.shape)
    # img5->(H,W,C)
    # img5[:, :, 0]->第1个通道的二维矩阵特征图 第一个特征图
    feature1 = img5[:, :, 0].detach().numpy()
    plt.imshow(feature1)
    plt.show()


if __name__ == '__main__':
    dm01()

6 池化层

池化层没有神经元参与, 只是实现降维, 不进行特征提取

6.1 池化计算

卷积层提取到的特征图进行降维操作
最大池化 -> 二维矩阵中最大的特征作为输出特征
平均池化 -> 二维矩阵中平均特征值作为输出特征

6.2 多通道池化计算

池化只在高和宽维度计算, 通道维度不参与池化
卷积层提取到的特征图像有多少通道, 经过池化后还是多少通道

6.3 池化层API使用

import torch
import torch.nn as nn
"""
最大池化
kernel_size:窗口形状大小, 不是神经元形状大小, 池化层没有神经元参与
nn.MaxPool2d(kernel_size=, stride=, padding=)
平均池化
nn.AVGPool2d(kernel_size=, stride=, padding=)
"""

# 单通道卷积层特征图池化
def dm01():
    # 创建1通道的3*3二维矩阵, 一张特征图
    inputs = torch.tensor([[[0, 1, 2], [3, 4, 5], [6, 7, 8]]], dtype=torch.float)
    print('inputs->', inputs)
    print('inputs.shape->', inputs.shape)
    # 创建池化层
    # kernel_size: 窗口的形状大小
    pool1 = nn.MaxPool2d(kernel_size=(2, 2), stride=1, padding=0)
    outputs = pool1(inputs)
    print('outputs->', outputs)
    print('outputs.shape->', outputs.shape)
    pool2 = nn.AvgPool2d(kernel_size=(2, 2), stride=1, padding=0)
    outputs = pool2(inputs)
    print('outputs->', outputs)
    print('outputs.shape->', outputs.shape)


# 多通道卷积层特征图池化
def dm02():
    # size(3,3,3)
    inputs = torch.tensor([[[0, 1, 2], [3, 4, 5], [6, 7, 8]],
                           [[10, 20, 30], [40, 50, 60], [70, 80, 90]],
                           [[11, 22, 33], [44, 55, 66], [77, 88, 99]]], dtype=torch.float)
    # 创建池化层
    # kernel_size: 窗口的形状大小
    pool1 = nn.MaxPool2d(kernel_size=(2, 2), stride=1, padding=0)
    outputs = pool1(inputs)
    print('outputs->', outputs)
    print('outputs.shape->', outputs.shape)
    pool2 = nn.AvgPool2d(kernel_size=(2, 2), stride=1, padding=0)
    outputs = pool2(inputs)
    print('outputs->', outputs)
    print('outputs.shape->', outputs.shape)


if __name__ == '__main__':
    # dm01()
    dm02()

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

深度学习中的正则化方法与卷积神经网络基础

笔记

1 正则化方法

1.1 什么是正则化

1.2 Dropout正则化

1.3 批量归一正则化(Batch Normalization)

2 手机价格分类案例

2.1 案例需求

2.2 构建张量数据集

2.3 构建分类神经网络模型

2.4 模型训练

2.5 模型评估

2.6 网络性能优化

3 图像基础知识

3.1 图像概念

3.2 图像加载

4 卷积神经网络(CNN)介绍

4.1 什么是CNN

4.2 CNN应用场景

5 卷积层

5.1 卷积计算

5.2 Padding(填充)

5.3 Stride(步长)

5.4 多通道卷积计算

5.5 多卷积核卷积计算

5.6 特征图大小计算

5.7 卷积层API使用

6 池化层

6.1 池化计算

6.2 多通道池化计算

6.3 池化层API使用

你可能感兴趣的:(深度学习,python,深度学习,机器学习,人工智能,pytorch,cnn,神经网络)