十二__十一

论文阅读及代码运行--Free-Form Image Inpainting with Gated Convolution

1、前言

从传统的图像修复方法，如经典算法PatchMach，到基于CNN的图像修复方法，修复的结果越来越更加真实和合理，如GL。但是图像修复本身就是一个高度病态的问题，有太多的主观性。之前修复的方法，更多的是解决规则的中心缺失图像修复，而针对不规则图像的缺失解决办法较少，即使是CA模型也是规则缺失图像的修复。
于是NVIDIA首次提出了使用部分卷积PartialConv来修复不规则孔缺失的图像，其修复的结果不错。但是还是存在问题。

文献：

CA 2018 CVPR Generative Image Inpainting with Contextual Attention.
PartialConv 2018 ECCV Image Inpainting for Irregular Holes Using Partial Convolutions.
GL 2017 TOG Globally and locally consistent image completion.
GatedConv 2019 ICCV Free-Form Image Inpainting with Gated Convolution

github:

GatedConv:code

2、GatedConv 论文阅读

2.1、摘要

我们提出了一个生成图像修复系统，用以完成具有自由形态掩码遮挡以及用户指导的图像。所提出的门控卷积解决了普通卷积将所有的像素视为有效像素的问题，通过为所有层中的每个空间位置的每个通道提供一个可学习的动态特征选择机制来泛化部分卷积。此外，提出了SN-PatchGAN，谱规范化（spectral-normalized）用于稳定训练，加速训练速度，并且解决了全局和局部判别器不适用于自由形状的掩码问题。

2.2、引言

图像修复（图像补全或图像空洞填充）是在缺失区域综合替代图像内容，使修改在视觉和语义上的都是一项正确的任务。可以用于移除分散注意力的物体或修改照片中不需要的区域。还可以扩展到图像/视频不剪切（un-cropping)、旋转、拼接、重新定位（re-targeting）、重新组合（re-compression）、超分辨率、协调（harmonization ）和许多其它任务。
在计算机视觉中，存在两种广泛的图像修复方法：1）使用低阶图像特征的块（patch）匹配，2）使用卷积神经网络的前馈生成模型。
第一种方法可以合成看似合理的平稳纹理（stationary textures），但在非平稳的情况下，如复杂的场景、人脸和物体，往往会出现严重的问题。第二种方法可以从大规模数据集中学习到的语义，以端到端的方式合成非平稳图像中的内容。
然后，基于普通卷积的深度生成模型在图像填充上是自然的高度病态的，因为空间卷积过滤器视所有的输入像素和特征一样有效。对于图像填充来说，每一层的输入是由空洞外的有效像素/特征和掩码区域的无效像素组成的。普通卷积使用了相同的过滤器，适用于所有有效、无效和混合（列如，那些空洞边界）的像素/特征，在自由形状上的掩码做测试时，导致视觉的伪影（如颜色差异，模糊和孔周围明显的边缘响应）。
为了解决这一局限性，部分卷积（PartialConv），其中卷积被掩蔽归一化，仅以有效像素为条件。基于规则的掩码更新策略，用于更新下一层的有效位置。部分卷积将所有位置视为无效或有效，并用0或1掩码乘以所有层的输入，该掩码可以看做是一个单一的不可学习的特征门通道。
然而，这种假设是有个几个局限性：

考虑跨网络不同层的输入空间位置，他们可能包括：
1）输入图像的有效像素，
2）输入图像的掩蔽像素，
3）感受野的神经元没有覆盖到输入图像的有效像素，
4）感受野的神经元覆盖了不同数量的输入图像的有效像素（这些有效的图像像素也可能有不同的相对位置），
5）深层合成的像素。
启发式的将所有的位置归类为无效或有效，会忽略这些重要信息。
如果我们拓展到用户指导的图像修复，用户在掩码内提供的稀疏的草图（sparse sketch），这些像素位置应该被视为有效的还是无效的？如何正确地更新下一层的掩码？
对于部分卷积，无效的像素将逐层逐渐消失，基于规则的掩码将在深层全部消失。然而，为了合成孔内的像素，这些深层可能还需要知道当前位置是在孔内还是孔外？全一掩码的部分卷积不能提供这样的信息。

作者提出了一种适用于自由形状图像修复的门控卷积算法，它学习每个通道和每个空间位置的动态特征门控机制（例如，内部和外部掩码，rgb通道或用户指导通道）。

2.3、相关工作

相关工作主要介绍了三个方面的知识，分别为：

自动图像修复：
1）传统的方法：搜索最相似的块（patch）来填充缺失区域，但是没有考虑全局语义，只能适用于平稳的纹理。此外，还有使用统计的方法来提高修复的结果，但是搜索过程的代价很高。
2）基于CNN的图像修复方法的一个显著优点是能够学习不同语义的自适应图像特征，能够合成更合理的语义内容。CA模型为了捕获远程空间依赖，提出了上下文注意模块，能够从远程空间位置借用信息。但是该方法主要针对大的矩形掩码，在自由形状的掩码很难推广。于是，NVIDIA提出了部分卷积来修复不规则缺失的图像。
有指导的图像修复和合成
特征级门控

2.4、方法

2.4.1、门控卷积

普通卷积：
在普通卷积层，应用相同的过滤器来生成输出。对于图像分类和目标检测是有意义的，在这些任务中，输入图像的所有像素都是有效的，以滑动窗口的方式提取局部特征。但是对于图像修复来说，训练过程中会导致模糊，并导致视觉上的伪影。
$O_{y, x}=\sum_{i=-k_{h}^{\prime}}^{k_{h}^{\prime}} \sum_{j=-k_{w}^{\prime}}^{k_{w}^{\prime}} W_{k_{h}^{\prime}+i, k_{w}^{\prime}+j} \cdot I_{y+i, x+j}$

部分卷积：
采用了掩蔽和重新归一化的步骤，使卷积仅依赖于有效的像素。本质上，部分卷积可以看作是不可学习的单通道特征的硬门控。

$O_{y, x}=\left\{\begin{array}{ll}{\sum\sum W \cdot\left(I \odot \frac{M}{\operatorname{sum}(M)}\right),} & {\text { if } \operatorname{sum}(\mathrm{M})>0} \\ {0,} & {\text { otherwise }}\end{array}\right.$

门控卷积：
不同于部分卷积的硬门控掩码更新策略，门控卷积是从数据中自动学习软掩码。
$\begin{aligned} \text {Gating}_{y, x} &=\sum \sum W_{g} \cdot I \\ \text {Feature}_{y, x} &=\sum \sum W_{f} \cdot I \\ O_{y, x} &=\phi\left(\text {Feature}_{y, x}\right) \odot \sigma\left(\text {Gating}_{y, x}\right) \end{aligned}$

左：部分卷积，右：门控卷积

提出的门控卷积学习每个通道和每个空间位置的动态特征选择机制。有趣的是，通过对中间门控值的可视化可以看出，它不仅可以根据背景、掩模、草图来选择特征，还可以在某些通道中考虑语义分割。即使在较深的层中，门控卷积也可以学习在不同的通道中突出掩蔽区域和草图信息，从而更好地生成修复结果。

GatedConv整体架构

2.4.2、SN-PatchGAN

如上图所示，SN-PatchGAN使用了6个步长卷积（k=5, s=2）以捕获Markovian块的特征统计信息。值得注意的是，在我们的训练设置中，输出图中每个神经元的感受野可以覆盖整个输入图像，因此不需要全局鉴别器。
损失函数
1）铰链损失
$\mathcal{L}_{G}=-\mathbb{E}_{z \sim \mathbb{P}_{z}}(z)\left[D^{s n}(G(z))\right]$
$\mathcal{L}_{D^{s n}}=\mathbb{E}_{x \sim \mathbb{P}_{\text {data}}(x)}\left[\operatorname{Re} L U\left(\mathbb{1}-D^{s n}(x)\right)\right]+\mathbb{E}_{z \sim \mathbb{P}_{z}(z)}\left[\operatorname{Re} L U\left(\mathbb{1}+D^{s n}(G(z))\right)\right]$

由于类似的块级信息已经在PatchGAN中进行了编码，因此不使用感知损失。不同于PartialConv的6个损失函数，GatedConv使用了 $\ell_{1}$ 重构损失以及SN-PatchGAN损失，舍弃了复杂的多超参数，该超参数的比列为1:1。

2.4.3、整体架构

笔者注：GatedConv采用了和CA模型类似的粗细两级网络，粗网络先修复一个粗略的结果，细网络再更加精准的修复，将一个修复任务分成两个任务，而不是一次性修复。GatedConv未中ICCV之前，细网络是单分支的，后来作者修改成了两路分支。虽然这样改善了修复结果，但是两阶段修复存在一个问题，需要消耗大量的计算资源，于是PEPSI（2019 CVPR）提出了并行的编解码结构来解决这个问题。

GatedConv采用的编解码结构，而不是使用PartialConv的U-Net，作者发现U-Net中使用跳跃连接对于非窄掩码（non-narrow mask）没有显著影响。这主要是因为对于掩码区域的中心，这些跳跃连接的输入几乎为零，因此无法将详细的颜色或纹理信息传播到该区域的解码器。对于空洞边界，我们采用门控卷积的编码器和解码器结构足以产生无缝结果。
将所有的普通卷积替换成门控卷积，一个潜在的问题是引入了额外的参数。为了保持和baseline模型相同的效率，作者将模型缩减了25%，在定量和定性上没有明显的性能下降。

2.4.4、自由形状的掩码生成

自动生成自由形状掩码的算法非常重要。采样的掩模本质上应该是
(1)与真实用例中绘制的掩模相似，(2)多样性以避免过拟合，(3)计算和存储效率，(4)可控性和灵活性。
ParialConv是从两个连续视频帧之间的遮挡估计方法中收集一组固定的不规则mask，虽然增加了随机扩张、旋转、裁剪来增加多样性，但是该方法仍然不满足上述其他要求。
笔者这里贴上作者之前的mask生成算法，如下所示：

Mask生成算法

3、实验

环境：
作者开源了GatedConv的源代码，目前可以运行的环境是tensorflow 1.3.0,1.4.0,1.5.0,1.6.0,1.7.0，笔者在1.2.0上运行的，在1.12以及1.14上没有运行成功。
作者提供了一个工具包，封装了一些常用的函数，运行之前得安装该包。

pip install git+https://github.com/JiahuiYu/neuralgym

train:
1）准备数据集，制作成文件列表，这里有人给了一个方法issues，修改一下文件夹，就可以了。笔者这里自己写了一个制作文件列表的方法。
2）修改inpaint.yml文件，根据自己的需要修改Data_flist，log_dir，image_shape。
3）然后就是python train.py

笔者在服务器上跑了一下该实验，2块2080ti，迭代了218k次，运行了59个小时，只在celeba-hq数据集上train了。感觉时间应该浪费在生成mask上了。

训练结果：

笔者这里没有做test，没有定量分析，后面我会完善这个实验。。。

4、总结

从修复的结果可观，主观评价整体还是不错的，但是仍然存在某些修复结果存在伪影，如下图所示，修复的内容看似合理，但是已经和groundtruth不一样了。加入内容推理和风格转换等，应该可以改善结果。

由于作者水平有限，文中若有不正确的地方，欢迎大家指出，若有任何问题，请在下方讨论。

你可能感兴趣的:(神经网络,图像修复)

机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
基于AlexNet架构的卷积神经网络模型用于对胸部X光图像进行二分类（例如，诊断肺炎）
1.肺炎正常的胸部X线片描绘了清晰的肺部，图像中没有任何异常混浊的区域。正常的胸部X线片1.1细菌性肺炎临床表现细菌性肺炎通常由细菌引起，如肺炎链球菌、流感嗜血杆菌、肺炎克雷伯菌等。患者可能出现高热、寒战、咳嗽、咳痰（痰液可能呈脓性）、胸痛、呼吸困难等症状。影像学特征局灶性肺叶实变细菌性肺炎在影像学上常表现为肺叶或肺段的局灶性实变，即某一区域的肺组织因炎症而失去气体交换功能，呈现为高密度影。胸腔积
视觉Transformer还有哪些点可以研究？怎么应用？计算机视觉工坊 3D视觉从入门到精通学习算法开源
0.这篇文章干了啥？今天笔者为大家推荐一篇最新的综述，详细总结了Transformer的网络架构、优化策略、发展方向，还会定期更新Github，研究注意力机制的小伙伴一定不要错过。注意机制有助于人类视觉系统有效地分析和理解复杂场景，它能够聚焦于图像的关键区域，同时忽略无关紧要的部分。受此概念启发，注意机制已经被引入到计算机视觉（CV）中，以动态地为图像中的不同区域分配权重。这使得神经网络能够专注于
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
Python_day54Inception网络及其思考且慢.589 Python_60 python 开发语言
一、inception网络介绍今天我们介绍inception，也就是GoogleNet传统计算机视觉的发展史从上面的链接，可以看到其实inceptionnet是在resnet之前的，那为什么我今天才说呢？因为他要引出我们后面的特征融合和特征并行处理这些思想。Inception网络，也被称为GoogLeNet，是Google团队在2014年提出的经典卷积神经网络架构。它的核心设计理念是“并行的多尺度
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
YOLOv5激活函数替换与模型变体实验实战教程机＿长 YOLO极致优化实战 YOLO 深度学习算法
YOLOv5激活函数替换与模型变体实验实战教程本教程面向已具备YOLOv5训练经验的开发者，系统讲解如何在YOLOv5中替换激活函数、构建模型变体，并结合本项目实际文件和命令，突出实用性和可操作性。内容涵盖激活函数原理、替换方法、配置文件讲解、训练实操、源码解读、实验对比与常见问题排查。完整代码见文末1.激活函数原理简介激活函数是深度神经网络中非线性建模的关键组件。常见激活函数包括：ReLU：简单
基于白鲸算法优化的混合核极限学习机(HKELM)的回归预测智能算法研学社（Jack旭） #混合核极限学习机HKELM 智能优化算法应用算法回归
基于白鲸算法优化的混合核极限学习机(HKELM)的回归预测文章目录基于白鲸算法优化的混合核极限学习机(HKELM)的回归预测1.HKELM原理2.预测问题求解3.基于白鲸算法优化的HKELM4.实验结果5.Matlab代码1.HKELM原理核极限学习机（KELM）是一种单隐含层前馈神经网络，通过引入核函数改善极限学习机（ELM）性能，其输出可表示为：f(x)=h(x)HU(ZC+HHU)−1U=[
基于食肉植物算法优化的混合核极限学习机(HKELM)的回归预测智能算法研学社（Jack旭） #混合核极限学习机HKELM 智能优化算法应用算法回归数据挖掘
基于食肉植物算法优化的混合核极限学习机(HKELM)的回归预测文章目录基于食肉植物算法优化的混合核极限学习机(HKELM)的回归预测1.HKELM原理2.预测问题求解3.基于食肉植物算法优化的HKELM4.实验结果5.Matlab代码1.HKELM原理核极限学习机（KELM）是一种单隐含层前馈神经网络，通过引入核函数改善极限学习机（ELM）性能，其输出可表示为：f(x)=h(x)HU(ZC+HHU
基于蛇优化算法优化的混合核极限学习机(HKELM)的回归预测
基于蛇优化算法优化的混合核极限学习机(HKELM)的回归预测文章目录基于蛇优化算法优化的混合核极限学习机(HKELM)的回归预测1.HKELM原理2.预测问题求解3.基于蛇优化算法优化的HKELM4.实验结果5.Matlab代码1.HKELM原理核极限学习机（KELM）是一种单隐含层前馈神经网络，通过引入核函数改善极限学习机（ELM）性能，其输出可表示为：f(x)=h(x)HU(ZC+HHU)−1
MATLAB实现基于GA-CNN-BiLSTM-Attention遗传算法（GA）优化卷积双向长短期记忆神经网络融合注意力机制进行多变量时序预测的详细项目实例（含模型描述及示例代码） nantangyuxi MATLAB 含模型描述及示例代码神经网络 matlab cnn 支持向量机人工智能大数据深度学习
目录MATLAB实现基于GA-CNN-BiLSTM-Attention遗传算法（GA）优化卷积双向长短期记忆神经网络融合注意力机制进行多变量时序预测的详细项目实例...2项目背景介绍...2项目目标与意义...31.提高多变量时序预测的准确性...32.弥补传统方法的局限性...33.提高模型训练效率...3
神经网络和机器学习的一些基本概念荼渔机器学习神经网络
记录一些基本概念，不涉及公式推导，因为数学不好，记了也没啥用，但是知道一些基本术语以及其中的关系，对神经网络训练有很大帮助。可能有些概念不会讲得很详细，但是当你有了这个概念，你就知道往这个方向去获取更详细的信息，不至于连往哪走都不知道。下面以多元线性回归模型为例1.模型模型训练过程就是利用已知的x和y,求解b的过程，b也称为权重。虽然没有那么简单，但是训练完成的模型本质上就是一组权重值，如[b1,
多维时序 | Matlab实现GA-LSTM-Attention遗传算法优化长短期记忆神经网络融合注意力机制多变量时间序列预测天天Matlab代码科研顾问预测模型神经网络 matlab lstm
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍风力发电是一种清洁能源，越来越受到人们的关注和重视。然而，由于风力发电的不稳定性和不可控性，风电预测成为了一个至关重要的问题。为了更精准地预测风电发电量，许多研究者开始尝试利
GWO-CNN-BiLSTM-Attention多变量多步时间序列预测 | Matlab实现灰狼算法优化卷积双向长短期记忆融合注意力机制
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍摘要:时间序列预测在各个领域具有广泛的应用，而多变量多步时间序列预测由于其复杂性和挑战性，一直是研究热点。本文提出了一种基于灰狼算法(GreyWolfOptimizer,GWO)优化的卷积神经网络(Conv
14、基于无人机与CNN技术的森林研究：原木识别与冠层空隙分析 Sunny 计算科学前沿：ICCSA 2021精选无人机 CNN 原木识别
基于无人机与CNN技术的森林研究：原木识别与冠层空隙分析基于CNN的原木识别研究近年来，基于单根原木追踪圆木的方法备受关注。此前的研究提出了一种基于原木端面图像的物理自由方法，借鉴了指纹和虹膜识别的技术，在使用真实分割数据时取得了不错的效果。但在实际应用中，需要一个完全自动化的系统。为了填补这一空白，研究采用了基于卷积神经网络（CNN）的分割方法与原木识别方法相结合的方式，并与传统原木识别方法在自
讨论神经网络中的卷积与数学中的卷积有何不同陶大明
1.当提到神经网络中的卷积时，我们通常是指由多个并行卷积组成的运算。（因为单个核只能特区一种类型的特征，我们usually希望可以在多个位置提取多个特征）2.输入也不仅仅是实值的网格，而是由一系列观测数据的向量构成的网格。我们有的时候会希望跳出核中的一些位置来降低计算的开销（相应的代价是提取特征没有先前那么好了）我们就把这个过程看作对全卷积函数输出的下采样(downsampling).如果只是在输
AI人工智能加持，人脸识别精准度飙升 AI大模型应用工坊人工智能 ai
AI人工智能加持，人脸识别精准度飙升：从模糊到清晰的技术革命关键词人脸识别、深度学习、神经网络、精准度优化、计算机视觉、特征提取、面部识别算法摘要想象一下，在一个拥挤的火车站，系统能在瞬间从数千人中准确识别出需要关注的个体；或者你的手机仅通过一瞥就能认出你，甚至在你戴着口罩时也能做到。这不是科幻电影的场景，而是当下AI驱动的人脸识别技术的真实能力。本文将深入探讨人工智能如何彻底改变人脸识别领域，从
【无人机】基于强化学习的多无人机移动边缘计算与路径规划研究Matlab代码 Matlab科研工作室无人机边缘计算 matlab
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理
双塔模型（Two-Tower Model）推荐系统实践
双塔模型双塔模型（Two-TowerModel）是一种常用的推荐系统或搜索排序模型架构，由两个独立的神经网络（即“双塔”）组成，分别处理用户和物品的特征，最后通过相似度计算（如点积、余弦相似度）得到匹配分数。Rust因其高性能和安全性，适合实现此类模型。双塔模型的定义双塔模型（Dual-TowerModel）是一种深度学习架构，由两个独立的神经网络塔（Tower）组成，分别处理不同的输入数据，最后
零基础-动手学深度学习-6.5 汇聚层（pooling）池化层
通常当我们处理图像时，我们希望逐渐降低隐藏表示的空间分辨率、聚集信息，这样随着我们在神经网络中层叠的上升，每个神经元对其敏感的感受野（输入）就越大。WHY？因为我们的机器学习任务通常会跟全局图像的问题有关（例如，“图像是否包含一只猫呢？”），所以我们最后一层的神经元应该对整个输入的全局敏感！此外，当检测较底层的特征时（例如6.2节中所讨论的边缘），我们通常希望这些特征保持某种程度上的平移不变性。例
零基础-动手学深度学习-6.6 卷积神经网络（LeNet）生医转码，四海为家深度学习 cnn 人工智能
通过之前几节，我们学习了构建一个完整卷积神经网络的所需组件。回想一下现在我们已经掌握了卷积层的处理方法，我们可以在图像中保留空间结构。同时，用卷积层代替全连接层的另一个好处是：模型更简洁、所需的参数更少。本节将介绍LeNet,它是最早发布的卷积神经网络之一，于80年代发明的为了识别手写数字，LeCun发表了第一篇通过反向传播成功训练卷积神经网络的研究！6.6.1.LeNet我这里改了一下28-32
人工智能自然语言处理：Transformer 模型详解大力出奇迹985 人工智能自然语言处理 transformer
一、Transformer模型的诞生背景在自然语言处理的漫长征程中，早期的传统模型，如循环神经网络（RNN）及其变体长短时记忆网络（LSTM），曾占据主导地位。RNN试图通过依次处理序列中的每个元素，来捕捉上下文信息。但它存在一个致命弱点，在处理长序列时，会面临梯度消失或梯度爆炸的问题，就像一个长途跋涉的旅人，随着路程的增加，逐渐忘记了出发时的目标和重要信息。LSTM虽然在一定程度上缓解了这个问题
【创新无忧】蚁狮算法ALO优化广义神经网络GRNN数据回归预测【含Matlab源码 10433期】 Matlab武动乾坤 matlab
Matlab武动乾坤博客之家博主简介：985研究生，Matlab领域科研开发者；座右铭：行百里者，半于九十。代码获取方式：CSDNMatlab武动乾坤—代码获取方式更多Matlab智能算法优化神经网络分类预测仿真内容点击①付费专栏智能算法优化神经网络分类预测⛳️关注CSDNMatlab武动乾坤，更多资源等你来！！⛄一、智能优化算法优化广义神经网络GRNN数据回归预测1智能优化算法优化广义回归神经网
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他