GAN与WGAN

文章目录

- - GAN
  - - 判别网络
    - 生成网络
    - 训练
  - GAN存在的问题
  - - 训练稳定性
    - 模型坍塌
  - 改进方法：WGAN
  - - $\text{Wasserstein}$ 距离
    - 评价网络
    - 生成网络
  - 开源代码

GAN

生成对抗网络(GAN, Generative Adversarial Networks)是2014年由Goodfellow提出的模型。在GAN中，有两个网络进行对抗训练，一个是判别网络，目标是判断一个样本是真实数据还是由生成网络生成的数据，一个是生成网络，目标是生成判别网络无法区分的样本。这两个网络交替训练，到最后如果判别网络再也无法区分样本的来源，那么也就等价于生成网络可以生成符合数据真实分布的样本。

判别网络

判别网络 $D(\mathbf{x};\phi)$ 是一个二分类的分类器，目标是区分一个样本 $\mathbf{x}$ 是来自于真实分布 $p_r(\mathbf{x})$ 还是模型生成分布 $p_{\theta}(\mathbf{x})$ 。用标签 $y = 1$ 表示样本来自真实分布，标签 $y = 0$ 表示样本来自模型生成分布，判别网络的输出是 $\mathbf{x}$ 属于真实分布的概率。
$\begin{aligned} p(y=1|\mathbf{x})&=D(\mathbf{x};\phi)\\ p(y=0|\mathbf{x})&=1-D(\mathbf{x};\phi) \end{aligned}\tag{1}$
那么判别网络的目标函数就是最小化交叉熵
$\min_\phi-(\mathbb{E}_{\mathbf{x}}\left[y\log p(y=1|\mathbf{x})+(1-y)p(y=0|\mathbf{x})\right])\tag{2}$
若分布 $p(\mathbf{x})$ 由 $p_r(\mathbf{x})$ 和 $p_{\theta}(\mathbf{x})$ 等比例混合而成，即 $p(\mathbf{x})=\frac{1}{2}(p_r(\mathbf{x})+p_{\theta}(\mathbf{x}))$ ，则上式等价于
$\begin{aligned} &\max_\phi\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log D(\mathbf{x};\phi)]+\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}[\log(1-D(\mathbf{x};\phi))\right]\\ =&\max_\phi\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log D(\mathbf{x};\phi)]+\mathbb{E}_{\mathbf{z}\sim p(\mathbf{z})}[\log(1-D(G(\mathbf{z};\theta);\phi))\right] \end{aligned}\tag{3}$
$G(\mathbf{z};\theta)$ 是生成网络， $\mathbf{z}$ 是一个低维向量， $p(\mathbf{z})$ 是它服从的分布，通常是标准正态分布

生成网络

生成网络的目标是生成判别网络无法区分的样本，即让判别网络将自己生成的样本判别为真实样本
$\begin{aligned} &\max_\theta\mathbb{E}_{\mathbf{z}\sim p(\mathbf{z})}\left[\log(D(G(\mathbf{z};\theta);\phi))\right]\\ =&\min_\theta\mathbb{E}_{\mathbf{z}\sim p(\mathbf{z})}\left[\log(1-D(G(\mathbf{z};\theta);\phi))\right] \end{aligned}\tag{4}$
这两个目标函数是等价的，但一般使用前者

训练

GAN的两个网络的优化目标相反，因此很难训练，需要平衡两个网络的能力。判别网络不能太强，否则生成网络会出现梯度消失，也不能太弱，否则生成网络无法提升能力。通常每次迭代时，判别网络更新 $K$ 次，生成网络更新一次， $K$ 是一个超参数。

GAN存在的问题

将判别网络和生成网络合并为一个整体，这个模型仅用来分析，通常实际中不会使用
$\begin{aligned} &\min_{\theta}\max_{\phi}(\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log D(\mathbf{x};\phi)]+\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}[\log(1-D(\mathbf{x};\phi))\right])\\ =&\min_{\theta}\max_{\phi}(\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log D(\mathbf{x};\phi)]+\mathbb{E}_{\mathbf{z}\sim p(\mathbf{z})}[\log(1-D(G(\mathbf{z};\theta);\phi))\right]) \end{aligned}\tag{5}$
当 $p_r(\mathbf{x})$ 和 $p_{\theta}(\mathbf{x})$ 已知时，上式的积分项
$p_r(\mathbf{x})\log D(\mathbf{x};\phi)+p_{\theta}(\mathbf{x})\log(1-D(\mathbf{x};\phi))\tag{6}$
在
$D(\mathbf{x};\phi)=\frac{p_r(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}\tag{7}$
取得最大值，这也就是最优判别器，将其代入 $(5)$ 式得
$\begin{aligned} \mathcal{L}(G|D^{\star})&=\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log D^{\star}(\mathbf{x})]+\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}[\log(1-D^{\star}(\mathbf{x}))\right]\\ &=\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log \frac{p_r(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}\right]+\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[\log(\frac{p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})})\right]\\ &=\text{KL}(p_r,p_a)+\text{KL}(p_{\theta},p_a)-2\log2\\ &=2\text{JS}(p_r, p_{\theta})-2\log2 \end{aligned}\tag{8}$
其中 $\text{JS(.)}$ 为 $\text{JS}$ 散度， $p_a(\mathbf{x})=\frac{1}{2}(p_r(\mathbf{x})+p_{\theta}(\mathbf{x}))$ 为一个平均分布。

当判别网络最优时，生成网络的目标是最小化真实分布与生成分布之间的 $\text{JS}$ 散度。当两个分布相同时， $\text{JS}$ 散度为 $0$ ，最优生成器对应的损失为 $-2\log2$ 。

训练稳定性

当两个分布没有重叠时， $\text{JS}$ 散度等于常数 $\log2$
$\begin{aligned} 2\text{JS}(p_r, p_{\theta})&=\int p_r(\mathbf{x})\log\frac{2p_r(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}d\mathbf{x}+\int p_{\theta}(\mathbf{x})\log\frac{2p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}d\mathbf{x}\\ &=\int_{p_r(\mathbf{x})\neq0,p_{\theta}(\mathbf{x})=0} p_r(\mathbf{x})\log\frac{2p_r(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}d\mathbf{x}+\int_{p_{\theta}(\mathbf{x})\neq0,p_r(\mathbf{x})=0} p_{\theta}(\mathbf{x})\log\frac{2p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}d\mathbf{x}\\ &=\int_{p_r(\mathbf{x})\neq0,p_{\theta}(\mathbf{x})=0} p_r(\mathbf{x})\log2d\mathbf{x}+\int_{p_{\theta}(\mathbf{x})\neq0,p_r(\mathbf{x})=0} p_{\theta}(\mathbf{x})\log2d\mathbf{x}\\ &=2\log2 \end{aligned}\tag{9}$
对生成网络来说，目标函数关于参数的梯度为0，因此生成网络出现梯度消失。因此，在实际训练生成对抗网络时，一般不会将判别网络训练到最优，使得生成网络的梯度依然存在，但是判别网络也不能太差，否则生成网络的梯度为错误的梯度。但是如果在两者之间权衡并不容易，因此GAN训练稳定性较差。

模型坍塌

如果使用公式 $(3)$ 中的前者作为生成网络的目标函数，将最优判别器 $D^{\star}$ 代入，并结合公式 $(8)$ 可得
$\begin{aligned} \mathcal{L'}(G|D^{\star})&=\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[\log D^{\star}(\mathbf{x})\right]\\ &=\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[\log \frac{p_r(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}\cdot\frac{p_{\theta}(\mathbf{x})}{p_{\theta}(\mathbf{x})}\right]\\ &=-\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[\log\frac{p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})}\right]+\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[\log\frac{p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})+p_{\theta}(\mathbf{x})}\right]\\ &=-\text{KL}(p_{\theta},p_r)+2\text{JS}(p_r,p_{\theta})-2\log2-\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[\log D^{\star}(\mathbf{x})\right] \end{aligned}\tag{10}$
忽略后两项，可以写作
$\mathop{\arg\max}\limits_{\theta}\enspace\mathcal{L'}(G|D^{\star})=\mathop{\arg\min}\limits_{\theta}\enspace\text{KL}(p_{\theta},p_r)-2\text{JS}(p_r,p_{\theta})\tag{11}$
$\text{JS}$ 散度有界，因此生成网络的目标更多的是受 $\text{KL}(p_{\theta},p_r)$ 的影响。

前向和逆向 $\text{KL}$ 散度： $\text{KL}$ 散度非对称，在计算真实分布 $p_r$ 和模型生成分布 $p_{\theta}$ 之间的 $\text{KL}$ 散度时就会有两种：前向 $\text{KL}$ 散度 $\text{KL}(p_r,p_{\theta})$ 和逆向 $\text{KL}$ 散度 $\text{KL}(p_{\theta},p_r)$ ，分别定义为
$\text{KL}(p_r,p_{\theta})=\int p_r(\mathbf{x})\log\frac{p_r(\mathbf{x})}{p_{\theta}(\mathbf{x})}d\mathbf{x}\\ \text{KL}(p_{\theta},p_r)=\int p_{\theta}(\mathbf{x})\log\frac{p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})}d\mathbf{x}\\\tag{12}$
在前向 $\text{KL}$ 散度中，

当 $p_r(\mathbf{x})\to0$ 而 $p_{\theta}(\mathbf{x})>0$ 时， $p_r(\mathbf{x})\log\frac{p_r(\mathbf{x})}{p_{\theta}(\mathbf{x})}\to 0$ ，前向 $\text{KL}$ 散度变为0
当 $p_{\theta}(\mathbf{x})\to0$ 而 $p_r(\mathbf{x})>0$ 是， $p_r(\mathbf{x})\log\frac{p_r(\mathbf{x})}{p_{\theta}(\mathbf{x})}\to \infin$ ，前向 $\text{KL}$ 散度变得非常大

因此前向 $\text{KL}$ 散度会让 $p_{\theta}(\mathbf{x})$ 尽量覆盖 $p_r(\mathbf{x})$ ，生成的样本更具有多样性。

在逆向 $\text{KL}$ 散度中

当 $p_r(\mathbf{x})\to0$ 而 $p_{\theta}(\mathbf{x})>0$ 时， $p_{\theta}(\mathbf{x})\log\frac{p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})}\to\infin$ ，逆向 $\text{KL}$ 散度变得非常大
当 $p_{\theta}(\mathbf{x})\to0$ 而 $p_r(\mathbf{x})>0$ 时， $p_{\theta}(\mathbf{x})\log\frac{p_{\theta}(\mathbf{x})}{p_r(\mathbf{x})}\to 0$ ，逆向 $\text{KL}$ 散度变为0

因此逆向 $\text{KL}$ 散度会让 $p_{\theta}(\mathbf{x})$ 尽量避开 $p_r(\mathbf{x})\approx0$ 的点，即倾向于生成更安全的样本。

生成网络中使用的是逆向 $\text{KL}$ 散度，倾向于生成更安全的样本，也就是所谓的模型坍塌问题。

改进方法：WGAN

$\text{Wasserstein}$ 距离

WGAN通过 $\text{Wasserstein}$ 距离替代 $\text{JS}$ 散度。 $\text{Wasserstein}$ 距离也用于衡量两个分布之间的距离，对于两个分布 $q_1$ 和 $q_2$ ， $p^{th}$ - $\text{Wasserstein}$ 定义为
$W_p(q_1, q_2)=\left(\inf_{\gamma(x,y)\in\Gamma(q_1,q_2)}\mathbb{E}_{(x,y)\sim\gamma(x,y)}\left[d(x,y)^p\right]\right)^{\frac{1}{p}}\tag{13}$
$\Gamma(q_1,q_2)$ 为边缘分布为 $q_1$ 和 $q_2$ 的所有可能的联合分布集合， $d (x, y)$ 是 $x$ 和 $y$ 的距离，如 $\mathcal{l}_p$ 距离。当两个分布没有重叠或重叠非常少时， $\text{JS}$ 散度和 $\text{KL}$ 散度均不能再反映两个分布之间的距离，但 $\text{Wasserstein}$ 距离仍然可以。

对于真实分布 $p_r$ 和模型分布 $p_{\theta}$ ， $\text{1st}$ - $\text{Wasserstein}$ 距离定义为
$W_1(p_r,p_{\theta})=\inf_{\gamma(\mathbf{x},\mathbf{y})\in\Gamma(p_r,p_{\theta})}\mathbb{E}_{(\mathbf{x},\mathbf{y})\sim\gamma(\mathbf{x},\mathbf{y})}\left[\vert\vert \mathbf{x}-\mathbf{y}\vert\vert\right]\tag{14}$
显然这是很难计算的，但 $\text{1st}$ - $\text{Wasserstein}$ 距离有一个对偶形式
$W_1(p_r,p_{\theta})=\sup_{\vert\vert f\vert\vert_L\leq1}\left(\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[f(\mathbf{x})\right]-\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[f(\mathbf{x})\right]\right)\tag{15}$
其中 $f$ ： $\mathbb{R}^d\to\mathbb{R}$ 为 $1$ - $\text{Lipschitz}$ 连续函数，对任意 $\mathbf{x}\neq\mathbf{y}$ 满足
$\frac{\vert f(\mathbf{x})-f(\mathbf{y})\vert}{\vert\mathbf{x}-\mathbf{y} \vert}\leq1\tag{16}$
根据公式 $(15)$ ，两个分布 $p_r$ 和 $p_{\theta}$ 之间的 $\text{1st}$ - $\text{Wasserstein}$ 距离可以转换为一个满足 $1$ - $\text{Lipschitz}$ 连续的函数在分布 $p_r$ 和 $p_{\theta}$ 下期望差的上界，通常 $1$ - $\text{Lipschitz}$ 连续可以宽松为 $\text{K}$ - $\text{Lipschitz}$ 连续，则 $\text{1st}$ - $\text{Wasserstein}$ 距离为
$W_1(p_r,p_{\theta})=\frac{1}{K}\sup_{\vert\vert f\vert\vert_L\leq K}\left(\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[f(\mathbf{x})\right]-\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[f(\mathbf{x})\right]\right)\tag{17}$

评价网络

当然公式 $(17)$ 也不好算，根据神经网络的通用近似定理，可以假设存在一个神经网络可以达到这个上界，令 $f(\mathbf{x};\phi)$ 为一个神经网络，假设存在参数集合 $\Phi$ ，对所有 $\phi\in\Phi$ ， $f(\mathbf{x};\phi)$ 满足 $\text{K}$ - $\text{Lipschitz}$ 连续，那公式 $(17)$ 可以转换为
$\max_{\phi\in\Phi}\left(\mathbb{E}_{\mathbf{x}\sim p_r(\mathbf{x})}\left[f(\mathbf{x};\phi)\right]-\mathbb{E}_{\mathbf{x}\sim p_{\theta}(\mathbf{x})}\left[f(\mathbf{x};\phi)\right]\right)\tag{18}$
$f(\mathbf{x};\phi)$ 称为评价网络，评价网络的最后一层为线性层，其输出不再是GAN中判别网络的 $[0, 1]$ ，值域没有限制。那么只需要找到一个网络使公式 $(18)$ 的值尽可能大，即 $f(\mathbf{x};\phi)$ 对真实样本打分尽量高，对模型生成样本打分尽量低，

为使 $f(\mathbf{x};\phi)$ 满足 $\text{K}$ - $\text{Lipschitz}$ 连续，一种近似的方法是限制参数的取值范围，因为神经网络连续可导，满足 $\text{K}$ - $\text{Lipschitz}$ 连续可以近似为其关于 $\mathbf{x}$ 的偏导数的模 $\vert\vert\frac{\partial f(\mathbf{x};\phi)}{\partial \mathbf{x}}\vert\vert$ 小于某个上界，由于偏导数大小一般和参数的取值范围相关，可以通过限制 $\phi$ 的取值范围来近似，令 $\phi\in\left[-c,c\right]$ ， $c$ 是一个较小的正数。

生成网络

此时生成网络的目标就是使评价网络对生成样本的打分尽可能高
$\max_{\theta}\mathbb{E}_{\mathbf{z}\sim p(\mathbf{z})}\left[f(G(\mathbf{x};\theta);\phi)\right]\tag{19}$
因为 $f(\mathbf{x};\phi)$ 是不饱和函数，所以生成网络的梯度不会消失，从而解决了GAN训练不稳定的问题，并且目标函数不再含有 $\text{KL}$ 散度，在一定程度上缓解了模型坍塌的问题。

开源代码

https://github.com/tjwei/GANotebooks

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
【转载】SSD测试第一神器——FIO running_sheep
转自：[http://www.ssdfans.com]对于SSD性能测试来说，最好的工具莫过于FIO了。FIO是Jens开发的一个开源测试工具，功能非常强大，本文就只介绍其中一些基本功能。线程，队列深度，Offset，同步异步，DirectIO，BIO使用FIO之前，首先要有一些SSD性能测试的基础知识。线程指的是同时有多少个读或写任务在并行执行，一般来说，CPU里面的一个核心同一时间只能运行一个
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
DCGAN中的生成器和识别器代码详解 YYLin-AI DCGAN 深度学习 celeba tensorflow
#DCGAN中的生成器我自己写的有一个封装好的用于生成器和识别器的卷积操作但是在这个代码中我没有使用我自己的代码#原因想绍一下tensorflow自带的函数所以找了一个以前在书上的代码申明一下这个不是原创但是原来代码中有几处不符合DCGAN的要求所以就做了一些修改转载链接没有就直接写成原创建议看代码之前先看看DCGAN的特点，然后再看代码中如何实这些特点的这样会更有帮助DCGAN（深度卷积的对抗生
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
什么软件可以改IP地址 bafnpa123 服务器运维
什么软件可以改IP地址在现代网络环境中，有时候我们需要更换IP地址来进行网络操作。IP地址是网络通信的基石，它标识了计算机在互联网上的唯一身份。下面，我将向您介绍几种常见的换IP地址的方法：方法一：使用深度ip转换器ip转换器是一种可以在公共网络上建立加密通道的技术。通过ip转换器，您可以更换您的IP地址，从而隐藏您的真实IP，提高网络安全性。在选择ip转换器服务时，请务必选择信誉良好、速度稳定的
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
深度学习与（复杂系统）事物的属性科学禅道深度学习模型专栏深度学习人工智能
深度学习与复杂系统中事物属性的关系体现在：特征学习与表示:深度学习通过多层神经网络结构，能够自动从原始输入数据中学习和提取出丰富的特征表示。每一层神经网络都可能对应着事物属性的不同抽象层次，底层可能对应简单直观的属性，而随着网络深度的增加，顶层可以学习到更抽象、复杂的属性及其相互关系。非线性关系建模:深度学习特别擅长处理非线性关系，而在复杂系统中，事物属性间的相互作用往往表现为非线性，例如，某些属
蓝桥杯day10刷题日记 jia_jia_LL 蓝桥杯蓝桥杯算法图论 dfs 刷题笔记数据结构
P8604[蓝桥杯2013国C]危险系数思路：dfs，用深度优先搜索查找一次所有的线路，过程中记录每个点走过的次数，最后在与总路线数比较，相同即为每次必过的点，即关键点#includeusingnamespacestd;intn,m;inta[1010][1010],b[1010];intu,v;intcnt[1010],sum,ans;voiddfs(intx){if(x==v){sum++;f
影评 ‖ 踏上救赎之路，做回自我——观《千与千寻》游山恋一个字
文/游山恋一个字01一直以来，对宫崎骏的作品特别钟爱。在其影片中，流淌着美好、和平、人与自然的和谐人、人与人之间的爱，贴近生活，治愈人生。宫崎骏曾言：我希望能够再次借着更具深度的作品，拯救人类坠落的灵魂。因而他的每部作品所选题材虽然不同，但却将梦想、环保、人生、生存融入作品中，使作品拥有了动漫巨作的高度。这些主题借助于一定的艺术形式进行包装，让读者观众从中领略到一种别样的风景，并得到精神疗养。每每
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
被看见的孩子 WonderLiwen
趁周末回家几天，与家人深度沟通，内心充盈丰实。最让我感觉踏实的，便是我的家人们"很有条理"地接受我全新的人生选择，支持我去做我喜欢的事，并对我提出了更高的要求。之所以说是很有条理，是因为这是一个循序渐进，有前提假设，有质疑和鼓励的深度沟通过程。他们要看的是，我有没有真正想清楚。早早吃完丰盛的早餐，我又去躺在了外公的床上。就着和煦的晨风，我在床上伸展手脚，摆着各种奇怪的姿势，想到我潜意识里的那棵大榕
MATLAB 2023a：强化学习算法的实战演练与性能评估 zmjia111 机器学习 matlab matlab 算法开发语言深度学习机器学习 yolo
在深度学习领域，MATLAB2023版深度学习工具箱以其完整的工具链和高效的运行环境，为研究人员和开发者提供了前所未有的便利。这一工具箱不仅集成了建模、训练和部署的全部功能，更以其简洁易用的语法和强大的算法库，为深度学习任务的快速实现铺平了道路。相较于Python等编程语言，MATLAB的语法更为直观，上手更为迅速。无需繁琐的环境配置和库安装，用户只需打开MATLAB界面，即可轻松开始深度学习之旅
Flink 面试题总结及答案 wending-Y Flink 入门到实践 flink 大数据
基础state的分类keystate和operatestatestate的重分布Flink状态管理详解：KeyedState和OperatorListState深度解析-掘金checkpoint和savepointhttps://zhuanlan.zhihu.com/p/79526638flinkjob的容错策略如果在没有持续消息输出的情况下，如何定时输出主要是现实有可能不会一直有消息输入，但是要
动手学习深度学习——2.5 自动微分 X_Imagine 动手学习深度学习深度学习人工智能自动微分
2.5自动微分正如【2.4微积分】所说，微分是深度学习中几乎所有最优化算法的关键步骤。虽然求这些导数的计算过程很简单，只需要一些基本的微积分知识。但对于复杂的模型，手工计算参数的更新可能很痛苦(而且经常容易出错)。深度学习框架通过自动计算导数加快了这一工作，即自动微分（AutomaticDifferentiation）。在实践中，基于我们设计的模型，系统构建了一个计算图，跟踪哪些数据结合哪些操
生成式AI竞赛：开源还是闭源，谁将主宰未来？新加坡内哥谈技术人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/对于一些行业观察家来说，这场战斗似乎还没开始就已结束。当ChatGPT成为有史以来增长最
飞桨科学计算套件PaddleScience skywalk8163 人工智能 paddlepaddle 人工智能飞桨
PaddleScience是一个基于深度学习框架PaddlePaddle开发的科学计算套件，利用深度神经网络的学习能力和PaddlePaddle框架的自动(高阶)微分机制，解决物理、化学、气象等领域的问题。支持物理机理驱动、数据驱动、数理融合三种求解方式，并提供了基础API和详尽文档供用户使用与二次开发。安装当然要先安装好飞桨PaddlePaddle，再安装PaddleSciencepipinst
深度分析 | 2024年四川大学信息资源管理考研初试成绩数据分析是希望川大667信息管理导论川大972信息检索信息资源管理复试数据分析 667 972 四川大学考研复试考研成绩
摘要本文深入分析了2024年四川大学信息资源管理考研复试成绩，提供了关于考生成绩分布、各科目成绩表现以及科目成绩与总分之间的相关性的详细见解。分析显示，复试考生的平均总分为380.63分，标准差为12分，反映出成绩分布相对集中且波动适中。特别地，专业课972与总分的相关性最高，达到了0.82，明显影响了考生的总分表现。此外，通过比较高分组和低分组的表现，我们发现专业课成绩是区分高低分考生的关键因素
直返APP与电商行业的融合:机遇与挑战氧惠好物
直返，简单来说，是一种让购物变得更有“回报”的消费模式。它通过与各大电商平台和品牌商家的深度合作，为消费者提供了一个全新的购物体验。在这里，购物不再只是单纯的消费行为，而是一种能为你带来实际收益的方式。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+
MAC电脑运行windows程序或者游戏怎么办，crossover介绍，山外有山a macos 游戏
CrossOver是一款特别为Mac设计的应用程序，它基于Wine项目，可以直接在macOS上运行许多Windows应用程序，而无需安装完整的Windows操作系统。是一款由CodeWeavers公司开发的商业软件，它基于开源项目Wine，并对其进行了深度优化和增强。该软件的主要目的是让非Windows操作系统的用户能够在MacOSX、Linux以及ChromeOS等平台上运行Windows应用程
深度阅读学习及实践后的flag 沐沐798
图片发自App首先一定要将深度阅读的学习并实践坚持到底。（不能坚持到底还谈什么以后？）随着深度阅读和每日思考，我相信自己的文学素养会越来越高，写作水平也会日益增长。我会在每日头条，等自媒体平台写一些书评或者读后感来创建自媒体个人IP，此为管道之一。然后就是开设线上和线下读书会，此为管道之二。至于再长远的，能出本畅销书最好了。
Vue监视属性 pilgrim11
监视属性watch：1、当被监视的属性变化时，回调函数自动调用，进行相关操作。2、监视的属性必须存在，才能进行监视。3、监视的两种写法：（1）newVue时传入watch配置（2）通过vm.$watch监视。深度监视：（1）Vue中的watch默认不监测对象内部值的改变（一层）。（2）配置deep：true可以监测对象内部值的改变（多层）。备注：（1）Vue自身可以监测对象内部值的改变，但Vue提
Copilot with GPT-4与文心一言4.0：AI技术的未来嘻嘻爱编码 copilot 文心一言人工智能
CopilotwithGPT-4的深度分析CopilotwithGPT-4是基于OpenAI的GPT-4模型，它是一个多功能的AI助手，能够在多种语言中进行交流和创作。GPT-4模型的强大之处在于其庞大的数据训练基础，这使得它在理解语境、生成文本以及执行复杂任务方面表现出色。CopilotwithGPT-4不仅能够提供信息和回答问题，还能够帮助用户编写代码、创作文学作品，甚至模拟对话。特点多语言支
最新ChatGPT支持下的PyTorch机器学习与深度学习 zkzhzy ChatGPT 机器学习 python 机器学习深度学习 pytorch chatgpt 数据分析人工智能
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。郁磊（副教授）主要从事AI人工智能、大语言模型及软件开发、生理系统建模与仿真、生物医学信号处理，具有丰富的科研经验，主编《MATLAB智能算
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

GAN与WGAN

文章目录

GAN

判别网络

生成网络

训练

GAN存在的问题

训练稳定性

模型坍塌

改进方法：WGAN

Wasserstein \text{Wasserstein} Wasserstein距离

评价网络

生成网络

开源代码

你可能感兴趣的:(深度学习,深度生成模型)

$\text{Wasserstein}$ 距离