小居快跑

transformer模型结构|李宏毅机器学习21年

来源：https://www.bilibili.com/video/BV1Bb4y1L7FT?p=4&vd_source=f66cebc7ed6819c67fca9b4fa3785d39

文章目录

概述

seq2seq

transformer

Encoder

Decoder

Autoregressive（AT）

self-attention与masked-self attention

model如何决定输出的长度

Cross-attention——连接encoder和decoder的桥梁

Training

评估指标的优化

Non-autoregressive（NAT）

概述

transformer就是一个seq2seq的model。
Input一个sequence，output的长度由机器自己决定。

seq2seq

transformer

Encoder

输入一排向量，输出同样长度的另一排向量。
每一个Block做的事情是好几个layer做的事情。
每个block做的事（简化版）：

完整版：

位置的资讯
Bert里会用到同样的架构：

Decoder

Autoregressive（AT）

decoder看到的输入是前一个阶段自己的输出。
那么这样会不会导致error propagation（一步错步步错）？
不会。
exposure bias：test时decoder可能会看到错误的输入，而train时decoder看到的是完全正确的，即它在训练时完全没有看过错误的东西。
解决方法：scheduled sampling：训练时给decoder的输入加一些错误的东西。

self-attention与masked-self attention

为什么要masked？
因为在encoder里面，input是同时输进去的；而decoder里面，input是一个一个输进去的。

model如何决定输出的长度

加上一个Stop Token
除了所有的中文字、< begin >之外，还需要准备一个< end >，不过通常< begin >和< end >会用同一个符号，因为他们分别只会在开头和结尾出现。

Cross-attention——连接encoder和decoder的桥梁

k、v、q如何得出：self-attention|李宏毅机器学习21年

各式各样的连接方式都可以：

Training

前面的部分都是，假设model训练好以后，它是怎么做inference的。
训练资料：输入-输出对

Teacher Forcing：在decoder训练的时候输入的是正确答案

交叉熵（Cross Entropy）是衡量两个概率分布之间差异的一种度量方式，在机器学习中常用作分类问题的损失函数。假设我们有两个概率分布的向量，一个是真实的概率分布 $P$ ，一个是预测的概率分布 $Q$ ，那么交叉熵可以表示为：
$-\sum_{i} P(i) \log Q(i)$

举例：

真实概率分布 $P = [0.6, 0.4]$
预测概率分布 $Q = [0.8, 0.2]$
计算这两个向量的交叉熵如下：
$\times \log(0.8) + 0.4 \times \log(0.2)) = 0.7777$
所以这两个向量的交叉熵大约是 $0.7777$ 。
注意，由于交叉熵是衡量两个分布之间的差异，因此 $P$ 、 $Q$ 必须是有效的概率分布，即 $P$ 、 $Q$ 中的所有元素都必须是非负的，并且它们的和为 1。在实际应用中，为了防止对数函数中出现对零取对数的情况，通常会给 $Q$ 中的元素加上一个很小的正数，比如 $1 e - 9$ 。

评估指标的优化

训练时是min cross entropy（字与字之间），测试时是max BLEU score（句子与句子之间），这两个指标可以等价吗？
不见得。
训练的时候都是一个字一个字出来的，怎么在训练的时候就用BLEU score：
遇到无法optimize的loss fuction，用RL硬train一发就可以。
把fuction当做是RL的reward，把decoder当做agent。（比较难）

BLEU（Bilingual Evaluation Understudy）分数是一种常用于评估机器翻译质量的指标，它通过比较机器翻译的文本和一个或多个参考翻译来计算分数。BLEU分数考虑了准确性（通过n-gram匹配）和流畅性（通过句子长度的惩罚）。

BLEU分数的计算包括以下几个步骤：

n-gram精确度：对于每个n-gram（n可以是1, 2, 3, …），计算机器翻译中n-gram出现的次数，并与参考翻译中的n-gram出现次数进行比较。对于每个n-gram，计算其精确度（precision）。
修剪（Clipping）：如果机器翻译中的n-gram出现次数超过参考翻译中的最大出现次数，将其修剪至该最大值。
加权平均：对于不同的n-gram精确度，计算它们的几何平均值，并对结果取自然对数。
句子长度惩罚（Brevity Penalty, BP）：如果机器翻译的长度小于参考翻译的长度，将施加一个惩罚以避免过短的翻译。

计算公式：

$\text{BLEU} = \text{BP} \cdot \exp\left(\sum_{n=1}^{N} w_n \log p_n\right)$

其中：

$p_n$ 是第n个n-gram的精确度。
$w_n$ 是第n个n-gram的权重，通常取为 $1/ N$ ，使得所有n-gram权重之和为1。
$\text{BP}$ 是句子长度惩罚，计算方式为：

$\text{BP} = \begin{cases} 1 & \text{如果机器翻译的长度} > \text{参考翻译的长度} \\ \exp\left(1 - \frac{\text{参考翻译的长度}}{\text{机器翻译的长度}}\right) & \text{其他情况} \end{cases}$

举例：

本例中机器翻译（MT）与参考翻译（Ref）不完全匹配，并且将计算最多包括2-gram的BLEU分数。

假设机器翻译（MT）为：“the black cat sat on the mat”，参考翻译（Ref）为：“the cat sat on the mat”。我们计算1-gram和2-gram的BLEU分数（即N=2）。

对于1-gram：
- MT中的词：“the”, “black”, “cat”, “sat”, “on”, “the”, “mat”
- Ref中的词：“the”, “cat”, “sat”, “on”, “the”, “mat”
- MT中每个词的出现次数与Ref中相同或更多的词有：“the” (2次), “cat” (1次), “sat” (1次), “on” (1次), “mat” (1次)
- 因此，1-gram精确度 $p_1 = \frac{6}{7}$ （因为MT中有7个词，其中6个词匹配到了Ref）
对于2-gram：
- MT中的2-gram：“the black”, “black cat”, “cat sat”, “sat on”, “on the”, “the mat”
- Ref中的2-gram：“the cat”, “cat sat”, “sat on”, “on the mat”
- MT中每个2-gram的出现次数与Ref中相同或更多的2-gram有：“cat sat” (1次), “sat on” (1次), “on the” (1次)
- 因此，2-gram精确度 $p_2 = \frac{3}{6}$ （因为MT中有6个2-gram，其中3个匹配到了Ref）
长度惩罚（BP）：
- MT的长度为7，Ref的长度为6。
- 因为MT的长度大于Ref的长度，所以没有长度惩罚， $\text{BP} = 1$ 。
加权平均：
- 假设我们给1-gram和2-gram相同的权重，即 $w_1 = w_2 = 0.5$ 。
- 加权平均为 $\exp(0.5 \cdot \log p_1 + 0.5 \cdot \log p_2)$ 。

现在我们可以计算BLEU分数：

$\text{BLEU} = \text{BP} \cdot \exp\left(0.5 \cdot \log \frac{6}{7} + 0.5 \cdot \log \frac{3}{6}\right)$

计算具体数值：

$\text{BLEU} = 1 \cdot \exp\left(0.5 \cdot \log \frac{6}{7} + 0.5 \cdot \log \frac{1}{2}\right)$
$\text{BLEU} \approx \exp\left(-0.42365\right) \approx 0.65468$
因此，BLEU分数大约为0.65468。这个分数反映了机器翻译与参考翻译在1-gram和2-gram层面上的部分匹配程度。在实际应用中，BLEU分数通常会乘以100，因此这个分数可能会表示为65.468。

Non-autoregressive（NAT）

常用于语音合成领域，因为可以：输出长度 * 2 -> 语速 * 2

你可能感兴趣的:(transformer,机器学习,深度学习,李宏毅)

MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
与羊有关的诗句胡天寿01
1.《初春汉中漾舟》（孟浩然）羊公岘山下，神女汉皋曲。雪罢冰复开，春潭千丈绿。轻舟恣来往，探玩无厌足。波影摇妓钗，沙光逐人目。倾杯鱼鸟醉，联句莺花续。良会难再逢，日入须秉烛。2.《边头作》（李端）邠郊泉脉动，落日上城楼。羊马水草足，羌胡帐幕稠。射雕过海岸，传箭怯边州。事归朝将，今年又拜侯。3.《出境游山》(王勃)源水终无路，山阿若有人。羊先动石，走兔欲投巾。4.《按覆后归睦州，赠苗侍御》（刘长卿）
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
父母拼尽一切孩子却不领情？一定要学会这一招四叶草_add9
中原焦点团队李金梅坚持分享第601天2021.5.28中国的父母是世界上最累的父母，从孩子出生，他们就开始了操劳的父母生涯：孩子年幼时，照顾他的吃喝拉撒；孩子上学后，忙完工作回到家还要辅导孩子的功课，辅导不了要报辅导班；孩子长大成人了，父母仍然要操心孩子的工作和婚姻；孩子结婚的房子，父母帮着买；孩子生了孩子，父母帮着带……父母的大半生都把孩子排在自己前面，一切为了孩子，最后却往往落不着好：孩子要么
平凡与伟大--父亲的一生张翔淋
10.寻找四表哥先生要账还是没有结果，做工程，每到年关都会和农民工一起去要工程款。生活不易。从张家口东站下车的父亲下了车才知道离他四表哥的所在地张北县还有好几十里路，父亲背着随身携带的薄薄的一床被子，在没有路，一人高的杂草淀子里越走越迷路，实在找不着方向了，随身携带的被子也被换了吃的。身无分文，又累又饿的父亲只好去了难民登记处。登记员看见父亲带着的地址要找的人是张北县粮食局的李进替，非常高兴的告诉
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
替身贵妃将我扒光沉塘，暴君杀红了眼陆知白李双儿全本免费小说阅读_最新完本小说替身贵妃将我扒光沉塘，暴君杀红了眼(陆知白李双儿) 多多文馆
《替身贵妃将我扒光沉塘，暴君杀红了眼》主角：陆知白李双儿简介：我是贫门农女，也是暴君爱而不得的白月光。为逼我入宫，他将我满村屠尽！暴君在后宫建了一座水晶殿，将我禁锢其中。他日日宠幸我，直至寻到一个与我七分相似的替身，方才淡了兴致。他将替身封为贵妃，千娇万宠一言可戏诸侯。贵妃恃宠生娇，趁着暴君出宫巡视，带着一群人闯进水晶殿。“本宫马上就要受封为后，今天就来清理后宫！”她在我脸上刻奴字，挑断我的手筋脚
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
张长玲碎嘴惹闲气，郭德旺无心泄天机【三】南山顽石
玲玲便紧紧靠在他身边不情不愿地继续朝前走，一边走一双手却一边不太安分的在他身上摩挲起来。突然，她的一只手伸进了他的衣袋里，紧接着又出来，却已捏着个东西，口中欢叫起来：“啊！你有这，咋不早说？”瑞年朝她手上一看说：“气球嘛，有啥稀奇？”“你瓜呀！”玲玲笑道，“这是biyuntao，我在我大嫂子屋里见过的，想偷偷拿几个呢，又没好意思。”瑞年停下脚步问道：“啥是biyuntao？”李玲玲看他半日，把脸微
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
李汶翰、徐娇领衔主演，杭州2022年亚运组委会授权电视剧《泳往直前》阵容官宣！楚离杜子腾
今日，杭州亚组委授权电视剧《泳往直前》阵容官宣，由黄克敏执导，李汶翰、徐娇领衔主演。《泳往直前》是亚运会筹备工作启动以来,着手谋划创作的亚运主题文艺精品项目之一，也是杭州亚组委官方授权拍摄的唯一一部亚运主题电视剧。《泳往直前》主要讲述了四名背景各异，独具个性的少年在泳池奋力拼搏、执着追梦的故事。中年失意的游泳教练梁友光，为了证明自己的能力，四处挖掘游泳的好苗子冲刺亚运会，在发现了毫无训练经验却颇有
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
【208】《班级管理课》读书感悟（一百零五）2023-07-23 南风如我意
-----------《班级管理课》读书感悟四文/李现风2023年读书笔记读书笔记以以下三个出发点为目的：一、书中的思想，提升自己的教育理念；二、书中的值得借鉴的做法，提升自己的教育技巧；三、书中的美句，有鉴于哲理性的句子，提升自己文章的语言魅力和教育文化水准。读《班级管理课》作者陈宇读书感悟四：【书目】《班级管理课》【页数】第70页第87页【阅读内容（摘录）】第四课开学一个月：班级常规工作正常运
我的青春不打烊｜（5）开学第一天静子木
点完名，班主任老师说：“今天是开学第一天，我们先大扫除，打扫教室。这样，先按现在同学们坐来分配，第一组负责打扫教室内外；第二组负责擦桌，门，窗。第三组负责提水，第四组负责冲洗教室。”同学们说：“好。”然后各组的人开始行动，因为是刚进初中，对一切都很陌生，还有点怯怯的样子。李诺和朱荣儿她们在第一组，所以她们去拿扫帚，开始扫地。这些事，平常在家都有做，她们做起来得心应手。人多力量大，每个人都很认真，有
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他