NLP论文阅读记录 - 2021 | 使用深度强化模型耦合上下文单词表示和注意机制的自动文本摘要

文章目录

前言
0、论文摘要
一、Introduction
- 1.1目标问题
- 1.2相关的尝试
- 1.3本文贡献
二.相关工作
- 2.1 单词表示
- 2.2 文本摘要方法
三.本文方法
四实验效果
- 4.1数据集
- 4.2 对比模型
- 4.3实施细节
- 4.4评估指标
- 4.5 实验结果
- - 4.6 细粒度分析
五总结
思考

前言

Automatic text summarization using deep reinforced model coupling contextualized word representation and attention mechanism（2108）

0、论文摘要

近年来，随着文本数据的快速且前所未有的增长，非常需要自动文本摘要模型来在合理的时间内从这些大量文本文档中检索有用信息，而无需人工干预。文本摘要通常基于提取和抽象范式进行。尽管在过去的几十年里，针对文本摘要任务提出了不同的基于机器学习和深度学习的方法，但它们仍处于发展的早期阶段，其潜力尚未得到充分发掘。
因此，本文提出了一种新的摘要模型，该模型利用提取和抽象文本摘要模型作为基于强化学习策略梯度的单一统一模型。
除了注意机制之外，所提出的模型还在提取和抽象模块中采用了卷积神经网络和门控循环单元的组合。此外，语言模型，即Word2Vec和BERT，被用作所提出模型的骨干，以更好地将句子语义表达为词向量。
我们在广泛研究的文本摘要数据集（CNN\Daily Mail 和 DUC-2004）上进行了实验，根据实证结果，与提取和抽象摘要模型相比，所提出的模型不仅在 ROUGE 度量方面实现了更高的准确性，而且此外，其生成的摘要基于人工评估呈现出更高的显着性和可读性。

一、Introduction

1.1目标问题

随着互联网技术的显着发展和社交媒体的指数级发展，人们如今面临着大量以非结构化文本形式产生的数据。尽管这些文本数据有价值且信息丰富，但从中提取有效信息已成为近年来吸引许多研究人员的重要挑战。在这方面，自动文本摘要作为自然语言处理的突出应用之一，被认为是一种有效的解决方案，它不仅试图将长文本压缩为较短的文本并保留其主要思想，而且可以帮助读者除了减少检索信息所需的时间外，还可以轻松理解文本的主要概念[1, 28]。
自动文本摘要方法通常分为抽取式和抽象式两类[14, 46]。提取方法通常基于传统方法，其中选择输入文档的重要句子，然后组合以生成输出摘要。相比之下，抽象方法旨在类似于人类书写的摘要并考虑源文本的语义。事实上，抽象方法除了保留其主要含义外，还能够生成新的句子作为输出摘要，而这些句子在源文本中是不可用的[6, 29]。
尽管提取式摘要方法最先被开发出来并取得了可观的成果，但它们只能从源文档中挖掘重要信息，无法思考输入文本的语义并生成摘要。然而，近年来，随着计算机性能的提高和深度神经网络的扩展，抽象摘要方法获得了极大的关注，它们专注于通过将输入序列转换为另一个序列来生成摘要[3,28,46,71]。必须指出的是，现有的抽象摘要方法大多基于编码器-解码器框架，长短期记忆（LSTM）和门控循环单元（GRU）可以作为该领域的适用模型，并且首先被大规模应用。由于其强大的能力，它们被用于机器翻译，然后用于文本摘要任务[15,63,70]。
必须指出的是，尽管机器翻译和文本摘要之间有很大相似之处，但它们还是有很大不同的。因此，在机器翻译中，生成的序列大致与输入序列一样长，而在文本摘要中，生成的序列通常比输入序列短，并且与原始文本的长度无关。很明显，尽管机器翻译往往是无损的，但输入文本在文本摘要中以有损方式压缩，同时保留了其主要概念。换句话说，机器翻译试图解决输入和输出序列之间一对一的字级对齐问题，但文本摘要并不高度依赖于对齐[48, 57]。
尽管近年来推出的许多基于深度学习的摘要方法取得了成功，但现有模型仍处于发展的初级阶段，无法解决所有局限性。事实上，一个好的总结不仅要简短、信息丰富、连贯，而且还必须考虑句法结构。考虑到现有的抽取式和抽象式文本摘要模型生成的摘要，很明显，抽取范式很简单并且保证了语法正确性，而生成的摘要通常显着性较差并且语义不一致。相反，抽象范式更加简洁但冗余，其生成的摘要不满足句法结构要求[20]。而且，在总结很长的文档时，提取模型很简单，而其可读性较差，并且抽象模型将长序列压缩为固定长度的向量，从而导致信息丢失。因此，他们都无法更有效地执行长文档摘要[1]。
通过仔细研究当前的文本摘要模型，可以发现源文本的所有内容，特别是在抽象摘要模型中，通常被编码为解码器的输入。因此，如果源文档包含不相关的信息，则所有输入文本都会被编码并用作解码器的隐藏状态，这可能导致生成的摘要不一致，因为编码器受到不相关信息的高度影响，因此语义会受到影响。无法有效地表示文本。此外，当前的编码器-解码器模型只能将一个单词作为输入，而将短语作为输入不仅可以产生更高的性能，而且可以通过考虑单词的搭配来帮助模型生成更自然的句子[40]。
相反，之前的研究也表明，使用预训练模型进行单词表示对于各种自然语言处理任务都是有益的 [50, 59]。重要的预训练模型之一是词嵌入，例如 Word2Vec [31]、Glove [37] 和 ELMo [38]，它们通常用于生成词向量，这些词向量用作主要任务之外的附加特征。另一种预训练模型是句子级的，如 UML-FiT [18]、OpenAI GPT [39] 和 BERT [13]。值得注意的是，尽管利用预训练模型进行单词表示已经取得了惊人的结果，但其潜力和影响力尚未得到充分探索。此外，尽管有词嵌入，但句子级预训练模型的效果很少被探索，并且仍然很少有研究旨在使用它们来增强文本摘要的性能[50]。

1.2相关的尝试

1.3本文贡献

考虑到上述问题，本文提出了一种新的自动文本摘要模型，该模型不仅结合了提取式和抽象式文本摘要范式的优点，而且减少了不相关信息的影响，增强了生成摘要的连贯性和显着性。专注于合成结构。该模型使用强化学习集成了提取和抽象文本摘要模型，同时在提取和抽象模块中利用了 CNN 和 GRU 的组合。值得注意的是，自注意力机制和辅助注意力机制分别应用于提取和抽象模块中，以模仿人脑生成摘要。此外，为了更好地表达句子语义，我们还在我们提出的文本摘要模型的基础上利用 Word2Vec 和 BERT 结构进行单词表示，并研究了它们对目标任务的影响。必须指出的是，尽管使用 Word2Vec 进行向量表示的效果已在各种自然语言任务中得到了广泛的探索[43, 44]，但使用 BERT 来提高抽象文本摘要效率的研究却很有限。为此，我们决定将它们单独用作我们提出的模型的第一层，以便对它们进行比较并突出 BERT 的潜力。
简而言之，提取模型和抽象模型分别被预训练为两个子模型，然后使用强化学习的策略梯度来训练完整的端到端模型并在所提出的模型中桥接两个训练有素的网络。

总之，我们的贡献如下：

所提出的模型利用了提取和抽象文本摘要模型，这些模型被训练为基于强化学习策略梯度的单一统一模型。
CNN 和 GRU 的结合用于提取和抽象模块。在提取模块中使用 CNN 不仅可以实现句子级编码，还有助于提取局部特征。在抽象模块的编码器中使用 CNN 还使模型能够使用短语而不是单词作为输入，从而生成更自然的句子。 •
所提出的模型分别在提取和抽象模块中采用自注意力机制和辅助注意力，通过模仿人脑在摘要生成中的过程来突出重要信息。 •
为了清楚地展示单词表示模型的影响并提高文本摘要的性能，我们分别利用 Word2Vec 和 BERT 技术作为我们提出的模型的支柱。 •
除了使用CNN 和GRU 的组合、辅助注意力和情境化表示之外，这是第一个尝试连接提取和抽象模型的研究。
根据实验结果，与现有的提取和抽象摘要模型相比，所提出的模型不仅在 ROUGE 度量方面获得了更高的准确性，而且其生成的摘要具有更高的可读性和显着性。
我们论文的其余部分分类如下。第 2 节总结了基于深度学习的提取和抽象摘要模型的相关研究。第 3 节介绍了所提出模型的细节。第 4 节包括模型情境化和实证结果。第 5 节提供了结论和对未来研究的建议。

二.相关工作

文本摘要是自然语言处理的突出应用之一，近年来得到了广泛的研究并吸引了许多研究人员。为了更好地研究文本摘要领域的研究，本文的文献综述分类如下。首先，探讨了词表示的影响以及这方面的相关工作。其次，介绍了各种针对深度神经网络的抽取式和抽象式文本摘要方法。第三，介绍了强化学习和注意力机制的影响。

2.1 单词表示

文本摘要的第一步是单词表示，旨在将文本转换为固定大小的向量 [10, 40]。由于预处理步骤后获得的词汇中的单词数量有限，许多研究都集中在解决学习单词嵌入的问题，Mikolov 等人提出的模型。 [40]，即Word2Vec，是这方面第一个有前途的模型。他们使用未标记的文本来训练单词的连续语义表示。同样，彭宁顿等人。 [50]利用共现矩阵并仅对非零元素进行训练来生成语义词嵌入。
然而，所提到的单词表示模型是上下文无关的，只能为每个单词生成单个单词嵌入[38]。这意味着“银行”一词在“河岸”和“银行存款”中将具有相同的向量，而上下文可以使“银行”一词的含义不同。为了克服这个问题，最近的语言模型专注于生成上下文词嵌入。因此，ELMo [59] 是一个试图从语言模型中提取上下文相关特征的模型，其中每个标记的上下文表示是其从右到左和从左到右表示的串联。德夫林等人。 [38]还提出了来自 Transformers 的双向编码器表示（BERT），以训练来自未标记文本的深度双向表示。 BERT 可以合并来自双向表示的信息，这对于用自然语言表示单词非常重要。

2.2 文本摘要方法

下一步是利用词向量进行文本摘要。文本摘要模型大致分为提取方法和抽象方法。大多数早期研究主要集中在提取方法和计算技术，例如模糊逻辑、遗传编程、神经网络或机器学习，它们依赖于人类生成的特征来生成摘要[30, 61]。在这方面，Janpeng Cheng [11]提出了一种数据驱动模型，利用神经网络和连续句子特征以及分层文档编码器和基于注意力的解码器来生成摘要。同样，Marina Litvak [25] 使用监督和无监督方法来识别源文档的重要概念以生成摘要。所有这些方法都是基于文本摘要的系统表示扩展，利用结构文档特征来提高传统向量空间模型的性能。接下来，Kami-Fai Wong [55] 提出了一种基于学习的模型，该模型集成了被分类为表面、相关性、内容和事件的各种特征。值得注意的是，句子的外部方面是通过表面特征来探索的，而句子的语义相关性是通过相关特征来考虑的。内容特征还根据内容传输单词计算句子，而事件特征根据其包含的事件表示句子。
随着深度学习的出现，文本摘要进入了一个新的发展阶段，循环神经网络和图卷积网络首先被用来计算句子的重要性并生成摘要。遵循类似的研究路线，Cao 等人使用了卷积神经网络。 [7] 对句子进行编码。然后根据语义信息对编码句子进行排序以生成最终摘要。尽管该模型取得了巨大成功，但它无法对关键词提取中的内容进行注释。此外，任等人。 [41]利用卷积和基于注意力的 RNN 来生成摘要，尽管之前有研究，但他们的模型可以考虑内容来提取信息丰富的句子。 Verma 和 Nidhi [47] 提出了一种提取摘要模型，该模型由特征提取、特征增强和摘要生成三个阶段组成，旨在提取突出信息，然后生成可理解且连贯的摘要。为此，他们利用受限玻尔兹曼机（RBM）来抽象特征并提高整体概括精度。张等人。 [62]引入了一种用于提取摘要的多视图卷积神经网络。他们利用两个单独的卷积神经网络来获取句子的特征，然后对句子进行联合排序。
SummaRuNNer 随后由 Nallapati 等人提出。 [32]假设摘要是一个文本分类问题。因此，SummaRuNNer 中使用了两级 RNN，第一个用于单词级，第二个用于单词级用于句子级隐藏状态表示计算。周等人。 [68]还引入了一种提取摘要模型，该模型采用分层循环神经网络和 BERT 作为预训练模型来执行摘要。尽管有其他现有方法，他们还是引入了联合句子评分框架，该框架根据句子内容和先前选择的句子来预测相对句子重要性得分。
尽管通过提取文本摘要获得了可观的结果，但提取模型生成的摘要在语义上并不连贯[14]。事实上，尽管提取模型能够生成具有可接受的句法结构水平的摘要，但其生成的摘要的可读性很差。考虑到人类不仅喜欢用自己的话来解释文档来生成摘要，而且还选择突出简洁、连贯的摘要，文本摘要时代的研究已经改变了方向，最近的研究集中在抽象文本摘要满足现有要求[40]。最初的抽象文本摘要模型通常基于机器学习和所需的手工特征。然而，深度学习的发展使得该领域取得了显着的发展[28, 49]。
因此，拉什等人。 [42]旨在解决长文档摘要的问题，并使用基于词袋的编码器和具有注意机制的CNN作为解码器来生成摘要。 Lopyrev [27] 还利用基于注意力的 LSTM 来生成标题，考虑到新闻文章的文本，其中在解码器中使用 RNN 而不是神经语言模型。在下文中，乔普拉等人。 [12]提出了一种基于注意力的前馈神经网络来生成新闻文章的标题。
尽管深度神经网络具有巨大的潜力，但仍存在一些局限性。例如，重复词、短句和生僻词通常被认为是抽象文本摘要中的突出问题。为了填补这些空白，近年来进行了不同的研究，研究人员致力于解决重复性和生僻字问题。因此，Nallapati 等人。 [33]提出了一种基于注意力的编码器-解码器，它在不同的摘要数据集上获得了最高的准确率。还引入了覆盖机制来克服重复性问题。对此，铃木等人。 [51]检查了编码器中的目标词上键特征，并通过控制解码器中的输出词来降低摘要的可重复性。最近的研究还利用强化学习和注意力机制来提高生成的摘要的可读性和一致性[3, 36]。
Vinyals等人在编码器和解码器中引入了指针机制。 [53]克服生僻字问题。顾等人。 [16]，古尔塞雷等人。 [17] 和 Nallapati 等人。 [33]还采用了具有不同配置的指针机制的概念来控制罕见词问题。最近，See 等人。 [45]。在他们的模型中使用了类似的机制，在摘要生成方面取得了相当大的改进。
卷积神经网络也已成功用于抽象概括。为此，宋等人。 [48]引入了一种摘要模型，除了指针机制之外，还利用 CNN 和 LSTM 来生成摘要。此外，Li 等人使用了 seq2seq 编码器-解码器。 [23]生成抽象摘要。他们提出的模型利用生成模型来学习摘要的潜在结构和判别状态信息。 Wang和Len [54]还提出了摘要感知注意力来总结社交媒体的短文本，其中利用源隐藏状态和参与摘要向量来测量注意力权重。类似地，Xiang 等人提出了一种注意力编码器-解码器框架。 [56] 他们在哪里在编码器和解码器中使用 Bi-LSTM 分别对输入序列进行编码并生成输出摘要。
周等人。 [69]开发了序列到序列模型，并利用句子编码器、选择性门网络和配备注意力的解码器进行抽象摘要，其中选择性门网络通过控制从编码器到解码器的信息流来提供句子级表示。 Huan 等人还提出了一种变分神经解码器文本摘要模型。 [65]。基于他们提出的模型，利用变分 RNN 和变分自动编码器的组合来获得复杂的语义表示，然后生成摘要。接下来，Fan 等人使用了卷积序列到序列模型。 [24]对于抽象文本摘要，提供了一种注意力机制，使读者能够通过具体化高级特征来关注生成的摘要的更重要的方面。
通过开发预训练的语言模型，他们还成功应用于文本摘要，并取得了显着的效果。因此，Zhang 等人使用了 BERT。 [64]对输入序列进行编码并表示上下文。他们提出的模型包括两个步骤，首先采用基于变压器的解码器来生成草稿输出。此后，草稿序列被屏蔽并馈送到 BERT。最后，使用基于变压器的解码器来组合输入序列和草稿表示，并为每个掩码位置生成精炼词。此外，Liu和Lapata [26]提出了一种基于BERT的新文档级编码器来表示文档的语义，然后生成摘要。阿克谢诺夫等人。 [2] 还在 BERT 语言模型上评估了基于 Transformer 的神经模型的编码器和解码器的调节，并在文本摘要任务中获得了可观的结果。
强化学习的应用也吸引了许多研究人员，并且有望彻底改变文本摘要的任务，因为与其他机器学习方法相比，算法不明确地知道任务是如何执行的，而是自行解决问题。因此，姚等人。 [58] 除了基于注意力的 LSTM 和概率生成模型之外，还采用强化学习来生成摘要。 Li等人还提出了神经抽象概括框架。 [22]。他们采用强化学习和注意力机制中的演员-批评家方法，并分别利用最大似然作为演员和批评家。值得注意的是，Hsu 等人。 [19]还提出了一种抽象摘要模型，该模型利用提取和抽象文本摘要模型的组合，利用单词级、句子级和不一致损失函数来惩罚两个注意力级别之间的不一致。为了克服长文档摘要问题，Celikyilmaz 等人。 [8]在编码器-解码器中引入了深度通信代理。为此，长文档被分成较短的部分，然后使用特定的代理对每个部分进行编码。此后，采用强化学习进行训练并提取最终总结。纳拉扬等人。 [34]还利用强化学习对提取摘要方法中提取的句子进行排序。保卢斯等人。 [36]还引入了一种深度强化模型，利用强化学习策略梯度方法进行抽象总结。在下文中，托马斯等人。 [52]引入了一种用于文本摘要的集成方法，其中提取和抽象文本摘要方法相结合，以充分利用原始数据。他们分别将 LSTM 和指针生成器网络用于提取和抽象模块。查利等人。 [9]还使用了各种方法进行句子排序和聚类，以避免摘要中存在冗余数据。他们提出了一种无监督的提取总结方法，并开发了两种使用强化学习技术和变压器模型的抽象多文档摘要模型。肯内什卢等人。 [21]采用了基于自我批评策略梯度方法的强化学习框架，该框架在各种数据集上获得了很好的泛化性和显着的结果。
通过仔细研究现有的研究，很明显，尽管除了强化学习之外，还引入了各种基于深度学习的模型来进行自动文本摘要，但它们仍处于发展的早期阶段，并面临着一些局限性。此外，可以说机器生成的摘要和人类生成的摘要之间仍然存在相当大的差距，这使得自动文本摘要成为对研究人员有吸引力和潜在的主题。

三.本文方法

四实验效果

4.1数据集

4.2 对比模型

4.3实施细节

4.4评估指标

4.5 实验结果

4.6 细粒度分析

五总结

思考

Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
过去一年，这16本好书不容错过 m0_54050778 perl
编者按：2023年在动荡与希望中收尾，2023年注定会被载入史册。疫情寒冬结束，ChatGPT横空出世，带动了人工智能技术的飞速发展；淄博烧烤、天津大爷、尔滨之旅等充满感动与幸福。但与此同时，2023年又是动荡与不安的一年，俄乌冲突的延宕，新一轮的巴以冲突，极端天气频发。在这个大环境下，有一些经典的书籍著作诞生。本文将分享2023年最值得一读的16本书籍，文章来自翻译，希望对你有所启示。关于202
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
ChatGPT：AI合作伙伴助你成为论文写作高手 2401_83550420 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达摘要：本文将介绍ChatGPT3.5Turbo（以下简称ChatGPT），一款强大的AI合作伙伴，能够助你成为一名论文写作高手。我们将深入探讨ChatGPT的特点、优势，并提供多个示例，展示ChatGPT在论文写作中的应用。无论是开展研究、撰写论文、还是与ChatGPT进行互动交流，都能够帮助你提升写作效率和质量。引言：随着人工智能的发展，聊天型语言模型在各个领域都
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
ChatGPT：智能论文写作指南，让您成为写作高手 AI臻蚌 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达写作是学术研究中不可或缺的一环，然而，对于许多人来说，写作往往是一项艰巨而费时的任务。但是，现在有了ChatGPT，您将能够以前所未有的速度和准确性编写高质量的论文。本文将向您介绍如何利用ChatGPT的强大功能成为写作高手，并为您提供一些示例，展示其在不同领域的应用。1.简介ChatGPT是一种基于人工智能的语言模型，它可以理解并生成人类语言。通过训练大量的语料库
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
数字逻辑不可能涌现出智能 dog250 人工智能
先看一系列竖式乘法的步骤：相乘的两个数数位越大，步骤越多。如果不纠结数制，二进制运算也是这回事，把单个步骤用一个晶体管表达(其实一个步骤不止一个晶体管)，数位越大，所需的晶体管越多。先说结论，所有基于n进制的逻辑运算都不可扩展。硅基时序电路可如此巧妙完成精确计算，开启了数字化时代，人们试图将AI构建在这二进制世界。但若二进制运算不可扩展，基于数字逻辑的人工智能就不可能。前面提到过，二进制运算本质上
让数据说话：人工智能与六西格玛的完美结合张驰课堂人工智能六西格玛
当人工智能与六西格玛结合，企业可以充分利用人工智能技术的数据处理、预测分析和智能决策支持能力，实现数据驱动的决策、质量控制和流程优化，从而提高企业的效率和竞争力。下面张驰咨询给大家具体的介绍：1、数据驱动决策六西格玛侧重于数据分析和决策制定，而人工智能可以提供更强大的数据处理和分析能力。通过人工智能技术，可以自动收集和整理大量的数据，并进行有效的数据挖掘和模式识别。这些数据分析结果可以为六西格玛项
《论文阅读》EmpDG：多分辨率交互式移情对话生成 COLING 2020 365JHWZGo 情感对话论文阅读共情回复回复生成对话系统多分辨率对抗学习
《论文阅读》EmpDG：多分辨率交互式移情对话生成COLING2020前言简介模型架构共情生成器交互鉴别器损失函数前言亲身阅读感受分享，细节画图解释，再也不用担心看不懂论文啦~无抄袭，无复制，纯手工敲击键盘~今天为大家带来的是《EmpDG:Multi-resolutionInteractiveEmpatheticDialogueGeneration》出版：COLING时间：2020类型：共情回复关
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
AI原生安全亚信安全首个“人工智能安全实用手册”开放阅览亚信安全官方账号安全网络 web安全人工智能大数据
不断涌现的AI技术新应用和大模型技术革新，让我们感叹从没有像今天这样，离人工智能的未来如此之近。追逐AI原生？企业组织基于并利用大模型技术探索和开发AI应用的无限可能，迎接生产与业务模式的全面的革新。我们更应关心AI安全原生。实施人工智能是一项复杂又长远的任务，任何希望利用大模型的组织在设计之初，都必须将安全打入地基，安全一定是AI技术发展的核心要素。针对人工智能和大模型面临的威胁与攻击模式，亚信
开发chrome扩展（禁止指定域名使用插件）徐同保 chrome 前端
mainfest.json:{"manifest_version":3,"name":"ChatGPT学习","version":"0.0.2","description":"ChatGPT,GPT-4,Claude3,Midjourney,StableDiffusion,AI,人工智能,AI","icons":{"16":"./images/logo.png","48":"./images/lo
2021-02-07 NLP心理实操作线上课 day7（16讲、17讲）海洋7606
#前提假设（上）（下）【学习内容】：第十六讲：前提假设（上）1、前提假设A.对人的前提假设【看人】：（1）没有两个人是一样的（2）沟通的效果取决于对方的回应【每当做出一个沟通需要向对方做出一个核对】（3）一个人不能改变另外一个人（4）每一个人都选择给自己最佳利益的行为(5）每人都已经具备使自己成功快乐的资源和能力（6）动机和情绪总不会错，只是行为没有效果而已第十七讲：前提假设（下）B.对事的前提假
ai智能语音机器人的出现未来电销行业会如何发展？ VO_794632978 WX-794632978 语音机器人人工智能机器人交互语音识别大数据
人工智能和移动互联网技术的发展，对于很多行业都产生了颠覆性的影响。而对于电销这一重复度较高的行业来说，也是产生了巨大的推动作用。对于传统电销人来说，电销机器人可以帮助你提高销售效率，提高影响客户的能力和转化率，将你过去繁琐简单无效的需要个人做的工作，都交给机器，让你的时间和精力，放在重要的客户和有创造性的事情上。我们一起来看看都有哪些发展。自动化程度提高：AI机器人能够不间断地工作，自动拨打电话、
GEE在灾害预警中的遥感云大数据应用及GPT模型辅助分析 AIzmjl GPT 生态遥感大数据 gpt gee 灾害预警水体湿地遥感
随着遥感技术的快速发展，云大数据在灾害、水体与湿地领域的应用日益广泛。通过遥感云大数据，我们能够实时获取灾害发生地的影像信息，为灾害预警、应急响应提供有力支持。同时，在水体与湿地监测方面，遥感云大数据也发挥着重要作用，帮助我们了解水体的分布、变化以及湿地的生态状况。近年来，GPT模型在自然语言处理领域取得了显著成果，其强大的文本生成和理解能力为遥感云大数据的应用提供了新的可能。通过将GPT模型与遥
生成式AI竞赛：开源还是闭源，谁将主宰未来？新加坡内哥谈技术人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/对于一些行业观察家来说，这场战斗似乎还没开始就已结束。当ChatGPT成为有史以来增长最
从政府工作报告探计算机行业发展想你依然心痛个人总结与成长规划行业发展前景
文章目录每日一句正能量前言以“数”谋新、加“数”向实人工智能方面人工智能成核心驱动引擎软件方面通信方面后记每日一句正能量该来的始终会来，千万别太着急，如果你失去了耐心，就会失去更多。该走过的路总是要走过的，从来不要认为你走错了路，哪怕最后转了一个大弯。这条路上你看到的风景总是特属于你自己的，没有人能夺走它。前言2024年的两会是中国政治日历上一次重要的会议，吸引了全球的目光。在这次两会中，计算机行
ego - 人工智能原生 3D 模拟引擎——基于AI的3D引擎，可以做游戏、空间计算、元宇宙等项目花生糖@ AIGC学习资源人工智能游戏空间计算
1.产品概述：Ego是一款AI本地化的3D模拟引擎，旨在让非技术创作者通过自然语言生成逼真的角色、3D世界和交互式脚本。该平台提供了创建和分享游戏、虚拟世界和交互体验的功能。2.定位：Ego定位于解决开放世界游戏和模拟的三大难题：难以编写游戏脚本、非玩家角色无法展现人类行为以及创建新的3D资产和世界的难度。通过AI技术，Ego致力于让用户可以用自然语言创建复杂的游戏和交互体验。3.创始人背景：创始
Python中的并发编程：多线程与多进程的比较【第124篇—多线程与多进程的比较】一键难忘 python java 服务器并发编程多线程多进程
发现宝藏前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。Python中的并发编程：多线程与多进程的比较在Python编程领域中，处理并发任务是提高程序性能的关键之一。本文将探讨Python中两种常见的并发编程方式：多线程和多进程，并比较它们的优劣之处。通过代码实例和详细的解析，我们将深入了解这两种方法的适用场景和潜在问题。多线程
最新ChatGPT支持下的PyTorch机器学习与深度学习 zkzhzy ChatGPT 机器学习 python 机器学习深度学习 pytorch chatgpt 数据分析人工智能
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。郁磊（副教授）主要从事AI人工智能、大语言模型及软件开发、生理系统建模与仿真、生物医学信号处理，具有丰富的科研经验，主编《MATLAB智能算
神奇的微积分科学的N次方人工智能人工智能 ai
微积分在人工智能（AI）领域扮演着至关重要的角色，以下是其主要作用：优化算法：•梯度下降法：微积分中的导数被用来计算损失函数相对于模型参数的梯度，这是许多机器学习和深度学习优化算法的核心。梯度指出了函数值增加最快的方向，通过沿着负梯度方向更新权重，可以最小化损失函数并优化模型。•反向传播：在神经网络训练中，微积分的链式法则用于计算整个网络中每个参数对于最终损失函数的影响（偏导数），这一过程就是反向
自然语言处理概念以及发展黑夜照亮前行的路自然语言处理
自然语言概念总结自然语言处理（NaturalLanguageProcessing，简称NLP）是计算机科学领域与人工智能领域的一个重要方向，它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理旨在帮助计算机理解和处理自然语言，使计算机能够像人类一样处理和生成语言。从概念上讲，自然语言处理融合了语言学、计算机科学和数学等多学科的知识。它并不仅仅是一般地研究自然语言，而是侧重
群晖NAS使用Docker安装WPS Office并结合内网穿透实现公网远程办公深鱼~ cpolar 容器运维 ssh 网络
文章目录推荐1.拉取WPSOffice镜像2.运行WPSOffice镜像容器3.本地访问WPSOffice4.群晖安装Cpolar5.配置WPSOffice远程地址6.远程访问WPSOffice小结7.固定公网地址推荐前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。【点击跳转到网站】wps-office是一个在Linux服务器上部署WPSOffice的镜像。它基于
什么是分布式搜索引擎罗彬桦分布式搜索引擎搜索引擎分布式
什么是分布式搜索引擎搜索引擎所谓搜索引擎，就是根据用户需求与一定算法，运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术，如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等，为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等，同时可添加其他一系列辅助模块，以为用户创造更好的网络使用环境。分布
读《重塑心灵》，悟个人与企业系统关系猫咪06
系统动力派NLP的创始人李中莹先生在他的《重塑心灵》中写到：一个人生于宇宙之间，不可能脱离其它人事物的影响，也不可能完全不影响其他人，因此只有充分尊重这种系统性才能摆正自己的位置，达到天人合一，内外和谐的境界，理解事物，如果越能从系统的整体平衡的角度出发，站在系统的高度理解事物，他就越能照顾全局，越能更好地解决问题，NLP12条前提假设中的“凡事照顾了三赢，不会有后遗症”也是系统的观念。在任何一个
论文阅读——SpectralGPT じんじん论文计算机视觉人工智能
SpectralGPT:SpectralFoundationModelSpectralGPT的通用RS基础模型，该模型专门用于使用新型3D生成预训练Transformer（GPT）处理光谱RS图像。重建损失由两个部分组成：令牌到令牌和频谱到频谱下游任务：
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep