yuyuyu_xxx

NLP论文阅读记录 - 2022 | WOS 02 使用 BERT 模型进行抽取式文本摘要的性能研究

文章目录

前言
0、论文摘要
一、Introduction
- 1.1目标问题
- 1.2相关的尝试
- 1.3本文贡献
二.文献综述
- 2.1 总结方法
三.本文方法
- 3.1 总结为两阶段学习
- - 3.1.1 基础系统
- 3.2 重构文本摘要
四实验效果
- 4.1数据集
- 4.2 对比模型
- 4.3实施细节
- 4.4评估指标
- 4.5 实验结果
- - 4.6 细粒度分析
五总结
思考

前言

Performance Study on Extractive Text Summarization Using BERT Models（22）

0、论文摘要

概括任务可以分为两种方法：抽取式和抽象式。提取摘要从原始文档中选择显着句子形成摘要，而抽象摘要解释原始文档并用自己的语言生成摘要。
文献中已经用不同的方法研究了生成摘要的任务，无论是提取的还是抽象的，包括基于统计、图形和深度学习的方法。与经典方法相比，深度学习已经取得了令人鼓舞的性能，并且随着注意力网络（通常称为变压器）等不同神经架构的进步，摘要任务存在潜在的改进领域。
Transformer 架构及其编码器模型“BERT”的引入提高了 NLP 下游任务的性能。 BERT 是来自建模为编码器堆栈的转换器的双向编码器表示。 BERT 有不同的大小，例如具有 12 个编码器的 BERT-base 和具有 24 个编码器的 BERT-larger，但出于本研究的目的，我们重点关注 BERT-base。
本文的目的是通过一系列实验对基于 BERT 的模型变体在文本摘要方面的性能进行研究，并提出“SqueezeBERTSum”，这是一种使用 SqueezeBERT 编码器变体进行微调的训练摘要模型，该模型实现了有竞争力的 ROUGE 分数将 BERTum 基线模型性能保留了 98%，可训练参数减少了 49%。

一、Introduction

1.1目标问题

自动文本摘要是一个活跃的研究领域，可以定义为提取大型文档的重要句子或片段并将它们组合成文档的简短版本的过程。总结文本既省时又经济。就时间效率而言，通过阅读掌握文档要点的摘要版本，人类读者可以花费更少的时间来阅读文档。新闻组可以在多个文档上使用文档摘要工具来收集以较短版本讨论同一主题的每个文档的重要信息。就成本效率而言，摘要可用于压缩从一个设备传输到另一个设备的文本数据量。对于用户来说，在决定下载整个文档或文章进行阅读之前选择阅读文档或文章的摘要版本将是有益的。以目前的数据增长速度，很快就会有一种工具可以生成较短版本的文本数据作为人类读者的服务。

1.2相关的尝试

自动文本摘要的任务主要由三个阶段组成：数据预处理阶段、算法处理阶段和后处理阶段。
1.1.数据预处理阶段这是在汇总之前清理原始源文档并将其转换为更兼容的数据格式的过程。数据预处理技术的例子有： (1) 去除文档中的噪声数据； (2) 句子和单词标记化； (3) 标点符号的去除； (4) 去除停用词，去除频繁出现的词，如(a)、(an)、(the)等； (5) 词干提取，即去除后缀和前缀；（6）单词词形还原，即将单词转化为其基本结构，例如将单词“play”转化为“play”； (7)词性标注。
1.2.算法处理阶段这是从预处理文档生成摘要时应用算法方法的过程。算法处理包括提取或抽象概括，这将在本文后面进一步讨论；然而，提取技术比抽象技术更受欢迎[1]，因为前者表现出更好的性能并且相对更容易实现。
1.3.后处理阶段这是在生成目标摘要时应用任何数据转换的过程。正如我们将在文献中介绍的，此阶段对于某些方法来说是可选的。本文的目的是研究基于 BERT 的模型在提取摘要任务中的性能，这将在第 3 节中进一步解释。第 2 节涵盖自动文本摘要的文献，包括所使用的不同方法。第 3 节讨论了该方法，该方法描述了我们针对摘要任务微调基于 BERT 的变体（例如 DistilBERT 和 SqueezeBERT）的实验。第 4 节描述了我们的观察结果和实验结果。第 5 节总结了我们的工作并描述了后续可能采取的步骤。

1.3本文贡献

总之，我们的贡献如下：

二.文献综述

文本摘要可以分为两种类型的摘要：抽取式摘要和抽象摘要。提取摘要是通过重用原始文档的某些部分（例如句子）并将它们组合成摘要而形成的。为了生成提取摘要，根据最显着的信息对每个句子进行排名，然后在保留语法规则的同时将其重新排序为摘要。 SumaRuNNer [2] 是进行提取摘要的几项研究之一。通过解释原始文档并生成较短版本的有意义的句子来形成抽象摘要。这种方法涉及模型对文档的更多语义理解，以人类可理解的形式编写摘要。 Summarist 论文提出了这种方法的一个例子，该论文具有执行此类摘要的模块 [3]。
在整个文献中，已经采用了不同的方法来生成提取摘要，例如 Luhn [4] 的基于频率计数的方法，或 TextRank [5] 的基于图形的方法，它将文档表示为句子图，其中句子之间的边缘根据相似性测量进行连接。 LexRank [6] 是另一种基于特征向量概念的基于图的方法。潜在语义分析 (LSA) [7] 是一种基于统计的方法，尝试通过对大小为 m × n 的文档矩阵 D 应用奇异值分解来查找文档中的句子，其中 m 是句子数，n 是句子数术语数量。 SumBasic [8] 是一种贪婪搜索近似方法，它使用基于频率的句子来设置单词概率的权重以最小化冗余

2.1 总结方法

2016 年，Cheng 和 Lapata 提出了一种注意力编码器-解码器架构，用于在 CNN/DailyMail 语料库上训练的提取性单文档摘要 [9]。他们的模型基于编码器-解码器方法，其中编码器学习句子和文档的表示，而解码器使用注意力机制根据编码器的表示对每个句子进行分类[10]。他们首先使用单层卷积神经网络有效地获得了句子级别的表示向量，而没有长期依赖性。之后，他们使用递归地组成句子的循环神经网络构建文档的表示[9]。第一步称为卷积句子编码器，第二步称为循环文档编码器。第三步是句子提取器，这是另一个循环神经网络，它应用注意力机制在阅读后直接提取显着句子。标记决策是根据编码文档和先前标记的句子来做出的。完成此序列标记任务后，第四步是单词提取器。该任务负责使用分层注意力架构生成摘要中的下一个单词，并计算下一个单词包含在摘要中的概率[9]。
2019 年，Joshi、Eduardo、Enrique 和 Laura 提出了 SummCoder [11]，这是一种基于深度自动编码器的提取文本摘要的无监督框架。在他们的方法中，提取摘要问题被定义为给定文档的句子选择问题。确定摘要中应包含哪个句子基于三个指标： 1. 句子内容相关性指标； 2. 句子新颖性度量； 3.句子位置相关性度量。
该框架根据上述三个指标对句子进行排序，并将问题表述如下：给定一个包含 N 个句子 D = (S1, S2, …, SN) 的文档 D，句子 I 嵌入到向量 VSi 中，这是使用前面提到的三个度量计算的编码器表示，然后进行解码。
2019年，岳东等人。提出了一种训练神经网络执行单文档提取摘要的新方法，而无需启发式生成提取标签。他们将这种方法称为 BanditSum，因为它将提取摘要视为上下文强盗问题，其中模型接收要摘要的文档（称为上下文），然后选择要包含在摘要中的句子序列（称为操作）[ 12]。他们的论文使用策略梯度强化学习方法应用提取摘要。 Bandit 是一种决策形式化，其中代理重复选择多个操作之一，并根据该选择获得奖励。对于提取摘要，每个文档都被标记为上下文，并且文档句子的每个有序子集都是不同的操作。代理需要从一系列动作中学习，确定哪一个会产生最高的奖励。这种方法是在 CNN/DM 数据集上进行训练的，作者在他们的工作中得出结论，当好的摘要句子出现在源文档的较晚位置时，BanditSum 的表现明显优于其他竞争方法。
W.S.埃尔-卡萨斯等人。 2020 年提出了一个基于图的框架，结合了四种称为 EdgeSumm 的提取算法[13]。 EdgeSumm 包括基于图、基于统计、基于语义和基于中心性的方法，据报道，这些方法的性能得分高于 ROUGE-1 和 ROUGE-2 中最先进的系统。他们提出的方法旨在通过引入用于总结与领域无关的文档的通用框架来解决总结问题。它首先根据预处理步骤的输出构建文本图模型，然后计算图中每个节点的权重，该权重基于词频以及标题中单词的出现次数和其他重要因素。然后，应用搜索图算法来尝试找到将最常见的单词或主题链接在一起的短语或边，并且算法的输出是每个选定边的列表。
句子。然后，应用候选摘要算法，该算法根据哪个句子具有从搜索图算法输出的候选边缘列表中选择的至少一条边缘来选择要包括在摘要中的句子。 EdgeSumm 应用于标准数据集，例如 DUC2001 和 DUC2002，对于 DUC2002 数据集中的 ROUGE-1 和 ROUGE-L 指标，其性能优于最先进的文本摘要系统。
2019年，Yang Liu提出了一种微调的BERT摘要方法，称为BERTSum [14]。 BERT 是一堆预先训练的 Transformer 编码器，可以通过注意力机制更好地理解文本数据，使其成为可用于各种下游任务的上下文化语言模型。在他的方法中，他使用 BERT 输出每个句子的表示，因为 BERT 被训练为掩码语言模型，然后他修改了 BERT 的输入序列和嵌入，使提取摘要成为可能。图1展示了BERTSum模型的完整架构，其中他在每个句子之前插入了分类标记[CLS]，在每个句子之后插入了[SEP]标记，然后在片段嵌入层引入了区间段嵌入来区分不同的句子

BERT 层的输出是上下文嵌入，它进入多个特定于摘要的层以捕获文档级特征以提取摘要。作者从1到N计算每个句子Si的最终预测得分Y，其中N是句子的数量，然后计算二元分类熵作为损失函数来对Si是否应该包含在摘要中进行分类
该空间中的摘要将被选择作为输出摘要。作者在五个数据集上进行了实验，证明了匹配框架的有效性，他们认为这种基于匹配的摘要框架的力量尚未得到充分利用。 2.2. ROUGE评估算法生成摘要并没有绝对正确的答案。人类读者生成的每个摘要都不同于

三.本文方法

本节描述每个实验的目标，以研究使用 BERT 编码器的变体微调模型时的摘要性能 [17]。本节还讨论了为提取摘要而训练和评估的不同架构。我们使用BERTSum作为基线模型并修改了源代码，该源代码可在BERTSum论文[18]中找到。这是我们修改后的源代码，用于进行下面的以下实验，可以在 https://github.com/ShehabMMohamed/PreSumm 上找到，于 2021 年 11 月 25 日访问。

3.1 总结为两阶段学习

3.1.1 基础系统

3.2 重构文本摘要

四实验效果

4.1数据集

4.2 对比模型

4.3实施细节

4.4评估指标

4.5 实验结果

4.6 细粒度分析

五总结

鉴于实验结果，考虑到 SqueezeBERT 摘要模型的性能，在 NLP 任务中进一步采用基于计算机视觉的技术具有巨大的潜力。考虑到表 5 中的摘要性能和可训练参数的减少，SqueezeBERT 摘要器可以在架构压缩的情况下进行生产和部署，用于实时摘要生成，而不是部署由约 1.2 亿个数据组成的原始 BERT 摘要器参数，而提出的模型由约 6200 万个参数组成。
我们训练了 BERT 基线，并将其用作所谓的“压缩模型”（例如 DistilBERT 和 SqueezeBERT）的基准。训练后，这些总结化模型都保留了高于基线模型 90% 以上的性能水平，该模型有大约 1.205 亿个参数需要训练。第一个实验是尝试引入基于蒸馏的 BERT 模型，该模型的参数数量减少了约 35%，在测试模型时，它保留了约 98% 的 BERT 模型。第二个实验是训练一个名为 SqueezeBERT 的更高效模型，该模型用分组卷积层替换所有注意力层，以实现高效计算。这个实验产生了一个有趣的观察结果，即 SqueezeBERT 在使用一元语法时保持了与 DistilBERT 相同的性能，并且在使用二元语法和最长公共序列时具有稍微更好的性能。 SqueezeBERT 保留了基线模型 98% 的性能，参数减少了 49%（由 6213 万个参数组成，而不是基线模型的 1.205 亿个参数）。 SqueezeBERT 是训练摘要器的一个很好的选择，其大小几乎是原始模型的一半，并且摘要性能的降级最小。它还给出了一个关键的观察结果，即通过使用受计算机视觉文献[24-26]启发的高效网络（例如分组卷积层），它可以改进 NLP 下游任务，并且在本文中，它通过减少训练时间，同时保持表现。这一观察总结了基于 BERT 的变体的性能研究结果，旨在扩展摘要任务中的文献。

思考

这些实验是在 Google Colab 的单个 GPU 资源上进行的，虽然对于上述实验来说已经足够了，但还有一些额外工作的空间，例如对这些微调模型进行超参数调整，以产生更好的摘要性能。未来另一个可能的工作是在特定领域的数据集上训练这些模型，并生成专用于特定用例的提取摘要器，例如医学或学术提取摘要器。未来可能的进一步工作是探索微调 SqueezeBERT 模型以进行抽象总结而不是提取总结的潜力，并在有任何重大发现时报告性能结果。为了进一步减小预训练模型的大小，还有采用模型压缩技术的空间，例如量化和剪枝。量化是一系列技术，旨在减少神经网络中存储每个参数和/或激活所需的位数，同时保持该网络的准确性。该技术已应用于不同的 NLP 研究中 [27,28]。
剪枝的目的是直接从网络中消除某些参数，同时保持准确性，从而减少该网络的存储和潜在的计算成本；对于该 NLP 的应用，本研究演示了剪枝的应用 [28]。

AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
神奇的平静漫步的小马驹
我们七组色香味俱全的特色菜百家宴我们七组的仙女们仙女们在舞动上图是今晚上海nlp课堂的晚会照片。熟悉的场地，熟悉的伙伴们。只是，我从画面里，跑到了画面外。决定不去二阶的时候，我以为在这样的时刻，我会有很多情绪：郁闷、遗憾、羡慕、纠结……没想到，这一刻真的来临的时候，我心里是满满的喜悦、平静。其实，在读到惠安的时，我内心有些小波动：惠安和我工作类似，她也面临突击检查，她因为领导的理解、同事的护援而得
论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
30 秒生成旅行计划！AI 代理帮你规划完美行程
在快节奏的现代生活中，高效规划旅行成为大众需求，AI代理凭借技术优势，实现30秒生成旅行计划。本文从技术原理、场景适配、优势亮点、潜在问题及未来趋势五个方面，解析AI代理规划行程的运作机制、适用场景、核心优势，探讨面临的挑战与发展方向，为读者呈现这一便捷工具的全貌，助其了解如何借助AI让旅行规划更轻松。正文一、技术原理：AI代理高效规划的核心支撑AI代理能快速生成旅行计划，背后是自然语言处理技术的
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
使用中转API调用OpenAI大模型的指南
引言近年来，人工智能（AI）技术的飞速发展使得各种大模型（如GPT-4）在自然语言处理领域表现出色。然而，中国用户访问OpenAI的API时经常会遇到网络限制问题。本文将介绍如何通过中转API地址（http://api.wlai.vip）调用OpenAI的大模型，并提供示例代码以供参考。使用中转API调用OpenAI大模型步骤一：安装所需的Python库首先，确保你已安装了openai库。可以通过
【AI大模型：前沿】43、Mamba架构深度解析：为什么它是Transformer最强挑战者？无心水架构 transformer Mamba Mamba架构 AI大模型系统开发实战 AI大模型高手开发 AI大模型系统实战
Transformer架构自2017年诞生以来，一直是NLP、计算机视觉等领域的“统治级”模型架构。但随着序列长度需求的增长（如128K长文本处理、基因组学超长序列分析），其自注意力机制的O(n2)O(n^2)O(n2)计算复杂度成为难以逾越的瓶颈。2023年底，由AlbertGu和TriDao等人提出的Mamba架构，通过创新的“选择性状态空间模型（SelectiveSSM）”实现了线性复杂度（
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博文章数据可视化分析-文章分类下拉框实现 java1234_小锋 NLP NLLP微博舆情分析 python 自然语言处理 flask
大家好，我是java1234_小锋老师，最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程，持续更新中，计划月底更新完，感谢支持。今天讲解微博文章数据可视化分析-文章分类下拉框实现视频在线地址：2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫)视频教程（火爆连载更
《揭秘AI应用架构师在智能虚拟人设计系统中的创新思维》 SuperAGI架构师的AI实验室人工智能 ai
揭秘AI应用架构师在智能虚拟人设计系统中的创新思维关键词：AI应用架构师、智能虚拟人、系统设计、创新思维、自然语言处理、计算机视觉、实时交互摘要：智能虚拟人已从科幻走进现实，无论是直播间的虚拟主播、手机里的智能助手，还是元宇宙中的数字分身，它们背后都离不开AI应用架构师的“隐形设计”。本文将以“总设计师视角”，用生活化的比喻和实例，拆解AI应用架构师在智能虚拟人系统设计中的创新思维——从“让虚拟人
AIGC 领域 AI 写作在电商文案中的应用技巧 SuperAGI架构师的AI实验室 AI大模型应用开发宝典 AIGC 人工智能 easyui ai
AIGC领域AI写作在电商文案中的应用技巧关键词：AIGC、AI写作、电商文案、内容生成、自然语言处理、营销自动化、个性化推荐摘要：本文深入探讨了AIGC（人工智能生成内容）技术在电商文案创作中的应用技巧。文章首先介绍了AIGC的基本概念和发展现状，然后详细分析了AI写作在电商领域的核心应用场景和技术原理。通过具体的算法解析、数学模型和实际案例，展示了如何利用AI技术提升电商文案的创作效率和质量。
Rouge：面向摘要自动评估的召回导向型指标——原理、演进与应用全景大千AI助手深度学习人工智能神经网络 Rouge 文本摘要 Summary 评估
“以n-gram重叠量化文本生成质量，为摘要评估提供可计算标尺”Rouge（Recall-OrientedUnderstudyforGistingEvaluation）是由南加州大学信息科学研究所（ISI）的Chin-YewLin于2004年提出的自动文本摘要评估指标，其核心思想是通过计算生成文本与参考摘要之间的n-gram重叠率，量化摘要的内容覆盖度与忠实度。作为自然语言处理（NLP）领域最权威
甘超波：NLP权谋中谈判流程甘超波
哈喽，大家好我是甘超波，是一名NLP爱好者，每天一篇原创文章或视频，分享我的实战经验和案例，希望给你些启发和帮助今天主要分享权谋中的谈判流程一:什么是谈判？有的伙伴认为:谈判就是勾心斗角有的伙伴认为:只有商业和国家用到谈判还有的伙伴认为:谈判是一种很高大上的方法和技巧这是不同的伙伴对谈判的看法，这些都是不全面的到底什么是谈判？谈判:处理事情设计出一系列巧妙的方法、技巧、流程，让对方配合你、支持你的
Python金融分析：情感分析在量化价值投资中的完整实现 AI量化价值投资入门到精通 python 金融开发语言 ai
Python金融分析：情感分析在量化价值投资中的完整实现关键词：Python金融分析、情感分析、量化投资、价值投资、自然语言处理、机器学习、金融文本挖掘摘要：本文系统解析如何将情感分析技术深度整合到量化价值投资体系中，通过Python实现从金融文本数据采集、预处理、情感建模到策略回测的完整流程。详细阐述基于规则引擎、机器学习和深度学习的多维度情感分析方法，结合财务指标构建复合投资模型，并通过实战案
Rufus算法驱动转化革命：亚马逊卖家的低成本流量破局之道
在亚马逊精细化运营的下半场，流量竞争从“烧钱买量”转向“技术借势”，随着平台内部AI算法Rufus的深度应用，其衍生的“超级转化标签”正成为卖家提升转化率的秘密武器，这项由AI驱动的功能不仅重构了消费者决策路径，更以“零广告成本”的优势，为卖家开辟了一条弯道超车的新赛道。Rufus算法解码：AI如何重塑消费决策路径（一）超级转化标签的技术内核Rufus算法的核心是“评论智能提炼”，通过自然语言处理
打造专属知识库：手把手教你构建RAG系统
RAG通常指的是"Retrieval-AugmentedGeneration"，即“检索增强的生成”。这是一种结合了检索（Retrieval）和生成（Generation）的机器学习模型，通常用于自然语言处理任务，如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统数据收集建立知识库向量检索提示词与模型数据收集数据的收集再整个RAG实施过程中无疑是最耗人工的，涉及到
大模型微调：从零到实践，掌握AI大模型的核心技能之之为知知 12 大模型人工智能机器学习特征工程 pytorch 深度学习大模型微调
大模型微调：从零到实践，掌握AI大模型的核心技能引言大规模语言模型（如DeepSeek、通义千问）的出现，彻底改变了自然语言处理的格局。这些模型不仅在学术界取得了突破性进展，在工业界也得到了广泛应用。对于许多初学者来说，直接训练一个完整的大型语言模型可能显得遥不可及。幸运的是，微调（Fine-tuning）技术为我们提供了一条捷径，让我们可以基于已有的预训练模型，针对特定任务进行调整，从而快速实现
百度文心大模型ERNIE全面解析 KENYCHEN奉孝 python实践大全 AI ERNIE 人工智能后端文心大模型 python
百度文心大模型ERNIE概述百度推出的文心大模型（ERNIE，EnhancedRepresentationthroughkNowledgeIntEgration）系列是结合知识增强技术的预训练大模型，涵盖自然语言处理（NLP）、跨模态、行业应用等多个方向。其开源版本为开发者提供了可商用的大模型能力支持。ERNIE的核心技术特点知识增强：通过多源知识图谱（如百度百科、专业领域数据）注入，提升模型对实
AI办公（综合）课程内容框架建模中… AI-native
AI办公（综合）课程内容框架：深度挖掘与分析一、课程定位深化：从“技能学习”到“价值创造体系构建”传统办公课程聚焦单点工具，本课程定位突破技能培训边界，构建“技术-场景-价值”闭环：-技术穿透性：不局限于AI工具表层操作，深入讲解自然语言处理（NLP）、生成式对抗网络（GANs）等技术在办公场景的底层逻辑，让学员理解“AI为何能优化流程”，而非仅知“如何用工具”。-场景延展性：覆盖内容运营、协作管
Python -- cpython ThirstyBlue python python
［转自］http://blog.donews.com/lemur/archive/category/http://blog.csdn.net/balabalamerobert/article/details/567580CPython源码剖析系列Python源码剖析[1]——编译PythonPython源码剖析[2]——对象机制Python源码剖析[3]——整数对象(1)Python源码剖析[4]
至逝去的伟人——爱因斯坦青岛卫校一七药一
阿尔伯特·爱因斯坦（Albert.Einstein，1879年3月14日—1955年4月18日），出生于德国符腾堡王国乌尔姆市，毕业于苏黎世联邦理工学院，犹太裔物理学家。爱因斯坦1879年出生于德国乌尔姆市的一个犹太人家庭（父母均为犹太人），1900年毕业于苏黎世联邦理工学院，入瑞士国籍。1905年，获苏黎世大学哲学博士学位，爱因斯坦提出光子假设，成功解释了光电效应，因此获得1921年诺贝尔物理奖
人工智能自然语言处理：Transformer 模型详解大力出奇迹985 人工智能自然语言处理 transformer
一、Transformer模型的诞生背景在自然语言处理的漫长征程中，早期的传统模型，如循环神经网络（RNN）及其变体长短时记忆网络（LSTM），曾占据主导地位。RNN试图通过依次处理序列中的每个元素，来捕捉上下文信息。但它存在一个致命弱点，在处理长序列时，会面临梯度消失或梯度爆炸的问题，就像一个长途跋涉的旅人，随着路程的增加，逐渐忘记了出发时的目标和重要信息。LSTM虽然在一定程度上缓解了这个问题
跨境电商 ai架构设计 Java程序员拥抱ai ai 人工智能
一、核心理论基础AI生成知识库的本质是**“数据驱动的知识结构化与智能化生产”**，核心依赖三大理论支撑：知识工程理论将跨境电商业务中分散的“非结构化信息”（如产品参数、用户评价、物流规则、合规条款）转化为“结构化知识”（如实体关系、规则库、决策树），通过AI实现知识的自动提取、关联与更新。例：家具用品的“材质-环保标准-目标市场合规要求”（如欧盟E1级板材认证）可形成关联知识链。自然语言处理（N
字节跳动Coze平台：零代码打造AI智能体小小怪 @ 人工智能
Coze，这是一个由字节跳动推出的AIBot开发平台。它允许用户快速构建、部署和管理自定义的AI聊天机器人（智能体），支持多种功能，如自然语言处理、知识库集成和任务自动化。1.什么是智能体Coze？定义：Coze是一个低代码/无代码的AI开发平台，专注于创建“智能体”（即AIagent）。这些智能体可以模拟人类对话、执行任务（如信息查询或自动化流程），并通过API或插件集成到各种应用中。核心优势：
深度剖析AI人工智能情感分析的算法原理 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构人工智能算法 easyui ai
深度剖析AI人工智能情感分析的算法原理关键词：情感分析、自然语言处理、机器学习、深度学习、文本分类、情感词典、BERT摘要：本文将深入浅出地讲解AI情感分析的技术原理，从基础概念到核心算法，再到实际应用。我们将探索计算机如何理解人类情感，分析文本背后的情绪色彩，并介绍当前最先进的情感分析技术。通过生活化的比喻和代码实例，帮助读者全面理解这一AI领域的重要应用。背景介绍目的和范围情感分析(Senti
数据分析领域如何借助AI人工智能升级 AI天才研究院 ChatGPT 计算 AI大模型应用入门实战与进阶数据分析人工智能数据挖掘 ai
数据分析领域如何借助AI人工智能升级关键词：数据分析、人工智能、机器学习、自动化分析、智能决策、数据预处理、预测分析摘要：本文系统阐述数据分析领域如何通过人工智能实现技术升级。从传统数据分析的瓶颈出发，解析AI驱动的核心技术架构，包括自动化数据预处理、智能特征工程、预测分析模型、自然语言处理在数据分析中的应用。通过具体算法实现、数学模型推导和项目实战案例，展示AI如何提升数据分析效率、挖掘数据深度
进阶向:基于Python的电脑硬件监控工具（GUI + 系统信息采集）超级小识 Python进阶有趣的项目 python php 开发语言
引言在科技飞速发展的今天，人工智能已经渗透到我们生活的方方面面，从基础的日常沟通到复杂的商业决策，智能技术的影响力正在以惊人的速度扩大。以自然语言处理为例，智能助手不仅能理解人类的日常对话，还能通过情感分析提供个性化的回应；在医疗领域，AI辅助诊断系统的准确率已达到专业医师水平，极大地提高了早期疾病筛查的效率。面对这场深刻的技术变革，理解其背后的逻辑与应用场景变得至关重要。从技术角度看，机器学习算
周三 2020-01-01 09:30 - 23:00 多云 03h35m 么得感情的日更机器
南昌。二〇二〇年一月一日基本科研[1]:1.论文阅读论文--小时2.论文实现论文编写--实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:开题报告--英语能力[2]:1.听力--十分2.单词--三分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正
自然语言处理技术应用领域深度解析：从理论到实践的全面探索
1.引言：自然语言处理的技术革命与应用前景自然语言处理（NaturalLanguageProcessing，NLP）作为人工智能领域的核心分支，正在以前所未有的速度改变着我们的数字化生活。从最初的规则基础系统到如今基于深度学习的大语言模型，NLP技术经历了从理论探索到实际应用的深刻变革。在当今信息爆炸的时代，人类每天产生的文本数据量达到了惊人的规模，如何让计算机理解、处理和生成人类语言，已经成为推
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http