yuyuyu_xxx

NLP论文阅读记录 - 2022 | WOS 04.基于 XAI 的强化学习方法，用于社交物联网内容的文本摘要

文章目录

前言
0、论文摘要
一、Introduction
- 1.1目标问题
- 1.2相关的尝试
- 1.3本文贡献
二.相关工作
三.本文方法
- 3.1 总结为两阶段学习
- - 3.1.1 基础系统
- 3.2 重构文本摘要
四实验效果
- 4.1数据集
- 4.2 对比模型
- 4.3实施细节
- 4.4评估指标
- 4.5 实验结果
- - 4.6 细粒度分析
五总结
思考

前言

XAI-Based Reinforcement Learning Approach for Text Summarization of Social IoT-Based Content（2204）

0、论文摘要

自动文本摘要技术的目的是压缩给定的文本，同时在摘要中正确地描绘原始文本中的主要信息。另一方面，目前的生成文本摘要方法在构建摘要句子时重构原始语言并引入新单词，这很容易导致不连贯和可读性差。）这项研究提出了一种基于 XAI（可解释人工智能）的强化学习，使用强化学习对基于社交物联网的内容进行文本摘要。此
外，基于标记数据来提高摘要句子连贯性的标准监督训练具有巨大的数据成本，这限制了实际应用。为了做到这一点，提出了一种基于真实情况的文本摘要（生成）模型（XAI-RL）以增强连贯性。
一方面，根据原文的编码结果，生成句子提取标识符，描述原文重要信息的筛选过程。在确定两种类型摘要文章的整体效益后，自判断方法梯度帮助模型学习关键句子选择并解码所选关键短语，从而产生句子连贯性高、内容质量好的摘要文本。
实验表明，即使没有预先注释的摘要事实，该模型的摘要内容索引总体上优于文本摘要方式；信息冗余、词汇原创性和抽象复杂性也优于当前方法。

一、Introduction

1.1目标问题

随着互联网的快速发展，网络中蕴藏着海量的基础、形式多样的数据内容。从中快速定位关键信息是高效信息检索的首要问题。对于文本数据来说，自动文摘技术可以从给定的语料库中提取出核心内容，并用相对概括的文本来描述原文的主要内容，有利于降低文本数据的存储成本，是提高文本数据质量的必要手段。文本数据检索的效率。对于进一步实现信息集成具有重要的现实意义和应用价值。
现有的自动文本摘要方法可以直接从原始文本中选择基本句子或段落，并通过句子提取生成摘要文本[1]。生成文本摘要方法已成为文本摘要领域的研究热点[2]。一般来说，生成文本摘要方法首先对给定的原始文本进行编码，获得可以从词和句子层面覆盖原始文本信息的向量（嵌入）表示。最后对上述特征码进行解码，即根据解码结果，从给定的语言（词典）中选择相应的词汇，形成摘要文本。最后，将原文以文本形式重新表达。可以看出，与提取方法相比，生成文本摘要的实现更为复杂。尽管如此，它产生的摘要文本词汇表达更加灵活和丰富，浓缩原文关键信息的效果也更加理想[3]。
但面临的问题是，生成式文本摘要方法需要经过原文编码、编码解析、特征解码等过程，组织词汇量更丰富的句子来传达原文，因此很容易导致生成的摘要句子的连贯性。此外，当前的生成式文本摘要方法涉及人工注释摘要以进行监督训练[3]，导致现有的生成式文本摘要方法经常面临问题。由于宝贵资源的稀缺，仅依靠预先句子连贯性较强的“摘要真值”，并根据监督训练的方法来提高模型生成的摘要的句子连贯性，在实际中可能存在很大阻力。应用[4]。因此，本文在生成文本摘要模型的基础上，寻求一种无需干预即可提高摘要生成模型句子连贯性的有效机制。
具体来说，一方面，在摘要文本生成阶段，编码器（模块A）首先对给定的源文档（source document）进行编码，得到原始文本的嵌入表示；在此基础上，进一步使用连贯性测量模块（模块B）e Transformer-XL [5]编码器对原文的嵌入表示进行编码，解析上下文相关的内容特征，并设置一个“关键句分类层” ”位于连贯性测量模块的顶部，生成句子提取标识符，过滤掉（或成为关键）句子编码结果，描述通过连贯性测量模块从原文中提取关键句子的过程；最后，解码器（模块C）基于一致性测量模块输出的关键句编码。并生成“提取”的关键句子的解码结果，即原始词汇分布。
另一方面，在句子连贯性增强阶段，模型XAI-RL首先获得前一级解码器（模块C）输出的原始词汇分布，并通过“按概率选择”和“按概率选择”生成两种类型的摘要文本。 Softmax-greedy”，两种类型的摘要由编码器（模块 A）重新编码；之后，由一致性测量模块(模块B)解析两类摘要的重编码结果，由一致性测量模块(模块B)解析两类摘要的重编码结果。 )e语义片段（segment）[5]的循环自注意力权重作为摘要句的连贯性效益；将生成的摘要文本的ROUGE[6]得分和“伪摘要真值”作为摘要句子的内容收益，从而通过连贯性测量模块将上述两项收益相加，计算出两种类型摘要文本各自的总体优势；这里，“伪摘要的真实值”是通过ROUGE评分从原文中提取的最优句子集。其次，构建两类摘要的“交叉熵损失”，采用XAI-Based强化学习中的“自我批评策略梯度”[7]，并利用两类摘要的“总体回报差异”奖励或奖励模型参数梯度。 Penalty是迫使“Softmax-贪婪选择”生成的摘要的整体恢复接近“概率选择”生成的摘要的整体恢复，并通过“概率探索”提高“Softmax-贪婪选择”的总体基线水平，”，然后在句子连贯性和句子内容方面提高 XAI-RL 生成的摘要文本的模型值。最终在没有抽象真值介入的情况下，生成句子连贯性高、内容质量好的抽象文本。

1.2相关的尝试

1.3本文贡献

总之，我们的贡献如下：
综上所述，本文提出了一种面向连贯性增强的无真值文本摘要模型（XAI-RL），该模型结合“提取和生成”，根据从原文中提取的关键句子集生成摘要内容。同时，通过对最初生成的摘要文本进行重新编码、连贯性和内容收益计算，基于解码器的实际词汇分布，得到“通过概率选择”与“通过Softmax-贪婪选择”进行比较。 “获得优势”通过最大化这种“利润优势”来指导模型梯度更新，以生成具有更高句子连贯性的摘要文本。实验结果表明，即使在仅给定原文的限制下，XAI-RL模型的ROUGE[6]和METEOR[8]评分指标总体上仍然优于现有的文本摘要方法。摘要文本在句子连贯性、内容重要性、信息冗余、词汇新颖性和摘要困惑度方面也优于现有方法。

二.相关工作

目前，基于“编码-解码”思想的序列到序列（Seq2Seq）结构是处理生成文本摘要任务的主要方法[3]。传统Seq2Seq结构中的编码器和解码器通常使用循环神经网络（RNN）[9]、长短期记忆（LSTM）[10]和双向长短期记忆（Bi-LSTM） [11]，为了生成句子质量更好的摘要文本，许多学者对上述摘要和基于循环神经网络及其变体的生成模型进行了相关改进。
作者[12]提出了一种分层编码器，可以从单词和片段两个级别捕获输入文本的语篇结构，并将语篇结构特征注入解码器以协助解码器生成摘要文本。高 ROUGE 分数是在开发学术论文摘要的任务上取得了成就。作者[13]在解码器端引入了解码器内注意力机制，即在解码第t位时观察解码结果的前t-1位，注意力权重防止解码器生成重复内容，这有效减少摘要文本句子内容的冗余；同时，本文结合Teacher Forcing算法[14]和自判断策略梯度[7]构建了混合XAIBased强化学习目标，使得模型在处理原始文本时有效避免暴露偏差，并生成摘要文本，评价准确度高。作者[15]首先将输入的原始文本分为多个片段，并基于Bi-LSTM，模型构建多个代理；之后，每个智能体解析分配的元素，并根据多智能体通信机制在智能体之间传输该部分的解析结果，最终形成原文的“全局观察”，定义为“全局观察” ”根据“编码-解码”的思想生成摘要文本。
尽管上述模型在摘要生成的准确性方面取得了提高，但循环神经网络及其变体都是基于时间步的序列结构，这严重阻碍了模型的并行训练[16-18]，导致推理能力下降。过程受到内存的限制，导致摘要生成模型的编码和解码速度降低，并增加训练开销[19-23]。另一方面，上述工作优化模型以最大化ROUGE指数或最大似然，而不考虑摘要句子的连贯性或流畅性[24-26]并依赖于预先注释的摘要文本的ground-truth值。在有监督训练的情况下，模型训练所涉及的数据成本很高。）因此，需要进一步改进基于循环神经网络及其变体的摘要生成模型[27-29]。
关于摘要句子连贯性的工作还包括：作者通过对原始文本进行编码、解码和重新编码来优化模型，构建摘要相似性损失和文本重建损失。一个好的语言模型会计算生成的摘要文本的负对数似然来衡量句子的连贯性；作者使用BERTSCORE指标构建分布式语义增益，并将支付与自判断策略梯度相结合来评估模型优化。人类评估结果表明，这种好处可以使模型摘要更加连贯；作者在预训练解码器后，通过在句子级别应用优势演员评论家 (A2C) 来优化提取器，以确保模型解释正确的关键句子以生成连贯且流畅的摘要 [30, 31]。
上述模型优化了摘要的连贯性，以最大限度地减少生成的摘要文本的复杂性。但值得注意的是，现有作品在评估摘要句子的连贯性时均采用人工评估方法。）摘要生成模型中缺乏自动测量句子连贯性的机制或过程[32-34]。综上所述，当前的生成文本摘要方法应满足或解决以下问题：第一，能够根据给定的原文生成连贯且可读性强的摘要文本；对生成的摘要句子进行自动一致性测量的处理机制；第三，应尽量减少模型训练过程中摘要真实数据的标签依赖性，以降低模型训练成本[35-37]。

三.本文方法

3.1 总结为两阶段学习

3.1.1 基础系统

3.2 重构文本摘要

四实验效果

）这一章对本文提出的用于增强连贯性的依赖于事实的文本摘要模型（XAI-RL）进行了一系列实验分析，并讨论了该模型在摘要生成过程和摘要生成质量方面的有效性。）论文使用Python 3.7和Tensorflow-1.15来实现模型，实验运行环境为GPU，NVIDIA GeForceGTX 1080Ti，11 GB。

4.1数据集

首先，本文使用两个典型的自动文本摘要数据集 CNN/Daily Mail 和 XSum 进行实验[41, 42]。）它们都使用新闻报道作为文本数据，并包含相应的“黄金标准”摘要事实文档。本文将原始数据集分为训练集、验证集和测试集。）训练集用于模型训练，验证集用于模型参数选择，测试集用于模型评估。特别是，“黄金标准”摘要确实不参与模型XAI-RL训练过程，仅用于摘要生成质量评估。如表1所示，CNN/Daily Mail中原文和摘要文本的平均长度大于XSum； XSum 是人类编写的作为概念真值的句子。与 CNN/DailyMail 相比，XSum 中的 groundtruth 的新颖性更高，并且包含更多原文中未出现的单词。
其次，在模型设置方面，设词向量维度为E，隐藏层单元数量为H，自注意力头数量为A，前馈层维度大小为F，XAI-RL模型采用ALBERTlarge[30]（E = 128，H = 1.024，A = 16，F = 4.096）作为编码器，相干性度量模块由L = 3层Transformer-XL编码器组成（E = 1.024，H = 2.048，A = 32，F = 4.096），解码器由 R = 6 Transformer-XL 解码器组成（E = 1.024，H = 2.048，A = 32，F = 4.096）。在摘要文本生成阶段，使用宽度为4的束搜索算法进行词汇选择。）生成摘要的最大长度由原始文档和摘要文档在数据集中的平均压缩比（文档长度的比率）决定，并且丢弃的词数较低。在第3句中，相干性度量模块和解码器采用Adam优化器[19]，学习率分别为1E-3和0.05。 )e 两者的学习率都随着迭代次数的增加而降低。）e个batch样本数（batch_size，即输入文本集D的大小）为16。在句子连贯性增强阶段，β1 = 0.3和β2 = 0.2取自式（6）所示的文本内容收益，式（6）的总收入中c = 0.7。当使用 CNN/Daily Mail 数据集训练模型时，输入文本集 D 在一次迭代中取前 M=8 个最优记录，用于一致性增强阶段的“体验回放”；当用XSum训练时，D在一次迭代中，取前M=4个最优记录。

4.2 对比模型

)en，在比较方法方面，本文提出的摘要生成模型XAI-RL与现有的提取式和生成式自动摘要方法进行了比较。其中，对于提取方法，使用了MMS_Text、SummaRuNNer和HSSAS；对于生成方法，Pointer-Generator + Coverage、Bottom-up、DCA（深度通信代理）、BERTSUMEXTABS 和 PEGASUS。

4.3实施细节

4.4评估指标

最后，对于评价指标，本文采用ROUGE-N[6]（包括ROUGE-1和ROUGE-2，式（12））、ROUGE-L（式（13））和METEOR[8]（式（14）））。 )e指标评估生成文本的内容质量，同时配合人工评估，从句子连贯性、内容冗余度、内容重要性等方面评估相关模型生成的摘要文本。这里，在ROUGE-N中，n表示n-gram（n-gram）的长度，{RS}表示参考摘要，Countmatch（grain）表示生成的摘要中与参考摘要中相同的n-gram数量，Count(grain) 是参考摘要中 n 元语法的总数。 ROUGE-L中，X为生成摘要，Y为参考摘要，LCS(X,Y)表示生成摘要与参考摘要之间的最长公共子序列的长度，m为展开摘要长度，n为参考摘要长度； METEOR中，m为生成摘要中与参考摘要匹配的元组数量，r为连接摘要长度，c为展开摘要长度，α、c、β为平衡参数，dh为生成概念和参考摘要公共子序列的数量。

4.5 实验结果

为了探索XAI-RL模型中不同模块对实验结果的影响，本文实现了如表2所示的六种烧蚀组合。具体来说，组合1使用模块A（AL-BERT编码器）和模块B（相干性度量模块，仅Transformer-XL编码器）进行编码，而没有可替换的顶层进行编码，然后使用模块C（解码器）进行编码和解码以产生摘要。组合2在组合1的基础上向模块B添加了一个sigmoid分类层，其目的是对文本编码表示进行关键句子选择，然后生成摘要。组合3与组合2结构相同，但预训练了模块B；特别地，上述三种组合都是使用训练集“金标准”作为ground Truth的监督训练。最后，组合4采用组合3的结构。除了预训练模块B之外，仅通过最大化相干增益来进行相干增强。在强化过程中，将提取的伪摘要作为替代真值；组合5与组合4类似，只是通过最大化内容收益来增强连贯性；组合6是图1中完整的XAI-RL模型，仍然使用提取的伪摘要作为替代真值。

CNN/Daily Mail 和 XSum 验证集评估了上述六种烧蚀组合。 )e实验结果如表3和表4以及图3和图4所示。
首先，组合2的评估结果优于组合1，这表明在模块B提取关键句子后，解码器可以解码关键内容并生成更高质量的摘要。其次，组合3优于组合2，说明预训练可以使模块B的参数配置更加合理，进而更加合理地选择关键句子。 )en，组合4和组合5的评价结果优于组合3，表明本文构建的收益和句子连贯性增强方法能够有效提高摘要内容的质量。特别是组合4的ROUGE-L和METEOR指标优于组合3，体现了本文通过连贯性测量和强化对句子连贯性的提升。最后，所有机制6的组合具有最佳评估结果，反映了所提出的模型XAI-RL的每个模块在摘要生成中的有效性。
综上所述，对于XAI-RL模型，首先通过比较组合二和组合三可以发现，通过伪摘要对连贯性测量模块进行预训练后，可以更好地从组合二和组合三中识别出有意义的句子和上下文语义信息。文本编码表示，为解码器提供语义基准和辅助输入，生成能够准确概括原文主要思想的摘要内容；其次，通过比较组合三和组合四，可以发现self.

4.6 细粒度分析

4.3. XAI-RL 模型与现有文本摘要模型的比较。在本节中，XAI-RL模型的准确性与测试集上现有的提取和生成方法进行比较，以评估其摘要生成质量。首先，XAI-RL模型的评估结果（3次平均值）以及在CNN/Daily Mail数据集上的比较方法如表5所示（ROUGEAVG是ROUGE-1、ROUGE-2和ROUGE-的平均值）L）。一方面，如图5所示，XAI-RL模型的评估结果普遍优于现有的提取方法。）模型在ROUGE-1和ROUGE-2指标上优于其他基于提取的基线模型，表明其能够有效获取原始受试者信息。

五总结

利用自动文本摘要技术浓缩文本核心内容是降低文本数据存储成本、提高信息检索效率的必要手段。为了快速生成高质量且可读的文本摘要，同时避免模型训练的真实依赖，本文提出的基于 XAI-RL 的连贯性增强文本摘要模型（XAI-RL）利用注意力机制的 Transformer-XL 来构建一致性测量模块，并使用提取的伪摘要对其进行预训练，可以有效地识别和去除重要的文本信息。此外，它可以在重编码过程中自动衡量生成摘要的连贯性，并产生文本连贯性效益，可以将其引入到模型的连贯性增强过程中，从而可以促进模型生成更接近原始主题，更具可读性的摘要内容。实验表明，在多组实验中，结合相干性度量和相干性增强的XAI-RL模型的评估精度优于其他现有方法。）本文未来的工作将进一步提高自注意力权重在相干性测量上的有效性。通过构建各种测量方法，从多个角度考虑语义连接、语法规则性和共指消歧等连贯性因素，以提高下一代模型的句子连贯性。
同时，其在ROUGE-L和METEOR指标上的得分高于其他基于提取的基线模型，这表明该模型在释义获取的重要句子时能够保证生成句子的连贯性。对比提取方法（MMS_Text、SummaRuNNer、Refresh、HSSAS）的核心思想可以概括为三类：一是将文本转化为图结构（如MMS_Text），通过对节点（句子）进行评分来提取本质形成摘要文本的句子；二是通过编码器挖掘读者的潜在特征，按照概率矩阵或句子排列的顺序提取摘要句子（例如SummaRuNNer和HSSAS）。第三是使用基于XAI的强化学习来构建质量增益，并在更新句子选择策略以最大化利润后，从原始文档中提取摘要文本（例如Refresh）。然而，对于本文提出的XAIRL模型来说，其核心思想是“先提取，后生成”。）模型的连贯性测量模块可以在预训练后识别并提取原文中的关键句子，从而提示解码器关注实际内容。另外，在解码和生成时，XAI-RL模型向解码器输出包含上下文语义的辅助信息H，进一步丰富了模型内部的文本特征信息，最终使得模型XAI-RL生成的摘要文本的质量强化学习优于“单一”提取模型。另一方面，如图6（b）所示，XAI-RL模型与现有的生成方法（Pointer-Generator + Coverage [11]、Bottom-up、DCA [15]、BERTSUMEXTABS [19]和PEGASUS）并且总体上也取得了更好的精度。 )e模型在ROUGE-1和ROUGE-2指标上优于其他生成基线模型，表明它可以正确地解释原始文本消息。同时，其在 ROUGE-L 和 METEOR 指标上的得分均高于其他生成基线模型，这表明该模型更能够生成连贯且流畅的摘要内容。其性能提升可以归因于：首先，在开发摘要方面，如图2所示，模型XAI-RL基于预训练组件（如AL-BERT编码器和预训练相干性测量模块），并且进一步使用文本编码结果。 )e语义段是划分单元，由L�3layer Transformer-XL组件通过基于语义段的循环自注意力机制进行额外编码，以增加特征解析的强度。其次，在图4所示的连贯性增强过程中，模型XAI-RL对生成的摘要文本进行重新编码，以计算连贯性增益；同时，使用提取的伪摘要创建摘要，通过最大化两者来计算内容增益。）收入的加权总和增强了模型摘要文本生成过程。此外，它从内容和句子连贯性水平提高了模型文本生成质量。
其次，XAI-RL模型和对比方法在XSum数据集上的评估结果（3次平均值）如表6所示，相应的直方图如图6所示。总体而言，模型仍然达到了最优结果。特别是，XSum 数据集仅用于测试生成方法，因为它具有与“黄金标准”摘要相对应的高度新颖性。表6和图6的结果进一步说明了模型XAIRL所遵循的“先提取，后生成”的设计原则，基于语义分段的循环自注意力权重，以及基于内容效益和连贯效益的强化过程可以有效提高摘要生成质量。

思考

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
神奇的平静漫步的小马驹
我们七组色香味俱全的特色菜百家宴我们七组的仙女们仙女们在舞动上图是今晚上海nlp课堂的晚会照片。熟悉的场地，熟悉的伙伴们。只是，我从画面里，跑到了画面外。决定不去二阶的时候，我以为在这样的时刻，我会有很多情绪：郁闷、遗憾、羡慕、纠结……没想到，这一刻真的来临的时候，我心里是满满的喜悦、平静。其实，在读到惠安的时，我内心有些小波动：惠安和我工作类似，她也面临突击检查，她因为领导的理解、同事的护援而得
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
新一代数据库：融合多模智能，重塑数据价值
一、场景重塑产业格局：数据库“融合进化”AI浪潮奔涌而至，数字产业格局加速重构。云计算、移动互联、万物互联（IoT）、人工智能（AI）等技术的深度融合与快速落地，正以前所未有的速度重塑着企业的应用形态。新业务场景层出不穷——从高并发的在线交易、实时精准的分析决策，到海量物联网设备监控、基于图关系的风控反欺诈，再到AI驱动的智能推荐与内容生成，应用场景的多样性与复杂性已突破传统数据库的能力边界。这对
基于知识图谱技术增强大模型RAG知识库应用效果罗伯特之技术屋知识图谱人工智能
【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr