末世灯光

论文阅读---《Snippet Policy Network for Multi-classVaried-length ECG Early Classification》

题目

片段策略网络用于多类别不定长心电图早期分类

摘要

心电图心律失常检测是心血管疾病预防和诊断中的重要研究课题。目前的研究将心电图心律失常检测定式为时间序列分类问题。与此同时，心律失常的早期检测在早期预防和诊断方面呈现出真实世界的需求。在本文中，我们解决了心血管疾病早期分类问题，该问题也是一个不定长和长时序的早期分类问题。为了解决这个问题，我们提出了一种基于深度强化学习的框架，即片段策略网络（SPN），由四个模块组成：片段生成器、主干网络、控制代理和鉴别器。与现有方法相比，所提出的框架具有灵活的输入长度，解决了早期性和准确性目标的双重优化问题。实验结果表明，SPN在准确性方面表现出超过80%的优异性能。与现有最先进的方法相比，所提出的SPN在不同指标（包括精确度、召回率、F1分数和调和平均值）上至少改善了7%。据我们所知，这是首个以不定长心电图数据为基础解决心血管早期分类问题的研究。基于SPN的这些优秀特性，它为解决各种不定长时间序列早期分类问题提供了良好的示范。

引言

近年来，心血管疾病（CVDs）的发病率急剧增加，由于高死亡率，已成为人类生命的重大威胁。提前对患者进行CVDs的持续监测已被证明是挽救生命的有效措施。心电图（ECG）[1]是一种常见的非侵入性测量方法，反映了心脏的生理状态，也是当前时代最重要的诊断工具之一。近年来，随着智能可穿戴设备的发展，患者可以普遍获取ECG设备进行个人健康监测。尽管ECG信号易于收集，但医疗专业人员和心脏病专家仍然面临分析如此多样化数据的挑战。因此，自动ECG分类建模已成为研究界的重要课题。

时间序列是一种常见的数据格式，用于表示心电图信号，它是按时间戳顺序排列的信号强度值的集合。心电图分类或心血管疾病检测问题可以被定义为时间序列分类问题。这是一个将预定义类别之一分配给时间序列的问题，例如将心电图运动信号分类为正常或即将发生的心房颤动[2]，或将来自不同患者的信号分类为患有慢性阻塞性肺疾病与否[3] [4]。传统的时间序列分类方法适用于给定的固定长度时间序列，并假定在做出决策时可以访问整个输入时间序列。然而，在许多情况下，它无法满足实际需求。例如，在重症监护室（ICU）中，由于不同患者在不同时间和时长进行监测，这导致生成不定长时间序列数据。在时间敏感的应用中，尽早做出决策对于提高实用性至关重要。例如，早期诊断可以为患者提供及时有效的治疗，这对于许多心脏疾病来说是至关重要的，因为它们在短时间内可能致命。因此，对心电图信号进行早期时间序列分类是一个重要的研究问题。在这项研究中，我们专注于解决早期时间序列分类问题，旨在通过尽量少地查看数据来尽早对时间序列进行有信心的分类。

早期时间序列分类（eTSC）具有两个明显的目标：早期且准确地对给定的时间序列进行分类。然而，时间序列需要尽早分类，就会提供较少的数据点用于这个任务，这通常会导致较低的准确性。相反，如果希望达到更高的分类准确性，则需要更多的测量数据，并且决策将在较晚的时间做出。显然，这两个目标在本质上是相互矛盾的。在早期时间序列分类中，高度具有挑战性的问题是确定何时能够正确地对传入的时间序列进行最早的分类。以患者护理为例；收集更多要分析的患者的生理信号自然会导致更准确的诊断，但可能会错过为挽救生命而准备紧急计划的宝贵时间。

大多数现有的eTSC方法，比如[5]、[6]、[7]、[8]，假设所有被分类的时间序列都有一个定义好的起始时间。因此，这些方法假设特征模式在所有时间序列中大致以相同的偏移出现，并试图找到训练集中每个时间序列的固定部分。在这种设置下，早期性的阈值取决于分类的平均准确率，这意味着它并没有设计为找到最优解决方案。例如，监测传感器在不同患者的时间序列中以任意时间点开始观察，而特征模式会在时间序列的任意时间点出现。直观地说，现有方法被期望在观察设备同时启动并且特征模式同时出现时分析时间序列；而在心血管疾病监测应用中，心电图信号可能会在任意时间收集。在这种情况下，使用现有方法来解决心电图早期分类问题是次优的。

在本文中，为了解决上述问题，我们提出了一个片段策略网络（SPN），如图1所示，它采用深度强化神经网络模型，从不定长的心电图信号中学习多变量信息。所提出的框架包括四个模块：片段生成器、主干网络、控制代理和鉴别器。为了很好地对心电图信号进行建模，以体现其周期性，我们使用片段生成器将原始时间序列分割成片段序列。然后，为了捕捉片段内部的空间依赖性和片段之间的时间依赖性，我们构建了一个将卷积网络和循环网络结合起来的主干网络，用于学习隐藏表示。为了找到适当的预测时间点，一个代理控制主干网络的整个过程并通知鉴别器。最后，鉴别器接收控制代理的通知，并根据主干网络中的隐藏表示产生预测结果。

本文的贡献如下：

1. 我们解决了基于不定长心电图信号尽早进行心血管疾病分类的问题，这在研究界尚未得到充分探索。

2. 为了解决心电图早期分类问题，我们提出了一个新颖的深度强化学习框架，由片段生成器、主干网络、控制代理和鉴别器四个模块组成。

3. 控制代理解决了早期性和准确性目标之间存在冲突的双目标优化问题的解决方案。它使模型能够既准确地分类心血管疾病，又能够找到更早的时间点进行预测。

4. 所提出的模型在一个公开的心血管疾病分类数据集上进行了评估，并展示了在分类不同心血管疾病方面的性能。实验结果表明，所提出的框架胜过了现有的最先进方法。

本文的其余部分组织如下：第2节简要概述了现有的相关工作。第3节介绍了所提出的SPN框架的架构，而实验评估结果则在第4节中描述。本文的结论总结在第5节中。

方法论

问题表述

心电图早期分类是多变量早期时间序列分类问题的实际应用。多变量时间序列，比如多导联心电图信号，反映了特定个体的生理状态。在这个问题中，模型被要求尽早从不定长的心电图记录中预测正确的类别。给定一组带有标签的多变量时间序列（心电图信号），表示为 D = (X, y)，其中包含 N 个时间序列实例，X(i)，i = 1, . . . , N，以及相应的标签，y(i)，i = 1, . . . , N。对于每个样本 X(i)，每一个i中包含在时间戳 l 记录的 M 个变量，L 表示给定时间序列的长度。eTSC 的目标是学习一个模型 fθ，其中参数为 θ，它可以从时间序列 X 中生成一个标签 yˆ，使得 l < L。

模型架构

所提出的模型名为"Snippet Policy Network"（SPN），由三个功能部分构成。首先，用于生成给定心电图信号的片段；其次，用于对心电图片段进行分类建模；第三，选择一个终止片段以进行任务相关的适当预测。具体而言，片段策略网络是一个深度神经网络，由四个子模块组成：（1）片段生成器，将多变量时间序列分割为子序列，即片段；（2）主干网络，基于片段生成器的输出连续地对多变量片段进行建模，生成隐藏表示；（3）控制代理，在每个片段上控制整个过程，决定是否中断主干网络并输出最终结果；（4）鉴别器，在控制代理决定激活它时，为给定片段输出最终预测结果。我们提出的架构概览如图2所示。

片段生成器

心电图信号是一种具有周期性特征的特殊多变量时间序列，因为它反映了心脏的生理活动。为了很好地分析这种类型的数据，我们提出了片段生成器，它根据周期性将原始时间序列分割成单独的子序列段。对于心电图数据，片段可以生成为基于心跳的子时间序列，这意味着每个片段代表一个单独的心跳。片段生成器的输入是一个时间序列样本X(i)，输出是片段集合B(i)。每个b(i) ∈ B(i)都继承自X(i)，并且共享相同的标签y(i)。在本文中，我们的重点不在心跳检测上，而是采用了[20]中提出的现有方法。参考[20]中的QRS检测方法，从每个心电图信号中提取心跳，然后按时间顺序排序。

主干网络

主干网络旨在对每个片段的局部空间依赖性以及跨片段的全局时间依赖性进行建模，以生成有价值的隐藏表示。在主干网络中采用了多层卷积网络，以学习输入片段的每个变量之间的关联关系，并捕捉隐藏的空间状态。随着心电图问题的不同尺度出现，卷积网络的深度和设计将根据具体的目标而变化。值得注意的是，我们提出的模型被设计成与各种卷积神经网络兼容。此外，为了在不同的片段之间传播信息，还设计了一个循环网络（LSTM），以利用卷积网络生成的隐藏空间状态并生成时空隐藏状态。

卷积神经网络块

CNN块旨在学习内部片段的空间依赖性，并输出片段的空间隐藏状态St。主要由卷积层和池化层组成，负责自动从心电图信号的片段中提取有效的隐藏状态。卷积层可以被视为模糊滤波器，捕捉输入心电图信号的每个片段的局部空间依赖性并减少噪声。池化层旨在减小特征映射的维度并总结卷积层生成的关键特征。具体的网络结构和参数在第4节中详细说明。简而言之，来自心电图信号X的输入片段bt被馈送到CNN块，然后转换为低维的隐藏状态St。CNN块的输出可以表示为：

长短时记忆块

在CNN块之后，一个使用长短时记忆（LSTM）[21]单元扩展的递归网络传播片段信息，将在每个片段生成的空间隐藏状态映射到一个代表时间状态信息的隐藏向量表示。递归网络学习将每个片段的隐藏空间状态编码为隐藏时间表示，作为状态向量。隐藏状态向量Ht通过组合当前片段的空间隐藏状态St和先前的隐藏状态H(t−1)来计算，因此具有循环性质。LSTM块传递H(t−1)的信息并记录St的信息。因此，Ht是综合内部片段空间依赖性和片段间时间依赖性的空间-时间隐藏向量状态。然后，空间-时间隐藏状态Ht传递给下一个模块，称为控制代理，以操纵输出决策，以及鉴别器以输出预测结果。具体来说，隐藏状态向量Ht可以如下获得：

其中，St是由卷积神经网络块产生的隐藏空间状态，Ht−1表示LSTM单元内在时间t - 1的输出和状态。

控制智能体

控制代理是控制工作流程的关键组件，决定是让主干网络继续工作还是激活鉴别器生成预测结果。为了实现这个目标，我们采用强化学习技术[22]，解决部分可观察的马尔科夫决策过程（POMDP）[23]。输入心电图信号的每个片段的空间-时间隐藏状态可以看作是一个独立的状态；通过使用经过良好学习的策略选择每个状态的动作，并根据所选动作的质量获得奖励。控制代理通过梯度基于策略的学习进行训练，其目标是根据鉴别器的性能优化长期奖励。给定强化学习框架的关键组件如下所述。

状态

在强化学习中，状态是任务当前环境的表示，描述了当前的情况。在我们的情况下，代理的状态是当前感知的片段集合，即O1、O2、...、Ot，实质上是主干网络的输出。在这里，将编码空间和时间信息的空间-时间隐藏状态Ht作为观察值。这是决定根据学习策略选择动作的核心信息。

决策

策略是控制代理根据当前状态确定下一步动作的策略。减少状态数量的一种好方法是使用基于神经网络的策略[24]，其中输入是状态，输出是动作。在这里，策略通过当前状态Ht选择一个动作，即at = πθ(Ht)。如前面的部分介绍，Ht是编码内部和相互依赖性的低维隐藏状态，用于表示心电图信号片段。在这项工作中，我们采用全连接神经网络来近似这个策略函数。这里的策略是一个将当前状态Ht映射到一组动作的参数化分布的函数。

动作

动作是控制代理在每个状态下可以执行的操作。在以下情况下，动作控制主干网络和鉴别器之间的整个过程：如果at = 0，代理会前进到下一个观察值，继续将片段输入主干网络，然后获取相应片段的空间-时间隐藏状态。另一方面，如果at = 1，代理选择中断主干网络，然后通知鉴别器通过馈送隐藏向量状态Ht来预测标签。然后，近似概率πt适合伯努利分布，以根据P(p = 1) = πt对动作进行采样。一旦根据伯努利分布的输出，当代理选择中断主干网络或者观察系列结束（t = T）时，t被视为中断时间点τ。

奖励

奖励是量化当前策略参数的度量方式。为了增强代理和鉴别器之间的协作，代理必须观察鉴别器的反馈，并衡量鉴别器的成功程度。因此，当鉴别器给出正确的标签时，当前策略的奖励为rt = 1；否则，奖励被称为惩罚，表示为rt = -1。在本文中，我们考虑了提出的SPN中的长期奖励。例如，如果控制代理在某个时间点停止（t = 5），并且输出了正确的答案，奖励将为5。在这种情况下，如果控制代理产生了错误的答案，奖励将为-5。总体而言，该代理的目标是最大化总奖励。

鉴别器

鉴别器是我们提出的框架的最终模块，其目标是通过使用全连接网络将隐藏状态Ht映射到一个较低维度的空间，从而预测给定时间序列的标签yˆ。然后，得到的低维向量通过softmax函数归一化为标签概率。方程如下所示：

实验评估

在本节中，我们使用一个公开的真实世界的12导联心电图数据集进行一系列实验，以评估所提出的模型的性能。

实验设置

环境

所提出的模型和最先进的方法在一台配备Xeon Gold CPU、128GB内存和Nvidia V100 GPU显卡的服务器上进行训练和测试。该服务器运行Ubuntu 18.04系统，模型是基于PyTorch [25] 0.4.1实现的。

数据来源

本研究中使用的心电图数据来自于第一届中国生理信号挑战赛[26]。该数据集包含来自6秒到60秒的6877个12导联心电图记录。在这些记录中，总共有8种心律失常类型（即房颤、Ⅰ度房室传导阻滞、左束支传导阻滞、右束支传导阻滞、房性早搏、室性早搏、ST段抬高、ST段压低）以及正常窦性心律需要进行分类。这些记录来自11家医院，采样频率为500赫兹。我们在该数据集上进行了10折交叉验证，以比较不同方法的性能。

性能指标

在这项研究中，我们使用了典型的分类指标，包括准确率、预测提前度、精确率、召回率和F1得分，来比较我们提出的模型与最先进的方法。此外，我们还使用了谐波平均来综合评估竞争方法在平衡准确率和预测提前度方面的性能。

准确率：准确率是一种性能评估指标，表示正确预测数量与总预测数量的比例，形式上定义为：

其中，m是测试集中总样本实例的数量；yi和yˆi分别是第i个样本的真实类别和预测类别。模型的准确率被计算为测试样本中正确预测的百分比。此外，

其中，s是由给定的早期时间序列分类（eTSC）模型进行预测的时间点，L是时间序列的长度。

正如在引言部分中指出的，因此早期时间序列分类（eTSC）具有两个天然的相互矛盾的优化目标。因此，eTSC可以在不同的方向上进行评估，通过保持提前度恒定来比较准确性，或者通过保持准确性恒定来比较提前度。为了同时评估这两个目标，一个在先前研究中出现过的常见选择是提前度和准确性的谐波均值。谐波均值（HM）是用于衡量双目标优化问题的指标。在我们的情况下，我们综合地衡量提前度和准确性，如下所定义：

此外，平均精确率、召回率和F1得分被用来衡量多类别分类的性能。具体细节如下所示：

在多类别分类问题中，对于特定类别，TP（真正例）表示正确分类的样本数，FN（假负例）是被错误分类为其他类别的样本数，而FP（假正例）是被其他类别错误分类为该类别的样本数。

对比方法

我们将我们的模型与以下一些先进的方法进行比较。为了进行这些方法的实验，我们要么使用作者的公共代码库，要么根据他们的原始论文来实现，以最大限度地发挥我们的知识。

SR2-CF2 [13]：这是一个基于特征的早期时间序列分类模型，其中特征是根据给定的距离函数生成的。基于遗传算法，它输出一个有信心的分类时间点。

EARLIEST [18]：这是一种基于强化学习的方法。它通过一个经过训练的策略网络输出分类结果。

TEASER [14]：基于一系列针对每个时间点的子分类器，TEASER被提出来处理不同长度的时间序列早期分类问题。

MDDNN [15]：这是一个基于深度学习的模型，将CNN和LSTM相结合来解决早期时间序列分类问题。

ETEeTSC [19]：这是另一个基于深度学习的早期时间序列分类模型。基于一种新的损失函数，该模型可以同时优化准确性和及时性。

请注意，我们并没有将我们的方法与经典的作品，如ECTS [7]和EDSC [8]进行比较。原因是这些方法似乎已经过时，并且它们在性能上被上述模型，即SR2-CF2、TEASER和ETEeTSC所超越。

参数设置

在所提出的框架的骨干卷积神经网络中，使用了13个卷积层，分为五个块，用于学习片段的空间依赖关系。对于每个卷积层，采用了批量归一化层（Batchnorm）[27]和修正线性单元（ReLU）函数[28]。所有卷积层的核大小为3，边界填充为1，步幅为1。此外，具有核大小3和步幅大小3的池化层用于控制每个块的输出大小。因此，在每个块的卷积中保持输入长度，仅通过池化层进行调整。在长短时记忆块中，使用了一个具有256个单元的单个LSTM层，用于学习片段的时间依赖关系。在训练阶段，我们使用Adam优化器[29]在每个小批次中进行训练并更新参数。学习率设置为10^-3，在每20个epoch时除以五，最终在100个epoch时终止。所有训练数据被分成小批次进行网络训练，小批次大小设置为32。

实验结果

性能比较

表格I显示了针对12导联心电图数据集的心血管疾病分类性能，包括了我们提出的方法和竞争模型的比较结果。从表格I中可以看出，我们提出的模型在心血管疾病分类任务中取得了最佳表现，因为它能够同时学习内部空间依赖性和跨时间依赖性。在考虑基于特征的模型SR2-CF2和TEASER时，结果显示这些方法无法令人满意地解决心电图早期分类问题。原因是这些方法在短时序数据集上设计和评估，无法在处理长时序数据时获得良好的结果。另一方面，基于深度学习的方法，如MDDNN和ETEeTSC，在分类任务的准确性方面表现可接受，但这些方法的早期度量指标并不理想。EARLIEST是第一个基于强化学习的早期时间序列分类模型。它展现了较好的早期度量性能，但由于其过于简化的架构，导致其分类性能较差，很大程度上是因为其过早的决策。总体而言，我们提出的方法呈现出最佳结果。值得注意的是，与现有技术相比，我们提出的方法在精度、召回率、准确性和F1分数方面获得了约7%的分类性能提升。

正如在相关工作部分讨论的那样，由于SR2-CF2是一种基于特征的模型，其分类器的特征是基于给定的距离函数提取的。一般而言，它无法在长时序和变长时序的分类问题上表现良好。EARLIEST和TEASER的实验中也出现了同样的问题。这些模型在早期时间分类问题中解决了准确性和早期性之间的权衡，但这些方法的设计并没有考虑到长时序数据。对于处理长时序数据，这些模型的准确性和早期性之间的权重参数设置不当，因为时间的惩罚要比准确性的惩罚大得多。对于MDDNN和ETEeTSC，它们的性能优于其他方法，因为它们利用了深度神经网络架构，而ETEeTSC具有自动输出预测时间点的独特能力。相比之下，SPN很好地解决了具有长时序和变长时序特性的心电图早期分类问题，其结果引人注目，满足了所有现实世界应用的标准。

结论

本文针对基于变长多导联心电图的心血管疾病早期分类问题进行了研究。这是一个重要的实际应用问题，在研究界尚未得到充分研究。为了解决这个问题，提出了一种新颖的深度强化学习框架，即Snippet Policy Network，由四个模块组成，包括片段生成器、骨干网络、控制代理和判别器。骨干网络被提出来学习内部片段的空间相关性和片段之间的时间相关性，通过结合卷积和循环网络架构。控制代理采用增强学习架构，解决了双目标优化中的早期性和准确性冲突的问题。这种代理使模型能够准确分类心血管疾病并寻找更早的预测时间点。判别器提出通过映射骨干网络生成的特征来进行分类结果预测。通过一系列实验，结果表明我们提出的模型在精确率、召回率、准确度、F1分数和谐波均值方面至少比现有方法提高了7%。此外，我们的模型在多种疾病分类中实现了超过80%的高准确率结果，填补了研究界与医疗实践之间的差距。总之，Snippet Policy Network为基于变长多导联心电图的心血管疾病早期分类问题提供了有效的解决方案。
在未来的工作中，我们的目标是改进代理机制并探索Snippet Policy Network的数据可解释性。我们相信数据可解释性可以帮助医疗专业人员更好地理解心血管疾病分类的原理。

你可能感兴趣的:(论文阅读,论文阅读)

论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
周三 2020-01-01 09:30 - 23:00 多云 03h35m 么得感情的日更机器
南昌。二〇二〇年一月一日基本科研[1]:1.论文阅读论文--小时2.论文实现论文编写--实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:开题报告--英语能力[2]:1.听力--十分2.单词--三分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正
零基础完整版入门经典深度学习时间序列预测项目实战+最新前沿时间序列预测模型代码讲解学习整理（附完整可运行代码） OverOnEarth 时间序列预测项目实战深度学习学习人工智能
专栏内容本专栏主要整理了作者在时间序列预测领域内的一些学习思路与代码整理，帮助大家在初进入此领域时，可以快速掌握代码进行实战操作，对代码的操作再结合论文阅读肯定是上升更快嘛，作者也愿意和大家一起讨论进步，下面的内容会逐步更新，作者主页的资源列也会放出一些可下载的资源供大家参考学习噢。一、LSTM时间序列预测完整代码示例学习分析（pytorch框架）精选试读文章二、LSTM多变量输入实现多步预测完整
250714脑电分析课题进展——基础知识扩展与论文阅读
脑电分析课题进展目录脑电分析课题进展一、概要二、论文阅读（一）内容（二）创新（三）不足三、书籍阅读四、基础知识学习（一）机器学习（二）代码能力五、总结与展望一、概要本周课题进展聚焦于论文与书籍阅读，以及基础知识的学习（包括机器学习与PyTorch的代码学习）论文阅读以毕明川学姐的学位论文为参考《基于EEG的冥想状态数据挖掘研究》书籍阅读以李颖洁的《脑电信号分析方法及其应用》第一章内容为重点机器学习
[论文阅读] 人工智能 + 软件工程 | LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力张较瘦_ 前沿技术论文阅读人工智能软件工程
LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力论文：OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationarXiv:2507.16587OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationGiuseppeCrupi
[论文阅读] 人工智能 + 软件工程 | LLM优化RTL代码：在时序逻辑面前栽了跟头？—— 一项基于变形策略的实证研究张较瘦_ 前沿技术论文阅读人工智能
LLM优化RTL代码：在时序逻辑面前栽了跟头？——一项基于变形策略的实证研究论文标题：RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorphosisarXiv:2507.16808[pdf,html,other]RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorp
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
大模型服务的推理优化探索半吊子全栈工匠
【引】有的事情别人不问时我们明白，一旦要我们解释它我们就不明白了，而这正是我们必须留心思索的东西。于是，开启了一次又一次的论文阅读之旅。开发并部署大模型应用肯定要考虑它们的服务成本。然而，钱并不是唯一的考虑因素，如果不能解决模型性能方面的问题，即使有很大的预算，大模型服务仍会受到影响。本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Decoupled Knowledge Distillation Bosenya12 论文阅读
摘要：最先进的蒸馏方法主要基于从中间层蒸馏出深层特征，而logit蒸馏的重要性则被大大忽视了。为了提供研究logit蒸馏的新观点，我们将经典的KD损失重新表述为两部分，即目标类知识蒸馏（TCKD）和非目标类知识蒸馏（NCKD）。我们实证调查并证明了两部分的效果：TCKD传递了有关训练样本“困难”的知识，而NCKD是logit蒸馏起作用的突出原因。更重要的是，我们揭示了经典的KD损失是一个耦合公式，
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破
需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破论文标题：RequirementsElicitationFollow-UpQuestionGenerationarXiv:2507.02858RequirementsElicitationFollow-UpQuestionGenerationYuchenShen,AnmolSinghal,TravisBreauxComments:13page
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23