Scabbards_

MA-SAM:模态不可知的三维医学图像分割SAM自适应

论文：MA-SAM: Modality-agnostic SAM Adaptation for 3D Medical Image Segmentation | Papers With Code

代码：GitHub - cchen-cc/MA-SAM: PyTorch implementation for MA-SAM

机构：a)高级医疗计算和分析中心，麻省总医院和哈佛医学院，波士顿；b)香港中文大学计算机科学与工程系，c)伯利恒利哈伊大学计算机科学与工程系,d)哈佛大学约翰保尔森工程与应用科学学院,e) 美国佐治亚大学计算机学院

摘要

SAM是一般图像分割的基础模型，在许多自然图像分割任务中表现出令人印象深刻的zero-shot性能。然而，当应用于医学图像时，SAM的性能显着下降，主要是由于自然和医学图像域之间的巨大差异。为了有效地使SAM适应医学图像，在微调期间纳入关键的三维信息(即体积或时间知识)非常重要。同时，我们的目标是充分利用SAM在其原始2D骨干中的预训练权重。在本文中，我们引入了一个模态无关的SAM自适应框架，称为MA-SAM，它适用于各种体积和视频医疗数据。我们的方法基于parameter-efficient 的微调策略，仅更新一小部分权值增量，同时保留SAM的大部分预训练权值。通过在图像编码器的Transformer中注入一系列3D适配器，我们的方法使预训练的2D骨干能够从输入数据中提取三维信息。通过使用10个公共数据集(包括CT、MRI和外科视频数据)，对我们的方法在四种医学图像分割任务中的有效性进行了全面评估。值得注意的是，在不使用任何提示的情况下，我们的方法始终优于各种最先进的3D方法，在CT多器官分割、MRI前列腺分割和手术场景分割方面的Dice分别超过nnU-Net 0.9%、2.6%和9.9%。我们的模型也显示出很强的泛化，并且在使用提示时擅长挑战肿瘤分割。

背景

SAM 模型在医学分割上效果不佳

首先，SAM的训练数据集包含大量的图像集合。在医疗应用的背景下获取类似的大规模训练数据集是极具挑战性的。虽然SAM的训练数据只包含自然图像，但它并不局限于任何特定的医学成像模式。如果SAM微调被证明对一种类型的医学成像有效，那么同样的方法很有可能也适用于其他模式。

其次，经过微调后，SAM作为预训练的大型模型可能具有鲁棒泛化的潜力

第三，SAM的提示设计为半自动分割解决肿瘤分割等困难任务提供了方便的解决方案。在这些方面，SAM提供了一个通用的基础模型，具有适应不同医学成像模式的潜力，为全自动和半自动分割提供了良好的泛化能力。

挑战

例如，考虑一个包含多个器官的腹部CT容积，即使在每个切片上提供每个器官的基本点提示，也需要付出很大的努力。
此外，在分割对象形状和位置相对规则的情况下，自动分割方法已经获得了令人鼓舞的结果，从而消除了半自动分割中提示的需要。

在SAM适应自动医学图像分割的背景下，最近的一些研究采用了参数高效迁移学习(PETL)技术，如LoRA (Hu et al.， 2021)或Adapters (Houlsby et al.， 2019)，在自动分割中表现出良好的性能(Zhang and Liu, 2023;Wang et al.， 2023a)。然而，这些方法侧重于纯二维自适应，忽略了医学图像中固有的有价值的三维信息。这包括医学体积数据中至关重要的三维空间信息和医学视频数据中的时间信息。

解决

在本文中，我们提出了一种模态无关的医学图像分割SAM自适应方法，称为MASAM，该方法能够高效地捕获医学数据中的体积或时间信息。对于图像编码器的微调，我们利用了称为FacT的参数高效迁移学习PETL技术(Jie and Deng, 2023)，该技术基于tensorization decomposition来提高微调效率。

这种微调方法在很大程度上保留了预训练的权值，只更新轻量级的权值增量，保证了对象分割所需的一般知识的保留，减少了需要调整的参数数量。

为了弥合二维自然图像与体积或视频医疗数据之间的差距，我们进一步在图像编码器的每个变压器块中加入一组3D适配器，以提取有价值的三维信息。为了适应轻量级掩码解码器，我们采用了全微调，并使用简单而有效的渐进式上采样机制来修改其原始架构，以恢复预测分辨率。我们证明了我们的SAM适应框架在处理各种分割任务的多种医学成像模式上的有效性。通过对多种SOTA方法的比较，我们的自动分割方法表现出了优越的性能和显著的泛化能力。

贡献

1）提出了一种参数有效的微调方法，使SAM适应体积和视频医疗数据。我们的方法通过轻量级的3D适配器有效地将医学图像中的基本三维信息整合到2D网络骨干中。

2）证明我们的SAM适应可以应用于各种医学成像模式，包括CT、MRI和手术视频数据，用于解剖、手术场景和肿瘤分割。在不使用任何提示的情况下，我们的自动分割始终大大优于竞争对手的SOTA方法。

3）我们验证了在医学图像上进行微调后，得到的模型具有出色的泛化能力，甚至比SOTA域泛化方法表现出更好的性能。

4）我们表明，通过进一步利用提示，我们的方法在挑战肿瘤分割任务中取得了令人印象深刻的结果，在Dice得分上超过nnU-Net 38.7%。

方法

SAM概括

SAM是一种提示式分割架构，由三个主要组件组成，即图像编码器、提示编码器和掩码解码器。

图像编码器： ViT

提示编码器：提示编码器接受各种类型的提示，包括点、框或文本，并将这些输入编码为提示嵌入，以促进分割任务。

掩码解码器：设计轻巧，计算图像嵌入和提示之间的交叉关注，并利用转置卷积层和多层感知生成分割掩码。

当应用于医学图像时，由于医学图像与自然图像具有不同的纹理和物体，因此模型的性能大大降低。这突出了针对特定任务对SAM进行微调以应对此类挑战的必要性。

图像编码器的参数有效微调

为了有效地提取图像特征，SAM的图像编码器包含了相当一部分网络参数。微调所有这些权重是计算密集型的。先前的研究表明，PETL技术可以实现类似于完全微调的自适应性能，但更新的网络参数要少得多(Hu et al.， 2021;Pan et al.， 2022)。在这方面，我们采用了FacT (Jie and Deng, 2023)，这是一种SOTA PETL技术，与其他PETL方法相比，它可以在引入较少数量的可训练参数的情况下获得相当或更好的性能。

震惊，我搜了一下FacT好新好新，是2023年aaai的

基于基于Transformer的模型在秩上趋于冗余的常见观察，FacT假设用于微调的密集权重增量矩阵ΔW可以通过一组具有跨层权重共享的低秩因子来近似。根据FacT中的张量分解，我们将每层的权值增量ΔW分解为三个因子U∈Rd×r, V∈Rd×r， Σ∈Rr×r，其中d表示ViT中的特征维数，r表示这些因子的秩，r<

其中s为调节因子学习率的超参数。在我们的实验中，我们将s固定为1，并使用优化器调整整体学习率，以达到类似的缩放效果。将FacT权重增量应用于每个转换块中的查询和值转换，而从SAM初始化的所有其他权重保持冻结，因为根据经验，在将FacT应用于其他层时没有观察到明显的改进。随着FacT权重的增加，查询和值转换变成:

其中，wq /v为调优后的查询或值转换;
W0表示SAM预训练的权值。

没咋接触过微调，到时候琢磨琢磨好了

包含体积和时间信息

结合医学成像数据中固有的体积或时间知识，对于医学应用中SAM的成功迁移学习至关重要。为了解决这一关键挑战，我们建议在SAM架构内将一系列3D适配器集成到2DTransformer块中。这些适配器用于提取医学图像分析所需的基本体积或时间洞察力。通过整合这些适配器，我们弥合了医学成像数据固有复杂性与SAM预训练的2D主干之间的差距，使其能够有效地处理多维医学数据。

具体而言，如图1所示，每个3D适配器由归一化层、线性下投影层、三维卷积层(后为激活层)和线性上投影层组成。体积或时间信息的核心提取主要存在于三维卷积层中。下投影层的目的是将原来的d维特征降维为更紧凑的c维表示，从而控制新引入参数的数量。相反，上投影层恢复特征维度。M表示特征映射，则三维适配器可表示为↓ 其中Norm为层归一化，σ为激活函数，Wdown∈Rd×c和Wup∈Rc×d分别为线性向下和向上投影层，Conv3D为三维卷积层，核大小为3×1×1，专门提取三维信息。所以2D的时候就是把3D adapter 拆掉吗？后面实验部分也没提到2D任务就是了

为了使3D适配器与2D SAM主干兼容，对于网络输入，我们提取了一组相邻的切片。其中，B表示批大小，N表示相邻切片数，H × W表示切片尺寸。

在输入传递到SAM骨干前，通过将相邻的切片合并到批处理维度中，对x∈RB×N×H×W进行重塑操作，将x∈R B×N×H×W转化为x∈R BN×H×W。

然后，对于特征映射，在输入到3D适配器的3D卷积层之前，将它们从[BN, H/16,W/16, c]重塑为[B, c, N, H/16,W/16]。

其中H/16和W/16表示特征映射的空间维度，由于变压器中的patch嵌入过程，特征映射被下采样了16倍。经过三维卷积运算后，特征图的形状又变回原来的形状。通过这种方法，可以有效地提取二维骨干网络中的体积或时间信息。对于每个变压器块，我们在注意层之前和之后都加入了两个3D适配器，因为这样的设计可以获得经验上更好的性能。

Adapting mask decoder 自适应掩码解码器

原始SAM中的掩码解码器仅包含两个变压器层、两个转置卷积层和一个多层感知层。考虑到其轻量级的结构，在全掩码解码器上进行全微调是可行的，可以有效地适应医学图像。在SAM图像编码器内Transformer主干的补丁嵌入过程中，每个16×16补丁作为特征向量嵌入，导致输入有16×16次下采样。SAM掩码解码器利用两个连续的转置卷积层对特征映射进行4倍的上采样，但SAM生成的最终预测的分辨率仍然比原始形状低4倍。然而，由于医学图像中的许多解剖结构或病变非常小，因此通常需要实现更高的分辨率，以确保在医学成像背景下提高识别能力(Ronneberger et al.， 2015)。

为了解决这个问题，我们探索了两种方法来定制掩码解码器，以增强医学图像分割的适用性。

对于第一种方法，称为“渐进式上采样”，我们通过积分两个额外的转置卷积操作，对SAM解码器进行适度调整。每一层对特征映射进行2倍的上采样，四个转置卷积层逐渐将特征映射恢复到原始输入分辨率。

第二种方法被称为“多尺度融合”，需要创建一个类似于“u形”网络的设计(Ronneberger等人，2015)。这涉及到使用跳过连接将图像编码器的多尺度特征图与掩码解码器的相应阶段连接起来，这是一个类似于U-Net的概念。为了实现这一点，我们将图像编码器统一划分为四个阶段，通过一系列上采样和卷积操作，在每个阶段的特征映射与解码器的特征映射之间建立联系。

在我们的实验中，我们观察到渐进式上采样机制与多层特征聚合相比产生了更好的结果，显示了渐进式上采样方法的有效性和简单性。

（有点惊讶，多加专职卷积居然比类U-Net结构效果更好欸）

实验

数据集

任务1

The Beyond The Cranial Vault (BTCV)挑战数据集(Landman et al.， 2015)包含30个CT体数据，其中包含13个腹部器官的手动注释。每次CT扫描包含85 ~ 198个切片，切片厚度从2.5 ~ 5.0 mm不等。所有扫描轴向尺寸为512 × 512，但面内分辨率范围为0.54 × 0.54 mm2至0.98 × 0.98 mm2。我们使用与(Tang et al.， 2022a)相同的数据分割，其中包含24个用于训练的案例和6个用于测试的案例。

任务2

我们对6个MRI数据源(Liu et al.， 2020)进行前列腺分割，即从nic - isbi13 (Bloch等人，2015)、I2CVB (Lema - ıtre等人，2015)和PROMISE12 (Litjens等人，2014)数据集中收集的站点A到F。每个站点的病例数分别为30、30、19、13、12、12，随机分为80%和20%进行培训和测试。这些来自不同部位的MRI扫描是通过不同的成像方案获得的，并且呈现异构的数据分布，因此通常用于以前的领域泛化研究(Liu et al.， 2022)。

任务3

2018 MICCAI机器人场景分割挑战(EndoVis18)数据集(Allan et al.， 2020)包括每个序列包含149、249或250帧，分辨率为1280 × 1024。该数据集包含手术场景，有12类针对各种解剖结构和机器人仪器进行了注释。数据集正式分为15个序列用于训练和4个序列用于测试。

任务4

2018年MICCAI医学分割十项全能挑战(MSD-Pancreas)数据集(Antonelli et al.， 2022)中的胰腺肿瘤分割任务包含281个CT扫描胰腺和肿瘤的注释。每次扫描包括37至751片，轴向尺寸为512×512。我们遵循(Gong et al.， 2023)在我们的实验中只使用肿瘤标签，并使用与他们工作中相同的数据分割。

此外，我们使用多模态腹部多器官分割挑战(AMOS 22)数据集(Ji et al.， 2022)来评估模型泛化。该数据集包含来自不同患者的腹部CT和MRI数据。每次扫描都标注了15个器官，但我们关注的是与BTCV数据集重叠的12个器官。在AMOS 22的训练集和验证集中使用300个CT扫描和60个MRI扫描来进行我们的泛化评估。

数据预处理

我们分别在[- 200,250]Hounsfield Units (HU)和[- 50,200]HU范围内截断BTCV和msd -胰腺数据集的每次CT扫描强度值。每次MRI扫描的强度在第99个百分位数处截断。每个CT或MRI扫描归一化为零平均值和单位方差。对于手术视频数据，每帧归一化到[0,1]范围。我们将CT和MRI数据的轴向面以及每帧手术视频序列的所有图像调整为512 × 512。对于模型的评估，我们使用常用的度量，即Dice分数和Hausdorff Distance (HD)来分别评估像素分割精度和分割边界质量。我们还报告了EndoVis18数据集的平均相交-过并(mIoU)和msd -胰腺数据集的归一化表面距离(NSD)，以与先前的研究保持一致。

实现细节

采用交叉熵损失和Dice损失相结合的混合分割损失对微调过程进行监督:Lseg = αLce + β lice。

除仅使用Dice loss的手术视频数据外，权重因子α和β分别设为0.2和0.8 (Zhang和Liu, 2023)。每五个连续切片作为网络输入。

对于数据增强，我们应用了一系列变换，包括随机旋转、翻转、擦除、剪切、缩放、平移、分隔、对比度调整、亮度修改和清晰度增强。我们的模型使用Adam优化器进行训练，批量大小为24。

如(Zhang and Liu, 2023)所述，我们采用预热训练策略，将学习率线性提高到特定值，然后在训练结束时指数降低学习率，以稳定训练。

我们采用ViT H作为图像编码器的主干，共进行了400次训练，保证了模型的有效收敛。

我们的框架是在PyTorch 2.0中使用8个NVIDIA A100 gpu实现的。

结果

已经很多项超过nn-Unet了，nb

对比模型：

基于Transformer的方法SwinUNETR (Tang et al.， 2022b)是一种基于三维变压器的分层编码器模型，而nnFormer (Zhou et al.， 2023a)是一种结合了局部和全局体积自关注机制的模型。我们还将我们的方法与最新的SAM自适应方法SAMed h (Zhang and Liu, 2023)和3DSAM-adapter (Gong et al.， 2023)进行了比较。SAMed_h是一种用于器官分割的自动二维医学图像分割模型，而3DSAM-adapter是一种用于肿瘤分割的快速三维医学图像分割模型。

对于手术视频数据，我们将我们的方法与SOTA手术场景分割方法、NCT (Shvets等人，2018)、UNC (Ren等人，2020)和OTH (Chen等人，2018)(挑战中报道的前三种方法)、Noisy-LSTM (Wang等人，2021)(使用ConvLSTM学习时间线索)、STswinCL (Jin等人，2022)(基于变压器的捕获视频内和视频间关系的模型)和nu - net进行比较。对于所有比较实验，所有方法的数据集分割保持一致。

BTCV数据集

BTCV数据集上生成的分割结果的定性可视化

六个前列腺MRI数据集

前列腺MRI数据集上产生的分割结果的定性可视化。前列腺边界分别用绿色表示真实情况，用橙色表示我们的方法，用红色表示其他方法

Endovis18数据集上不同手术场景分割

胰腺肿瘤CT图像中不同分割方法分割

我们的方法也明显优于最近的整体3DSAM自适应方法3DSAM-adapter，在使用自动分割时，Dice改进了10%。这可以归因于我们的方法有效地将三维信息整合到模型微调中，以及大量利用SAM预训练的权重来保留一般的判别知识

由于胰腺肿瘤在CT扫描中轮廓不规则，边界不清，因此胰腺肿瘤分割提出了很大的挑战。从表4和图5可以看出，所有的自动分割模型都难以正确地描绘胰腺肿瘤区域，表现最好的模型仅获得41.6%的Dice分数。我们认为在这样一个要求苛刻的分词任务中，提示的使用变得很有价值。通过在模型中以每个体积一个紧密的3D边界框的形式添加提示，我们的方法显着将Dice分数从41.6%提高到80.35%，证明了利用提示进行肿瘤分割的有效性。然而，如果允许提供的边界框松紧度松弛5%，性能下降到74.7%，显示提示质量对分割性能的影响。

泛用性评估

AMOS2022

前列腺MRI分割 prostate MRI segmentation

消融实验

我们在BTCV数据集上进行了广泛的消融实验，以研究我们的SAM微调策略的几个关键方面:

1)我们方法中每个重要组件的有效性

2)掩码解码器设计的影响

3) 网络主干网的影响

4)3D适配器的位置选择

5)参数有效微调的等级选择。

通过考虑集合{4,8,16,32,64}中的秩值，我们研究了模型的性能如何随着分解秩r的变化而变化。

讨论

基础模型，如分段任意模型(SAM)，通过提供健壮的泛化和少量学习能力，已经彻底改变了智能模型的开发。SAM在自然图像任务中展示了令人印象深刻的zero-shot性能。然而，由于存在较大的域差异，直接将SAM应用于医学图像分割是无效的。为了解决这个问题，在这项工作中，我们提出了一种参数有效的微调方法，使SAM适应各种医学成像模式。我们的方法利用FacT有效地更新一小部分权重增量，并注入一组设计的3D适配器，以在微调期间提取医学图像的关键体积或时间知识。我们的方法的一般适用性和有效性已经验证了四种医学图像分割任务跨越三种成像模式。我们的模型还展示了出色的泛化能力，当使用提示时，在特别具有挑战性的肿瘤分割方面具有显着优势。

将SAM应用于医学图像的一个重要动机是它在庞大而多样的数据集上进行预训练，这在医学成像领域是很难实现的。这使得SAM的适应性普遍适用于各种医学成像方式。在医学应用中，最近有尝试预训练特定模式基础模型的努力。然而，这些模型通常局限于特定的医学成像模式，很难扩展到其他模式。例如，用胸部x线数据预先训练的模型在应用于MRI数据时可能会遇到困难。通过利用SAM的预训练权重，我们能够训练大规模分割网络，例如ViT H，用于医学图像分割，即使数据有限，例如仅使用5个成像扫描。我们的实验已经证明了增加模型大小的好处，提出了一个有趣的问题，即性能如何随着模型大小的进一步增加而发展。对于医学图像，我们可以使用更大的模型来提高准确性或增强泛化吗?探索这些可能性引起了极大的兴趣。

对于已经可以使用SOTA医学图像分割方法获得满意结果的任务，使用提示分割的意义不大。在处理具有挑战性的肿瘤分割任务时，提示被证明是特别有益和有价值的，正如我们的实验以及其他SAM微调工作所证明的那样。然而，制作有效的提示需要大量的努力。如表4所示，提示分割的性能随着提示质量的下降而下降。考虑到与手动提示符创建相关的挑战，在自动化此过程中有充分的未来探索空间。研究如何自动生成合适的提示符，以及如何在有噪声或不完整提示符的情况下训练出准确的分割模型，是非常有意义的。这将在手动提示创建具有挑战性的场景中增强提示分段的实用性。

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
在线学习反思娟l
今日分数:85分在这个特殊的情况，我们不得不在网上学习。起初在学习中，我时不时的走神，因为我手里拿着的是手机，但是经过父母的教导，这个问题有所改善。从还没上网课时，我就已经把单词背到了第6单元了，起初我很得意，但是，默写完单词才发现，有一些已经忘记了所以，我应及时复习，查漏补缺。这几天我一直坚持体育锻炼，刚开始，我锻炼的十分累，浑身疼，但是锻炼没过3天就没事了，并且跳绳1500下，也没之前费劲了。
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
MAC包头、IP包头、UDP包头中的长度含义是啥？三者之间有啥区别？
以太网帧、IP包及TCP与UDP的报文格式下面用通俗+技术的方式详细解释：1.MAC包头（以太网帧头）中的长度字段名称：EtherType/Length位置：以太网帧头的第13、14字节含义：如果值小于等于1500（0x05DC），表示数据部分的长度（即MAC帧中数据字段的字节数，不包括MAC头和FCS）。如果值大于等于1536（0x0600），表示上层协议类型（如0x0800表示IPv4，0x0
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
视觉Transformer还有哪些点可以研究？怎么应用？计算机视觉工坊 3D视觉从入门到精通学习算法开源
0.这篇文章干了啥？今天笔者为大家推荐一篇最新的综述，详细总结了Transformer的网络架构、优化策略、发展方向，还会定期更新Github，研究注意力机制的小伙伴一定不要错过。注意机制有助于人类视觉系统有效地分析和理解复杂场景，它能够聚焦于图像的关键区域，同时忽略无关紧要的部分。受此概念启发，注意机制已经被引入到计算机视觉（CV）中，以动态地为图像中的不同区域分配权重。这使得神经网络能够专注于
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
新一代数据库：融合多模智能，重塑数据价值
一、场景重塑产业格局：数据库“融合进化”AI浪潮奔涌而至，数字产业格局加速重构。云计算、移动互联、万物互联（IoT）、人工智能（AI）等技术的深度融合与快速落地，正以前所未有的速度重塑着企业的应用形态。新业务场景层出不穷——从高并发的在线交易、实时精准的分析决策，到海量物联网设备监控、基于图关系的风控反欺诈，再到AI驱动的智能推荐与内容生成，应用场景的多样性与复杂性已突破传统数据库的能力边界。这对
基于知识图谱技术增强大模型RAG知识库应用效果罗伯特之技术屋知识图谱人工智能
【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin