KrMzyc

A Survey and Framework of Cooperative Perception 论文阅读

论文链接

A Survey and Framework of Cooperative Perception: From Heterogeneous Singleton to Hierarchical Cooperation

0. Abstract

首次提出统一的 CP（Cooperative Percepetion） 框架
回顾了基于不同类型传感器的 CP 系统与分类
对节点结构，传感模态和融合方法进行回顾
提出了一个分层的 CP 框架，回顾现有的数据集和模拟器

1. Intro

目前的 CP 主要关注于自我车辆，对于可扩展的通用型 CP 框架仍然缺失。

从三个方面阐述

节点结构
传感器模态
融合方案

同时提出了分层的 CP 框架

2. 架构与分类

SAE J3216 将 CDA 级别定义为五类，包括

无协作自动化
A 类：状态共享
B 类：意图共享
C 类：协议寻求
D 类：规定性

2.1 架构

CP 过程的四个典型阶段：信息收集，边缘处理，云计算，消息分发

信息收集
安装在车辆或路边基础设施上的高分辨率传感器感知环境和收集交通信息，并通过通信集线器将收集到的数据传输到边缘服务器进行进一步处理

边缘处理
考虑到使用有限的带宽传输大量的原始数据(如点云数据)可能会导致不可接受的时间延迟(特别是在一些安全关键的场景中)，从传感器收集的信息可能会在车辆或基础设施上的边缘服务器上处理。

对于单个的 感知结点（PN） 而言，处理感知数据主要由六个步骤：

预处理：处理原始数据，为特定传感器的感知模块提供现成的格式
特征提取：通过 DNN 或统计方法为后续的任务提取特征
多传感器融合：单个 PN 使用多个传感器时，应该使用多传感器融合算法
检测与跟踪：生成对象检测和跟踪结果，用于展示某些道路使用者的位置，姿态等
原始数据记录：记录带有时间戳的原始传感数据过后期任务判断
结果记录：记录语义感知数据和时间戳以供后期分析

对于不同的 PN，在 CP 系统中的任务也不同，如对于车辆感知结点（V-PN）而言，边缘处理主要用于本身，对于基础设施感知结点（I-PN）而言，其边缘处理是提高固定位置的姿态感知。

云计算
云计算充当多个PN的融合中心。来自异质PN的信息将通过不同的通信方式传输到云端，采用不同的融合方案进行数据融合，这取决于PN和云端之间要共享的数据类型。

对于异构的 PN 有三种类型的感知数据：

原始信息：RGB 图像，点云信息等
特征信息：通过神经网络或统计方法提取的隐藏特征，用于在高维空间中表示原始数据
结果数据：包含2D/3D位置、大小、旋转等语义感知信息

由于带宽限制，结果数据是最常用的感知数据

信息分发
感知信息主要通过两种方式进行传递：1. 没有连接：TMC 等； 2. 有连接：访问定制信息
协同信息合一支持混合交通环境中更为复杂的协同操作

2.2 分类

CP 系统的三个关键方面：

节点的多重性
传感器模态
融合方案

根据节点的多样性和传感器模态可进行以下分类：

单点单模 CP（SS-CP）：通过基础设施到所有设备(I2X)或车辆到所有设备(V2X)通信共享来自单模态传感器的感知数据
多点单模 CP（MS-CP）：通过I2X和/或V2X通信共享来自单模态多传感器的感知数据
单点多模 CP（SM-CP）：通过I2X或V2X通信共享多模态传感器感知数据
多点多模 CP（MM-CP）：通过I2X和/或V2X通信共享多模态传感器感知的感知数据

3. 节点结构

将节点定义为能够进行感知和通信的感知节点(PN)，作为构建CP系统的基本单元，从节点结构的角度对CP进行讨论。

3.1 I-PN based CP (V2I)

Camera-based I-PN

利用路边摄像机提出了一种基于卷积神经网络(CNN)的行人检测和定位方法
基于单目相机的三维车辆检测方法
车辆实时检测、跟踪和速度估计的监控系统
基于深度学习的、通过路边摄像机自动检测路边停车位的方法
利用多深度摄像机提出了一种协同的三维物体检测模型

LiDAR-based I-PN

经典的PCD探测与跟踪流程:背景滤波，聚类，分类，跟踪
基于学习的模型来处理激光雷达数据是另一种主要方法

3.2 Vehicle Nodes（V2V）

车间的协同感知源于无人机的研究，如基于分布式和集中式的 CP 框架
对于道路车辆：通过V2V通信将接收到的传感器数据关联起来
Kim等人实现了一种综合自动驾驶系统(ADS)，该系统可以提供超越领先车辆遮挡的自我车辆信息
Cooper 和 F-Cooper
进一步考虑通信的局限性，设计了“特征提取-压缩-解压-目标检测”流程
基于特征共享的CP模型。空间定位和特征生成需要车辆相对于自车的姿态信息

3.3 Heterogeneous PN-based CP（V2X）

该方向的研究目前较少
通过 V 与 I 之间的合作
- 通过PCD生成3D物体检测结果
- 特征数据通过V2X通信共享
- 提出一种基于多PN特征融合的网格特征方法
V2X-ViT:应用共享权重的 CNN 进行特征提取，车辆的姿态信息被传输到周围车辆和基础设施进行原始数据对齐

3.4 总结

V-PN：更具有自我效率
I-PN：更适合拓展合作
同构 PN：扩展感知范围
异构 PN：通过补充不同传感器配置，实现更好的 FOV

4. 传感器模态

4.1 配置与性能

目前的主流 ADS 设备是摄像头，LiDAR，雷达。对于路旁的传感器设置有典型的位置：信号臂和路灯柱，且对其最低的高度要求。每种传感器在不同的用例中都有自己的功能和优势：

相机：高分辨率，但对于三维位置和速度测量来说不佳
激光雷达：高精度3D感知，可适应环境变化。但价格相对较高，而且数据稀疏
雷达：测量速度，但不太适合区分物体
热成像相机：获取热信息，为照明变化提供弹性
鱼眼相机:360度全视场(FOV)检测，但需要高精度的校准矩阵来解释失真
环路：测量交通量和速度，安装和维护成本高

4.2 单传感器感知

基于单传感器的目标感知系统：

从传感器收集的数据首先被预处理，以减少噪音，过滤不相关的数据，并为下游模块正确地重新格式化。
应用特征提取，通过数学模型（如果基于传统方法）计算预定义的特征，或通过神经网络（如果基于深度学习）生成隐藏的特征
感知模块生成目标检测和跟踪结果，送入后处理模块，以进一步清理感知输出（例如，过滤重叠的边界框和分数低于阈值的预测）。

4.3 多传感器感知

由于不同传感器的互补性，与基于单传感器的感知系统相比，基于多传感器的感知系统有可能通过传感器融合达到更好的目标检测和跟踪性能。
本节讨论了三种流行的基于高分辨率传感器的多传感器感知方案，即相机+相机，相机+激光雷达，以及激光雷达+激光雷达。

4.4 总结

摄像头擅长捕捉视觉信息，LiDAR在收集三维信息方面非常出色。在一个互补的计划中同时利用这些传感器的优势被认为是提高监控系统感知精度的一个有希望的解决方案。

5. 融合方案

从传感器融合的阶段来看，多传感器感知系统可以分为三类：

早期融合–在预处理阶段融合原始数据
深度融合–在特征提取阶段融合特征
晚期融合–在后处理阶段融合感知结果

5.1 早期融合

与其他的 PN 之间共享原始数据，扩大了感知范围并同时提高精度。但对于原始数据的质量十分敏感。同时需要较大的通信带宽来传输大量的原始数据。在当前的通信能力之下，大规模的 V2V 项目利用早期融合是不可行的。

5.2 后期融合

融合独立的感知结果，对于误差校准和不同步的问题的包容度要远高于早期融合。

5.3 深度融合（中期融合）

使用提取的特征进行融合。目前深度融合仍处于起步阶段，需要后续的工作

5.4 总结

早期融合仅需要将多源数据对齐到统一坐标系中的校准，但需要较大的通信带宽来传输数据。后期融合主要关注如何合并多个感知管道生成的建议，思路简单，但准确性有限。由于其低通信要求和高精度的能力，深度融合正在迅速成为CP的一种可变革的解决方案。

6. 分层协同感知框架（HPC）

当前 CP 系统的三个主要问题：

异构性：CP系统要结合智能汽车和智能基础设施的优势，赋能感知的全面性
可扩展性：CP系统需要能够扩展到不同规模的合作层面，如交叉口层面、走廊层面、交通网络层面
动态性：CP系统需要能够与车辆感知节点动态配合

本文的 HCP 框架主要针对路口场景，分为三个层次：交叉口级别；走廊级别以及网络级别

交叉口级别： V-PN 通信共享与车载数据处理，I-PN 感知结果作为辅助数据
走廊级别： 基于多个基础设施来扩展感知，核心是 I-PN。基于 I2I 的通信，共享原始数据和特征级数据
网络级别： 感知整个流量网络的对象级流量状况，使用后期融合策略

7. 数据集与模拟器

7.1 数据集

KITTI： 最受欢迎的数据集之一，由用于移动机器人和自动驾驶的各种传感器模式记录的数小时交通场景组成
NuScenes： 第一个搭载全自动车辆传感器套件的数据集：6 个摄像头、5 个雷达和 1 个 LiDAR，全部具有全 360 度视野
Waymo Open Dataset： 大规模、高质量、多样化的数据集，包含在一系列城市和郊区地理地形中捕获的 1150 个场景

2021年，Deng等人发布了BAAI-VANJEE路边数据集。支持互联自动车辆高速公路技术数据集由路边数据采集平台采集的LiDAR数据和RGB图像组成，包含2500帧LiDAR数据和5000帧RGB图像，其中包括12类物体、74K 3D物体注释和105K 2D物体注释

2022 年之前，没有可用的开源协作感知数据集来处理现实世界的数据

7.2 模拟器

CARLA： 一款用于自动驾驶的开源模拟器，支持灵活的传感器套件规格和环境条件
SVL： 一种用于驾驶自动化的高保真模拟器，它提供端到端和全栈模拟，可与多个开源自动驾驶堆栈（例如 Autoware 和 Apollo）连接
MavLink： 可以高频运行以进行实时硬件在环 (HIL) 仿真，并支持流行的协议

8. 讨论

8.1 现状与挑战

异质性的感知单体：由于路边的传感器有更灵活的位置和姿势来获取数据，协同感知的一个典型方式是将信息从基础设施一侧传输给道路使用者。由于感知单体的异质性，最近只有少数研究考虑了车辆节点和路边设施节点之间的合作。
传感器系统：在大多数研究中，摄像头和激光雷达传感器是分开工作的。另一方面，尽管路边设施在协同感知中起着关键作用，但目前基于路边传感器的感知方法在大多数情况下是直接应用一般的感知方法。主要挑战之一是路边数据采集和注释，以促进基于路边设施的感知系统的深度学习研究。
融合策略的通用性：不同的融合方案有其特定的优势和劣势

8.2 未来趋势

异质合作
车辆与路边设施的合作是解决许多现有交通相关问题的一个有希望的方案。车辆-路边设施协同感知可以利用车辆（作为具有轻量级处理能力的移动感知节点）和基础设施（作为固定节点但具有强大的处理/存储单元）的能力来实现更好的性能。
多模式的合作
基于多传感器的感知系统有可能通过利用互补的传感器数据与适当的融合技术来提高感知性能。在照相机和LiDAR传感器的范围内，目前多模态传感器融合的发展主要是针对一个单一agent上配备的多个传感器的一般目标感知。针对多个感知节点的特定多模态传感器融合仍是一个空白领域，然而，这也是提高整个系统感知精度的重要途径。
可扩展的合作
一些协同感知方法主要是为了在周围节点的协助下增强自车的感知能力，要求周围节点根据自车的元数据来调整它们分享的数据，当涉及众多车辆，这可能会导致可扩展性问题。基于路边设施的感知系统在传感器设备方面更加灵活，具有高计算边缘处理器、大数据存储和宽通信带宽。通过只在车辆上部署轻量级的车载计算模块，如特征图提取，实现基于局部深度融合的协同感知，或从基于路边设施的高性能节点检索感知结果，以实现更广泛的感知，这将变得更加经济有效。

9. 总结

提出了架构和分类法，以说明协同感知系统的基本组成部分和核心内容。
从节点结构、传感器模式和融合方案三个方面详细介绍了协同感知方法，并进行了文献复盘。
提出的分层合作感知框架分别从交叉口、走廊和网络等不同层面进行分析。
简要回顾了用于实现合作感知的现有数据集和模拟器，以确定其差距。
讨论了当前的问题和未来的趋势。

论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
周三 2020-01-01 09:30 - 23:00 多云 03h35m 么得感情的日更机器
南昌。二〇二〇年一月一日基本科研[1]:1.论文阅读论文--小时2.论文实现论文编写--实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:开题报告--英语能力[2]:1.听力--十分2.单词--三分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正
零基础完整版入门经典深度学习时间序列预测项目实战+最新前沿时间序列预测模型代码讲解学习整理（附完整可运行代码） OverOnEarth 时间序列预测项目实战深度学习学习人工智能
专栏内容本专栏主要整理了作者在时间序列预测领域内的一些学习思路与代码整理，帮助大家在初进入此领域时，可以快速掌握代码进行实战操作，对代码的操作再结合论文阅读肯定是上升更快嘛，作者也愿意和大家一起讨论进步，下面的内容会逐步更新，作者主页的资源列也会放出一些可下载的资源供大家参考学习噢。一、LSTM时间序列预测完整代码示例学习分析（pytorch框架）精选试读文章二、LSTM多变量输入实现多步预测完整
250714脑电分析课题进展——基础知识扩展与论文阅读
脑电分析课题进展目录脑电分析课题进展一、概要二、论文阅读（一）内容（二）创新（三）不足三、书籍阅读四、基础知识学习（一）机器学习（二）代码能力五、总结与展望一、概要本周课题进展聚焦于论文与书籍阅读，以及基础知识的学习（包括机器学习与PyTorch的代码学习）论文阅读以毕明川学姐的学位论文为参考《基于EEG的冥想状态数据挖掘研究》书籍阅读以李颖洁的《脑电信号分析方法及其应用》第一章内容为重点机器学习
[论文阅读] 人工智能 + 软件工程 | LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力张较瘦_ 前沿技术论文阅读人工智能软件工程
LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力论文：OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationarXiv:2507.16587OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationGiuseppeCrupi
[论文阅读] 人工智能 + 软件工程 | LLM优化RTL代码：在时序逻辑面前栽了跟头？—— 一项基于变形策略的实证研究张较瘦_ 前沿技术论文阅读人工智能
LLM优化RTL代码：在时序逻辑面前栽了跟头？——一项基于变形策略的实证研究论文标题：RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorphosisarXiv:2507.16808[pdf,html,other]RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorp
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
大模型服务的推理优化探索半吊子全栈工匠
【引】有的事情别人不问时我们明白，一旦要我们解释它我们就不明白了，而这正是我们必须留心思索的东西。于是，开启了一次又一次的论文阅读之旅。开发并部署大模型应用肯定要考虑它们的服务成本。然而，钱并不是唯一的考虑因素，如果不能解决模型性能方面的问题，即使有很大的预算，大模型服务仍会受到影响。本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Decoupled Knowledge Distillation Bosenya12 论文阅读
摘要：最先进的蒸馏方法主要基于从中间层蒸馏出深层特征，而logit蒸馏的重要性则被大大忽视了。为了提供研究logit蒸馏的新观点，我们将经典的KD损失重新表述为两部分，即目标类知识蒸馏（TCKD）和非目标类知识蒸馏（NCKD）。我们实证调查并证明了两部分的效果：TCKD传递了有关训练样本“困难”的知识，而NCKD是logit蒸馏起作用的突出原因。更重要的是，我们揭示了经典的KD损失是一个耦合公式，
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破
需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破论文标题：RequirementsElicitationFollow-UpQuestionGenerationarXiv:2507.02858RequirementsElicitationFollow-UpQuestionGenerationYuchenShen,AnmolSinghal,TravisBreauxComments:13page
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号