小鸟打字

跨存储介质文件系统

Strara：跨存储介质的文件系统

参考来源

SOSP 2017 论文Topics
https://www.jianshu.com/p/128a49cebe28?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendationhttps://www.jianshu.com/p/128a49cebe28?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation
论文学习：Strata: A cross media file system

作者介绍

Youngjin Kwon,The University of Texas at Austin
- 作者是来自德克萨斯大学奥斯汀分校（The University of Texas at Austin）的CS PHD Youngjin Kwon
- 其导师是Prof. Emmett Witchel和 Prof. Simon Peter教师
- Youngjin Kwon的主要研究兴趣是操作系统，包括文件系统、新兴存储和内存技术、系统安全技术、虚拟化。
Henrique Fingler,The University of Texas at Austin
Tyler Hunt,The University of Texas at Austin
Simon Peter,The University of Texas at Austin
Emmett Witchel,The University of Texas at Austin
Thomas Anderson,University of Washington

文章写了啥

发现现有的基于单一介质的文件系统并不能同时满足大容量，高性能，性价比高的需求，所以提出了多种介质混合的想法；
通过发现用户态和内核态切换开销所占比例过大，设计了LibFS和KernelFS两者功能各司其职又相互协作的文件系统，其中LibFS拦截了系统调用，自己实现了用户态的库，通过mmap( )的方法直接写到NVM上，然后再在内核态中进一步的digest进去，这一做法十分新颖且高效。

KEYWORDS

File system, Non-volatile memory, Multi-layer storage
文件系统，非易失性存储器，多层存储

ABSTRACT

当前的硬件和应用存储的发展趋势给操作系统的存储子系统带来了巨大压力。

在硬件层面上，由于成本和性能的重要原因，导致存储设备市场已经变为跨越多层次的多层存储拓扑结构。
在文件系统层面上，应用越来越需要能够针对大规模数据集实现低延迟、高吞吐量、简单化崩溃一致性的的小型、随机的IO。
为单个存储层设计的文件系统并不能同时支持这些需求。

Strata,它是一个可以利用一种存储介质的优点来弥补另一种的弱势的的跨存储介质文件系统。通过这样做，Strata可以同时提供性能、容量和简单同步IO模型，并且它的设计比受限于单层存储设备的文件系统更简单。Strata的核心在于使用了一种在用户模式、内核和存储层之间进行新型任务划分的日志结构方法，而这种划分会将可伸缩性、高性能持久化从存储层管理中剥离出来。
使用仿真NVM、基于闪存的SSD和高密度的HDD构建的三层存储结构来量化Strata的性能优势。与为每层单独构建文件系统的方案相比，Strata在延迟和吞吐量性能上有了20-30%的提升，并提供了对整个存储结构的同步和统一访问。最终，与Linux 逻辑卷管理器提供的基于块的双层Cache缓存相比，Strata实现了2.8倍的吞吐量提升。

1 INTRODUCTION

文件系统正承受着上游应用和下游设备的压力。

在文件系统的下层，基于性能和容量的权衡，存储设备市场已经开始分化，现在的很多系统都是使用固态硬盘和传统机械硬盘。NVM将以与二者不同的第三种的容量和性能表现来给予另一种存储设备选项。
在文件系统的上层，现代应用程序的性能和功能性需求远远超出了传统文件系统所能提供的。例如：
1. 通常情况下的内核旁路技术
2. 对大规模数据集的小规模更新
3. 对程序员的易操作性
4. 高效的崩溃一致性处理

为了解决这些问题，提出了一个集成的跨存储介质文件系统Strata。

为了更好地利用多层存储的硬件属性.
虽然设计思想可以在NVM和SSD的特定文件系统中找到，但我们仍然是第一个去设计、构建和评估跨NVM、SSD、HDD三层的文件系统。

2 BACKGROUND

回顾当前和近期的存储设备，并讨论Strata如何应对这个多元化市场。
讨论现代应用程序对文件系统的需求以及当前可选方案的不足之处。

2.1 Hardware storage trends 硬件存储趋势

Diversification 多元化
- 三种存储技术竞争：非易失性存储器（NVM），固态硬盘（SSD）和高密度硬盘驱动器（HDD），各自有优点。
- 针对Table 1 进行性能展开
- 多样性表明未来的系统可能需要几种共存的存储技术。
Device management overhead 设备管理开销
- 现代存储设备地物理特性会阻止有效更新。
- 利用Strata的多层特性来达到SSD和HDD层的全部性能，NVM层会自动更新数据，

2.2 Application demands on the file system 应用对文件系统的需求

许多现代应用程序需要文件的崩溃一致性。在许多文件系统上，高效崩溃一致性对于应用来说是难以实现并且是缓慢的所以应用会选择牺牲正确性来换取性能优势。
Strata提供语义(包括写入)给有序文件系统，这种方式对程序员友好并简化了崩溃恢复。

2.3 Current alternatives are insufficient 目前的可选方案不足

Existing file systems specialize to a storage technology 采用特定存储技术的现存文件系统
- 现存文件系统都针对特定类型的存储设备，没有单个文件系统能适用于不同的存储介质。
File system write amplification 文件系统写入放大
- 文件系统写入放大通常是限制应用程序性能的主要因素，尤其是对于支持高效小规模写入的NVM器件。使用将被摘要到块更新的NVM层的操作日志，Strata能够有效地聚合重复的数据和元数据更新，从而显著降低文件系统写入放大效应。
Block stores are not the only answer 块存储并不是唯一的答案
- Strata为应用程序提供了文件系统而不是块存储接口，因为文件系统具有很强的向后兼容性、性能和功能。

3 STRATA DESIGN

Strata的目标是设计一个新的文件系统，用来管理不同存储设备之间的数据，结合它们的优势并弥补它们的弱点。

Strata设计目标：

Fast writes 快速写入
- Strata必须支持快速，随机和小规模的写入。快速小规模写入的一个重要原因是支持网络服务器应用程序，这些应用程序必须在响应回复之前保留数据。
Efficient synchronous behavior 高效同步
- 在同步过程中尽量减少性能损失
Manage write amplification 管理写入放大
- 减少对性能和QoS(Quality of Service,服务质量)的不利影响
- 方法：decoupled from the write fast-path 与写入快速路径分离
High concurrency 高并发
- Strata支持多个线程并发logging
Unified interface 统一接口
- 我们为整个底层存储结构中的所有设备提供统一的文件系统接口。 Strata的基本架构类似于日志结构合并（LSM）树。Strata首先将log同步写到NVM（write-efficient），然后周期性（异步）的digest到Kernel FS（per-file extent tree，read-optimized）。
Log at user-level, digest in the kernel 用户级日志，内核级摘要
- 为了实现快速写入，Strata分离日志和摘要的职责，并将它们分别分配给用户级软件和内核。
- 内核级文件系统（KernelFS）负责摘要。
  - 摘要为了实现高吞吐量采用跨多线程并行完成的，后台异步运行。
Sequential, aligned writes 顺序对齐写入
- 通过启用顺序对齐写入，摘录可最大限度地降低设备写入放大。
Use hardware-assisted protection 硬件辅助保护
- 为了安全有效地绕过内核，Strata利用现代服务器系统中提供的硬件虚拟化功能。

3.1 Meta-data Structures 元数据结构

Strata将元数据保存在超级块、inode和空闲块的每层位图中。这些数据结构类似于其他文件系统中的结构，我们在此仅简要描述它们。

Superblock
- Strata的超级块存储在NVM中，其描述了每个存储层的布局以及所有应用程序日志的位置。每当创建或删除一个应用程序日志时，KernelFS会更新它。
Inodes and directories
- Inodes
  - Inode存储文件的元数据，如访问权限、所有者、创建时间、每个文件的extent tree的根。
- directories
  - Strata的目录结构类似于EXT4，在数据块中保存了一个链式数组文件名和相关的inode编号。
Free block bitmap 释放块位图
- Strata中每层都有持久化位图来指示哪些块应该被分配和释放。
Multiple device instances 多设备实例
- Strata原型仅支持单层单存储设备，但设计将实现设备在逻辑上进行连接的单层多设备。例如，Strata可以将两个8TB的SSD作为一个16TB的SSD。该方法将允许Strata增加容量，冗余空间可以留作将来用。

3.2 Library File System (LibFS) 库文件系统

Strata的库文件系统（LibFS）提供了应用程序级别机制来执行文件IO。其目标是为整个底层存储层次结构提供快速、崩溃一致和同步的读写IO，与现有POSIX应用程序完全兼容的统一API，并通过与LibFS重新链接将其置于应用程序之下。

Fast and synchronous persistence 快速和同步持久化
- 现代NVM存储技术使Strata能够在不牺牲性能的情况下提供同步IO语义，同步语义可以加速NVM的整体IO性能。
- 同步语义允许Strata提供零拷贝IO——LibFS直接在用户的DRAM缓冲区和NVM之间执行IO。
- LibFS将更新日志以操作日志方式组织。操作日志比数据日志相比减少了IO，因为操作日志只需要指示目录更改的记录，而数据日志需要多个块记录。
Crash consistent logging 崩溃一致的日志记录
- LibFS将更改记录到包括文件和目录元数据在内的所有文件系统状态中。所有数据都按系统更改的顺序附加到日志中，而日志可以有效提供崩溃一致性更新。
- LibFS具有被称为Strata事务的持久化单位。
Digest and garbage collection 摘要和垃圾回收
- 日志是有限的资源，需要定期摘录到共享区域并进行垃圾回收。一旦日志填充超过阈值（我们的原型中为30％），LibFS就会向KernelFS发出摘要请求。KernelFS在后台异步摘要日志，并在摘要请求完成后回复LibFS。完成后，LibFS可以通过重置每个日志头的有效位安全地回收日志条目（也是在后台）。 Strata的数据结构允许用户将记录添加到内核正在摘录的日志中。
Fast reads 快速读取
- LibFS在DRAM中缓存数据和元数据。只有从SSD或HDD读取时才会缓存数据，NVM中不需要缓存。
- 要解析具有最新数据的文件位置，LibFS会搜索文件数据缓存、更新日志和从最高NVM存储层到最低HDD层的extent tree。

3.3 Kernel File System (KernelFS) 内核级文件系统

Strata的内核级文件系统（KernelFS）负责管理系统中全局可见和的可驻留在存储结构的任何层中的共享数据。为此，它会摘要应用程序日志并将其转换为perfile extent树。摘要在后台异步发生，允许KernelFS批处理Strata事务并定期进行垃圾回收和优化物理布局。 LibFS向KernelFS提供最近最少使用（LRU）的信息，以在存储结构的各层之间通知其迁移策略。

Digest 摘录
- 为了减少摘要延迟，KernelFS采用许多优化操作：
  1. 从日志中摘要大批操作
  2. 合并相邻写入
  3. 识别和消除操作
Data access pattern interface 数据访问模式接口
- 为了了利用整个存储结构，KernelIFS会在不同层间迁移数据，Strata在Kernel FS中维持了两个LRU list，一个用于NVM-SSD之间的数据迁移，一个用于SSD-HDD之间数据迁移。
Data migration 数据迁移
- 为了利用存储层中的容量，内核会在后台进行不同层间地迁移数据。为了并发操作并避免迁移阻塞带来地延迟，Strata会在层满前就进行数据迁移(在该原型中利用率为95%)。为了减少开销，写入到SSD是以erase为单元（百兆级别），写入到HDD是以木瓦磁盘方式（GB级别）。

3.4 Sharing (leases) 共享(租约方式)

Strata支持POSIX文件共享语义，同时优化对不同时共享的文件和目录的应用程序访问路径，KernelFS支持对文件和部分命名空间文件的的leases租约方式共享。

文件数据的粗粒度顺序共享，租约具有低执行时间开销。
由于其高开销，细粒度数据共享进程使用共享内存或管道

租约允许LibFS对特定文件或以某个目录为根的文件系统命名空间区域的独占写入或共享读取访问。写租约的功能类似于独占锁。

3.5 Protection and performance isolation 保护和性能隔离

Protection with kernel bypass. 内核旁路保护
- Strata支持对POSIX文件的访问控制，由MMU和NVMe命名空间强制执行，
  - MMU为内核旁路LibFS提供保护
  - 对于SSD驻留数据，使用NVMe命名空间来保护对文件数据的访问
Performance isolation 性能隔离
- 写入放大通过提高设备带宽利用率来提高IO的性能隔离。

3.6 Example

举例：覆盖一个非共享文件中的首1KB数据，之后读取前4KB数据。

4 IMPLEMENTATION

实施方案
- 使用英特尔的存储性能SDK绕过Linux内核而快速访问NVMe SSD
- 使用英特尔的libpmem来对模拟NVM持久化数据
- 使用非时序写入来避免污染处理器cache
- 使用适当的store fence和cache的刷新来保证持久化
- 使用EXT4文件系统的extent tree，并对其进行修改实现日志结构更新
结果
- 完成了LevelDB键值对存储测试套件的201个单元测试以及Filebench中所有测试

4.1 Limitations

Kernel
- 由于上下文的切换，导致系统调用的开销较高
- 但我们认为影响很小，因为设计目标是最小化内核级系统调用
Leases
- 租约并没有完全实施
Memory mapped files 内存映射文件
- 由于目标应用不会使用内存映射文件，所以这里没有做实现
Fault tolerance 容错机制
- 目前没有做任何冗余来补偿存储设备故障问题。

EVALUATION

Tested 测试环境
- 2x Intel Xeon E5-2640 CPU, 64 GB DRAM, 400 GB NVMe SSD, 1 TB HDD
- Ubuntu 16.04 LTS, Linux kernel 4.8.12
- 模拟NVM: 4GB的DRAM来模拟
对比文件系统
- NVM
  1. PMFS
  2. NOVA
  3. EXT4-DAX
- ssd
  1. F2FS
- HDD
  1. EXT4

5.1 Microbenchmarks 微基准测试

Hardware IO performance
File system write efficiency
Latency
Persistent RPC
Log size sensitivity
Throughput scalability
Data migration
Isolation

5.2 Filebench: Mail and Fileserver

原因: 因为邮件服务器会访问并创建/删除很多小文件，所以可以很好衡量Strata的元数据管理。文件服务器与之类似，但操作文件时较大，而且有更高比例的文件IO操作。
使用Varmail负载以及Fileserver负载
配置：10000files/32KB(avg for varmail) & 128KB(avg for fileserver)/16KB appends/ 读写比1:1(for varmail) & 2:1(for fileserver)/两种工作负载都以1MB的粒度读取和写入数据
测试结果：table 6
- 与VarVA相比，Varmail在Strata上的写入吞吐量提高了26％
- Fileserver吞吐量的改进较小（与NOVA相比为7％）。这是预期结果：Fileserver具有更大的平均写入大小并且没有崩溃一致性协议。
结论：Strata的日志压缩策略非常适合Varmail

5.3 Data Migration

为了测试Strata使用多个存储设备时的性能，我们将Fileserver配置为1MB，1000files。在这种情况下，工作集一开始在NVM中运行，但随后会digest到SSD和HDD。
结果：Figure 7
- Strata和UDM在LVM之上的吞吐量都比F2FS高2.8倍。
结论：Strata可以在高速层获得更多元数据来加速文件系统数据结构的遍历

5.4 Key-value Store: LevelDB

这里运行很多LevelDB基准测试，测量平均操作延迟。
结果：table5。
- 无论工作负载如何，LevelDB在Strata上实现的延迟低于任何其他NVM文件系统。
结论：如果底层存储设备速度很快，具有简单同步IO接口的文件系统可以提供低延迟IO。现代应用希望逻辑一致的更新可以得到崩溃恢复，而Strata通过简单的恢复语义可以实现这样的系统。

5.5 Redis

Redis是一个通常用于复制的分布式场景的键值对存储。
Standalone.
- 单个Redis实例进行基准测试，吞吐量提高了22%
Replication
- Redis支持复制以实现容错
- Strata相对于EXT4-DAX，吞吐量提高了29％，并且比NOVA保持了5％的改进。

6 RELATED WORK

Logging and coherence in file systems日志记录与文件系统的一致性。
Multi-layer block stores 多层块存储
NVM/SSD optimized block storage/file systems NVM/SSD优化块存储、文件系统。
Managed storage design 可管理存储设计。
Strong consistency 强一致性。

7 CONCLUSION

存储硬件的趋势促使多层存储拓扑在成本和性能方面有巨大优势。文件系统应管理多存储层，以提供高效的小规模写，同步语义和强QoS保证等高级功能。

实现段落文字两端对齐的css样式
有时候网站中的文字比较多,虽然为父元素设置了宽度,但是总是会出现两端参差不齐的情况,看起来不整齐。其实实现段落的两端对齐，只需要设置两个css样式即可。.demo{text-align:justify;text-justify:inter-ideograph;/*IE*/}text-justify基本语法语法：text-justify:auto|inter-word|newspaper|distr
c语言程序设计猜拳小游戏答辩,C语言课程设计-猜拳游戏 weixin_39558221 c语言程序设计猜拳小游戏答辩
C语言课程设计-猜拳游戏C语言课程设计-猜拳游戏|c语言程序代码编程小程序设计|c语言课程设计报告课程案例enump_r_s{paper,rock,scissors,game,help,instructions,quit};#includemain(){enump_r_splayer,machine;enump_r_sselection_by_player(),selection_by_machi
还蛮有收获的一些生活工作建议 jxy2018
整理自https://zhuanlan.zhihu.com/p/310116151如果研究/工作不顺利怎么办？多跟人交流；求助于他人/同事/老板2如何寻找研究/工作方向多研究些东西，如果一个方向不靠谱还有planb；读论文；听讲座；3怎样写好paper/文章讲故事很重要；写高质量的文章；看好文章的时候模仿；多写4生活多和志同道合的人做朋友和老板建立良好的关系（honestrelationship,
数据下载地址汇总经管数据库矩阵
下载方式一（推荐）：我的主页↓（*个人*简介）经管数据库-CSDN博客下载方式二（目录可免费下载，但含有付费说明）：https://download.csdn.net/download/paperdata666/90085056下载方式三（目录可免费下载，但含有付费说明）：https://download.csdn.net/download/paperdata666/90085052
基于JAVA实现基于“obj--html--pdf” 的PDF格式文本生成 hnmpf pdf
背景：因一个特定的项目需要，将java对象内容以特定样式的PDF格式输出，查看了很多文档，有收费的、免费的、基础集成的。收费的工具就表现突出，免费的工具基本很难满足需求，故着手采用基础集成方案。过程中尝试了很多中技术组合，最后根据个人调试效果选择了"thymeleaf+htmltopdf"组合方案。HTML转PDF效果：材料：1、基础JAVA环境2、测试数据：{"newspaper_name":"
Articles in Newspapers，Magazines and Journals 2 梁梦婷
在你搜索到文章并阅读后，你一定要关注“给作者的信”这部分中，读者反应等后续问题。大多数报纸和杂志中，“给作者信”这部分，往往是提供“知识读者”支持或挑战文章观点的反应。在每周杂志中，文章后的回应中，通常出现两个问题；在双周刊或月刊中，后面会出现一个问题。
“闭门造车”之多模态思路浅谈：自回归学习与生成 PaperWeekly 回归学习数据挖掘人工智能机器学习
©PaperWeekly原创·作者|苏剑林单位|科学空间研究方向|NLP、神经网络这篇文章我们继续来闭门造车，分享一下笔者最近对多模态学习的一些新理解。在前文《“闭门造车”之多模态思路浅谈：无损》中，我们强调了无损输入对于理想的多模型模态的重要性。如果这个观点成立，那么当前基于VQ-VAE、VQ-GAN等将图像离散化的主流思路就存在能力瓶颈，因为只需要简单计算一下信息熵就可以表明离散化必然会有严重
AAAI—24—Main—paper（关于Multi—Modal的全部文章摘要）
我们生活在一个由多种模态（Multimodal）信息构成的世界，包括视觉信息、听觉信息、文本信息、嗅觉信息等等，当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习（视觉，听觉，语言等）不同模态融合交织的信息。下游任务（1）视觉问答1.视觉问答(visualquestionanswering,VQA).给予视觉输入(图像或视频),VQA代表了正确提供一个问题
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
python 科研作图_Origin科研绘图 weixin_39525933 python 科研作图
前言入了生物学的坑，狗狗们需要时不时的画一些图，看着别人高大上的图片，大家有没有好奇这些图片是怎么做出来的呢?就本狗狗来看(狗狗可能来自农村-_-,)，现在铺天盖地的paper里的图，有些，当然本身就是照片啦，比如跑胶啊WB啊，有些是用R、python、或者matlab做的，那么对于不懂编程的狗狗来说，就需要利用一些趁手作图软件，也可以做出毫不逊色于前者的美图，常见的这类软件有origin，gra
语言大模型综述
Paper:ASurveyofLargelanguageModels目录Paper:ASurveyofLargelanguageModels综述概要LLM关键技术规模定律（ScalingLaws）预训练与微调对齐调优（AlignmentTuning）外部工具集成GPT系列模型的技术演进模型检查点和APIPre-Training数据准备和处理数据准备数据预处理数据调度架构EmergentArchit
Aurora中插入伪代码的字体设置
中文：宋体英文：TimesNewRoman公式：LatinModernMath，跟包newtxmath有关word里面插入对象-->选择AuroraEquation-->Properties-->Packages，复制以下代码：%!TEXprogram=xelatex%强制使用XeLaTeX引擎\documentclass[a4paper]{article}%\usepackage{mathptm
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
2025年电子工程、计算机应用与信号处理国际会议（EECASP 2025）学术交流国际学术会议论文征稿 EI会议
2025年电子工程、计算机应用与信号处理国际会议（EECASP2025）2025InternationalConferenceonElectronicEngineering,ComputerApplications,andSignalProcessing一、大会信息会议简称：EECASP2025大会地点：中国·苏州审稿通知：投稿后2-3日内通知投稿邮箱：[email protected]二、
CHES2024 issue-1文章总结打工小熊猫密码学文献分类总结 arm开发同态加密零知识证明密码学网络攻击模型安全威胁分析计算机网络
来源：https://ches.iacr.org/2024/acceptedpapers.php简要分类：分类文章编号后量子密码软硬件加速相关无侧信道攻防相关1、10、11、12、14、15同态相关18、19、201.Gadget-basedMaskingofStreamlinedNTRUPrimeDecapsulationinHardwareGeorgLand,AdrianMarotzke,Ja
2025年数字信号、计算机通信与软件工程国际会议（DSCCSE 2025）学术交流国际学术会议论文征稿 EI会议
2025年数字信号、计算机通信与软件工程国际会议（DSCCSE2025）2025InternationalConferenceonDigitalSignal,ComputerCommunication,andSoftwareEngineering一、大会信息会议简称：DSCCSE2025大会地点：中国·北京审稿通知：投稿后2-3日内通知投稿邮箱：[email protected]二、会议简介
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
长尾形分布论文速览三十篇【60-89】木木阳 Long-tailed 人工智能
长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新，LLMs在这些领域展现了卓越的性能，并为解决长尾问题提供了有效的工具和方法。1.长尾持续学习与对抗学习长尾持续学习(Paper60):通过优化器状态重用来减少遗忘，提高在长尾任务中的持续学
长尾形分布论文速览【80-119】木木阳 Long-tailed 人工智能
为便于理解和应用，以下将30篇关于长尾分布的研究文献按主题进行分类整理。每一大类包含相应的工作，帮助我们从整体上把握各方向的研究进展。1.长尾半监督学习与伪标签优化Paper90:Uncertainty-awareSamplingforLong-tailedSemi-supervisedLearning提出了一种动态阈值选择方法（UDTS），能有效改善尾部分类性能，适用于不平衡类别的半监督学习。P
CVPR2024无监督Unsupervised论文17篇速览木木阳 CVPR 无监督 unsupervised
Paper1GuidedSlotAttentionforUnsupervisedVideoObjectSegmentation摘要小结:这段话的中文翻译如下：无监督视频对象分割旨在分割视频序列中最突出的对象。然而，复杂的背景和多个前景对象的存在使这项任务变得具有挑战性。为了解决这一问题，我们提出了一种引导式槽注意力网络，以加强空间结构信息并获得更好的前景-背景分离。初始化时带有查询引导的前景和背景
CVPR2024 分割Segmentation相关论文37篇速览木木阳 CVPR2024 Segmentation 分割论文
Paper1MFP:MakingFullUseofProbabilityMapsforInteractiveImageSegmentation摘要小结:最近的交互式分割算法中，将先前的概率图作为网络输入，以帮助当前分割轮次的预测。然而，尽管使用了先前的掩膜，概率图中包含的有用信息并没有很好地传播到当前预测中。在本文中，为了克服这一局限性，我们提出了一种新颖有效的基于点击的交互式图像分割算法MFP，
Paper Reading《SoK: Prudent Evaluation Practices for Fuzzing》小苑同学安全性测试网络安全
论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10646824IEEESSP20241Introduction（背景意义）模糊测试是发现软件漏洞的高效方法，被Meta、Google等企业广泛应用，且大量学术研究持续改进其技术（如覆盖反馈、领域扩展）。过去六年（2018-2023）中，顶级安全与软件工程会议上发表了超280
如何在 Android 14系统中修改默认锁屏壁纸(非桌面壁纸) 熊熊饲养员 Android开发笔记 android
如何在Android14系统中修改默认锁屏壁纸本文介绍如何通过修改LockscreenWallpaper.java文件，实现针对默认锁屏壁纸定制化需求。以下是具体实现方法和代码逻辑分析。需求背景客户要求在X设备上更换默认锁屏壁纸，其他设备保持原有壁纸不变。修改涉及系统UI模块的LockscreenWallpaper.java文件，通过条件判断实现差异化配置。代码修改步骤在LockscreenWal
不是只有写稿能用AI！教你用AI“模拟审稿人”帮论文过关学境思源AcademicIdeas AI写作学境思源 ChatGPT 人工智能
在AI辅助写作火遍学术圈之后，学境思源，越来越多作者开始发现：AI的真正威力，并不只是帮你一键生成论文初稿！“写”，而是可以反过来“像审稿人一样看你的论文”。acaids.com。这种“反向应用”，正成为提高论文录用率的关键利器。今天这篇文章就告诉你：如何用AI模拟审稿人视角，检查论文的逻辑漏洞、结构混乱、语言问题，甚至帮助你发现数据论证不足，提前做出修改。我们会重点介绍Paperpal、Writ
FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
CCF推荐会议计算机体系结构/并行与分布计算/存储系统领域3月份截稿资讯汇总! 会议之眼人工智能深度学习阿里云云计算计算机网络
会议之眼快讯会议之眼精心汇总了以下CCF推荐会议之计算机十大领域之一：计算机体系结构/并行与分布计算/存储系统领域，2024年度3月份会议截稿资讯！为你第一时间进行播报！让广大科研学者及时了解最新的学术进展，助力学者们在专业领域保持竞争优势！会议简称：ISLPED会议全称：InternationalSymposiumonLowPowerElectronicsandDesignFullPaperDe
python做生物信息学分析_Python从零开始第五章生物信息学①提取差异基因吴敬欣 python做生物信息学分析
目前来说，做生物信息学的人越来越多，但是我觉得目前而言做生信的主要有三类人：老本行是做实验的，做生信可能是为了辅助研究或者是为了发paper(有非常多的临床生选择趟生信这波水)主要是做生信的，主要涵盖高通量测序数据分析，组学数据分析等等，专门从事生物学数据分析的这群人，其大部分也是本科生物狗作为强大的生力军，以调包写R，python为主。那么这群人就要熟悉看各种包的tutorial以及如何进行常规
python 在线预览文件_OFFICE 文档转换为html在线预览苏橙橙 python 在线预览文件
OFFICE文档转换为html在线预览OFFICE文档在线预览方案很多：服务器先转换为PDF，再转换为SWF，最后通过网页加载Flash预览，比如flexpaperOffice文档直接转换为SWF，通过网页加载Flash预览微软的Office365在浏览器中直接打开转换为html今天，我们要用的方案是转换为html来预览。技术方案：office文档转换为pdf：使用libreofficepdf转h
Android 14.0 默认壁纸不好看，客户要换成他们喜欢的壁纸，Android 14.0 更换默认壁纸的方法 zzq1996 android
Android14.0默认壁纸不好看，客户要换成他们喜欢的壁纸，Android14.0更换默认壁纸的方法替换如下framework路径的壁纸图片。diff--gita/frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.pngb//frameworks/base/core/res/res/drawable-nodpi/defa
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe