小小帅AIGC

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.20-2024.02.25

论文目录~

1.Zero-shot cross-lingual transfer in instruction tuning of large language model
2.Scaling Efficient LLMs
3.LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition
4.Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard
5.Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?
6.Can Language Models Act as Knowledge Bases at Scale?
7.Take the Bull by the Horns: Hard Sample-Reweighted Continual Training Improves LLM Generalization
8.Can Large Language Models Detect Misinformation in Scientific News Reporting?
9.FanOutQA: Multi-Hop, Multi-Document Question Answering for Large Language Models
10.LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons
11.Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models
12.Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models
13.What Linguistic Features and Languages are Important in LLM Translation?
14.LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens
15.From Text to CQL: Bridging Natural Language and Corpus Search Engine
16. $\infty$ Bench: Extending Long Context Evaluation Beyond 100K Tokens
17.Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent
18.GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model
19.User-LLM: Efficient LLM Contextualization with User Embeddings
20.LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

1.Zero-shot cross-lingual transfer in instruction tuning of large language model

标题:大型语言模型指令调整中的零点跨语言转移

author:Nadezhda Chirkova, Vassilina Nikoulina

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14778v1

摘要：
指令调整（IT）被广泛用于教导预训练的大型语言模型（LLMs）遵循任意指令，但在多语言环境中的研究却不足。在这项工作中，我们对 IT 中的零次跨语言迁移进行了系统研究，即在纯英语数据上对 LLM 进行指令调整，然后在其他语言的用户提示上进行测试。我们研究了模型配置选择的影响，并为多语言教学设计了多方面的评估策略。我们发现，即使模型训练的所有阶段都以英语为中心，跨语言迁移也能在信息技术中成功实现，但前提是在超参数调整中考虑到多语言性，并且有足够大的信息技术数据。经过英语训练的 LLM 能够用其他语言生成语言正确、全面和有帮助的回答，但事实性较低，偶尔会出现流利性错误。

2.Scaling Efficient LLMs

标题:高效扩展 LLM

author:B. N. Kausik

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14746v1

摘要：
训练过的 LLM 通常是稀疏的，即大部分参数为零，这就提出了效率问题。对此，我们研究了高效的 LLM，即在训练语料库上能达到预期准确度的参数最少的 LLM。具体来说，我们比较了当前规模下训练损失的理论估计值和经验估计值，以获得自然训练语料库中唯一序列的数量随其规模变化的上下限。我们的结果意味着：(1) 若要将训练语料库中代表的技能数量增加一倍，语料库的规模必须扩大大约三到五倍；(2) 对于高效的 LLM，自然训练语料库的参数数 $N$ 和大小 $D$ 的比例为 $\sim D^{0.58}$ ；(3) 如果 LLM 的参数数小于训练语料库中唯一序列的数量，那么扩大规模就能发现新出现的技能。

3.LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition

标题:LLM-DA：通过大型语言模型进行数据扩充，实现少量命名实体识别

author:Junjie Ye, Nuo Xu, Yikun Wang, Jie Zhou, Qi Zhang, Tao Gui, Xuanjing Huang

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14568v1

摘要：
尽管大型语言模型（LLM）的能力令人印象深刻，但它们在信息提取任务中的表现仍不尽如人意。然而，它们卓越的重写能力和广泛的世界知识为改进这些任务提供了宝贵的见解。在本文中，我们提出了一种基于 LLMs 的新型数据增强技术– $LL M - D A$ ，用于少量信息提取任务。为了克服现有数据扩增方法的局限性，即损害语义完整性和解决 LLM 生成文本中固有的不确定性，我们通过在上下文和实体两个层面扩增原始数据，充分利用了 NER 任务的显著特征。我们的方法包括采用 14 种上下文重写策略，设计同类型的实体替换，以及注入噪声以增强鲁棒性。广泛的实验证明了我们的方法在利用有限数据提高 NER 模型性能方面的有效性。此外，额外的分析还提供了进一步的证据，证明我们生成的数据质量超过了其他现有方法。

4.Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard

标题:到底是谁的 LLM？GPT-3.5、GPT-4 和 Bard 的语言学比较和 LLM 归属

author:Ariel Rosenfeld, Teddy Lazebnik

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14533v1

摘要：
大型语言模型（LLM）能够生成与人类质量相似或更高的文本。然而，目前还不清楚 LLM 是否倾向于表现出与人类作者类似的独特语言风格。通过全面的语言分析，我们比较了由当今最流行的三种 LLMS（GPT-3.5、GPT-4 和 Bard）生成的文本的词汇、语音部分（POS）分布、依赖关系分布和情感，以及不同的输入。研究结果表明，语言上的显著差异反过来又使我们能够使用一个简单的现成分类模型，以88%的准确率将给定文本归因于其 LLM 起源。本文讨论了这一有趣发现的理论和实践意义。

5.Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?

标题:LLM 是否会隐含地为用户确定合适的文本难度？

author:Seiji Gobara, Hidetaka Kamigaito, Taro Watanabe

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14453v1

摘要：
要提高学生的理解能力，就必须开展适合个人学习水平的教育。利用大语言模型（LLMs）实现这一目的的第一步是调整学生回答的文本难度。这项工作分析了 LLM 如何在用户输入和其生成的文本之间隐式地调整文本难度。为了进行实验，我们从 Stack-Overflow 中创建了一个新的数据集，以探索基于问题解答的对话的性能。在 Stack-Overflow 数据集和 TSCC 数据集（包括多轮对话）上的实验结果表明，LLM 可以隐式处理用户输入与其生成的回复之间的文本难度。我们还观察到，一些 LLM 在处理文本难度和指令调整的重要性方面超过了人类。

6.Can Language Models Act as Knowledge Bases at Scale?

标题:语言模型能否作为大规模知识库？

author:Qiyuan He, Yizhong Wang, Wenya Wang

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14273v1

摘要：
大型语言模型（LLMs）通过大规模的预训练，在理解和生成对复杂查询的响应方面表现出了非凡的能力。然而，这些模型在记忆大规模结构化知识（尤其是明确涵盖大量事实信息的世界知识）并进行推理方面的功效仍然值得怀疑。针对这一空白，我们的研究探讨了 LLM 是否能有效地存储、调用和推理与维基数据（Wikidata）等最新知识库（KB）相当的大规模知识。具体来说，我们主要从三个关键方面来研究其可行性：(1) 不同规模的 LLM 在记忆大规模知识库中的准确知识方面的效率；(2) 在响应自然语言查询时调用记忆知识的灵活性；(3) 通过推理推断新知识的能力。我们的研究结果表明，虽然 LLM 有希望成为能够灵活检索和响应的大规模知识库，但要充分发挥其潜力，还需要增强其推理能力。

7.Take the Bull by the Horns: Hard Sample-Reweighted Continual Training Improves LLM Generalization

标题:迎难而上硬样本加权持续训练提高了 LLM 的泛化能力

author:Xuxi Chen, Zhendong Wang, Daouda Sow, Junjie Yang, Tianlong Chen, Yingbin Liang, Mingyuan Zhou, Zhangyang Wang

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14270v1

摘要：
在快速发展的大型语言模型（LLMs）领域，一个关键的挑战是如何在高质量训练数据短缺的情况下提高其能力。我们的研究从使用原始预训练数据集对 LLMs 进行轻度持续训练的经验策略入手，重点关注有选择地保留损失率适中的样本。这些样本被认为信息丰富，有利于模型的完善，与损失最大的样本形成鲜明对比，后者会因为与数据噪声和复杂性相关而被舍弃。然后，我们将这一策略形式化为实例重加权分布稳健优化（IR-DRO）的原则性框架。IR-DRO 的设计目的是通过实例重权机制，动态地将训练重点优先放在信息样本上，并通过闭式解决方案进行简化，以便直接集成到既定的训练协议中。通过对各种模型和数据集的严格实验，我们的研究结果表明，在持续预训练和指令调整场景中，我们的样本定向方法显著提高了多个基准的 LLM 性能。我们的代码见 https://github.com/VITA-Group/HardFocusTraining。

8.Can Large Language Models Detect Misinformation in Scientific News Reporting?

标题:大型语言模型能否发现科学新闻报道中的错误信息？

author:Yupeng Cao, Aishwarya Muralidharan Nair, Elyon Eyimife, Nastaran Jamalipour Soofi, K. P. Subbalakshmi, John R. Wullert II, Chumki Basu, David Shallcross

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14268v1

摘要：
科学事实经常被大众媒体歪曲，目的是影响公众舆论和行动，这在 COVID-19 大流行期间就有所体现。自动检测科学领域的错误信息是一项挑战，因为这两种媒体的写作风格截然不同，而且仍处于起步阶段。大多数关于科学报道有效性的研究都将这一问题视为索赔验证难题。在此过程中，需要大量的专家人力来生成适当的声明。我们的解决方案绕过了这一步骤，解决了现实世界中可能无法获得这种明确、标注的声明的问题。本文的核心研究问题是，是否有可能使用大型语言模型（LLM）来检测科学报告中的错误信息。为此，我们首先提出了一个新的标注数据集 SciNews，其中包含来自可信和不可信来源的 2.4k 篇科学新闻报道，以及 CORD-19 数据库中的相关摘要。我们的数据集既包括人工撰写的新闻文章，也包括由 LLM 生成的新闻文章，因此在捕捉使用 LLM 生成热门新闻文章这一日益增长的趋势方面更加全面。然后，我们确定了科学新闻文章中的科学有效性维度，并探讨了如何将其整合到科学错误信息的自动检测中。我们提出了几种使用 LLM 自动检测大众媒体中科学发现的虚假表述的基准架构。对于每个架构，我们都使用了几种提示工程策略，包括零点提示、少量提示和思维链提示。我们还在 GPT-3.5、GPT-4 和 Llama2-7B、Llama2-13B 上测试了这些架构和提示策略。

9.FanOutQA: Multi-Hop, Multi-Document Question Answering for Large Language Models

标题:FanOutQA：大型语言模型的多跳、多文档问题解答

author:Andrew Zhu, Alyssa Hwang, Liam Dugan, Chris Callison-Burch

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14116v1

摘要：
日常场景中常见的一类问题是 "fan-out "问题，即需要查找大量实体信息的复杂的多跳、多文档推理问题。然而，目前用于评估大型语言模型中此类问题解答能力的资源很少。为了更全面地评估 LLM 的复杂推理能力，我们提出了 FanOutQA，这是一个以英语维基百科为知识基础的高质量数据集，包含扇出问题-答案对和人类注释的分解。我们在数据集上制定了三个基准设置，并对 GPT-4、LLaMA 2、Claude-2.1 和 Mixtral-8x7B 等 7 个 LLM 进行了基准测试，发现当代模型仍有改进长语境下文档间依赖关系推理的空间。我们提供了数据集和运行模型的开源工具，以鼓励在 https://fanoutqa.com 上进行评估。

10.LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons

标题:LexC-Gen：利用大型语言模型和双语词典为资源极少的语言生成数据

author:Zheng-Xin Yong, Cristina Menghini, Stephen H. Bach

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14086v1

摘要：
低资源语言的数据匮乏问题可以通过使用双语词典从高资源语言的标注任务数据中进行词对词翻译来解决。然而，双语词典通常与任务数据的词汇重叠有限，导致翻译覆盖率和词典利用率低下。我们提出了词典条件数据生成（LexC-Gen），这是一种大规模生成低资源语言分类任务数据的方法。具体来说，LexC-Gen 首先使用双语词典中的高资源语言词汇生成与词典兼容的任务数据，然后通过单词翻译将其翻译成具有双语词典的低资源语言。在 17 种资源极度匮乏的语言中，LexC-Gen 生成的数据与专家翻译的黄金数据相比具有竞争力，在情感分析和主题分类任务上分别比现有的基于词典的单词翻译方法平均提高了 5.6 分和 8.9 分。我们表明，以双语词典为条件是 LexC-Gen 的关键组成部分。LexC-Gen 也很实用–它只需要一个 GPU 就能大规模生成数据。它能很好地与开放访问的 LLM 配合使用，其成本仅为基于 GPT4 的多语言数据生成成本的五分之一。

11.Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models

标题:水印能否经得起翻译？论大语言模型文本水印的跨语言一致性

author:Zhiwei He, Binglin Zhou, Hongkun Hao, Aiwei Liu, Xing Wang, Zhaopeng Tu, Zhuosheng Zhang, Rui Wang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14007v1

摘要：
文本水印技术旨在标记和识别由大型语言模型（LLM）生成的内容，以防止滥用。在本研究中，我们引入了文本水印的 "跨语言一致性 "概念，即评估文本水印在翻译成其他语言后保持其有效性的能力。两种 LLM 和三种水印方法的初步实证结果表明，当前的文本水印技术在文本被翻译成不同语言时缺乏一致性。基于这一观察结果，我们提出了一种跨语言水印去除攻击（CWRA），通过首先从一种支点语言的 LLM 获取响应，然后将其翻译成目标语言，从而绕过水印。CWRA 可以有效去除水印，将曲线下面积（AUC）从 0.95 降低到 0.67，而不会造成性能损失。此外，我们还分析了导致文本水印跨语言一致性的两个关键因素，并提出了一种防御方法，可将 CWRA 下的 AUC 从 0.67 提高到 0.88。

12.Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models

标题:幻觉还是注意力误导？利用大型语言模型挖掘商业战略价值之路

author:Aline Ioste

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14002v1

摘要：
采用转换器架构的大型语言模型在文本生成领域掀起了一场革命，树立了前所未有的标杆。尽管大型语言模型的能力令人印象深刻，但也有人批评它们生成的结果偏离事实准确性或显示逻辑不一致，这些现象通常被称为幻觉。然而，这一术语往往被误用于任何偏离教师预期的结果，本文将其定义为注意力误导，而非真正的幻觉。在商业环境中，理解幻觉和注意力误导之间的区别变得越来越重要，因为这种错误的后果会严重影响从这些固有的预训练模型中提取价值。本文重点介绍了 PGI（角色、分组和智能）方法的最佳实践，该方法是一个战略框架，在应对实际业务挑战时，GPT 生成的 4,000 个回复中，错误率仅为 3.15%，成绩斐然。报告强调，通过为实验配备知识，企业可以利用这些原生预训练模型释放创新机会。这强化了一个概念，即以熟练团队为基础的战略应用可以最大限度地发挥 LLMs 等新兴技术的优势。

13.What Linguistic Features and Languages are Important in LLM Translation?

标题:哪些语言特点和语言在 LLM 翻译中很重要？

author:Ryandito Diandaru, Lucky Susanto, Zilu Tang, Ayu Purwarianti, Derry Wijaya

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13917v1

摘要：
大型语言模型（LLM）在包括机器翻译在内的多项任务中表现出强大的能力。我们的研究重点是评估 Llama2 的机器翻译能力，并探索翻译如何取决于其训练数据中的语言。我们的实验表明，7B Llama2 模型在所有见过的语言中都能获得高于 10 的 BLEU 分数，但在没见过的语言中却不一定。与使用聊天版本或增加拍摄次数相比，使用该模型规模对那些未见过的语言的增益最大。此外，我们的语言距离分析表明，句法相似性并不总是决定翻译质量的主要语言因素。有趣的是，我们发现在特定情况下，尽管某些语言的训练数据比英语少得多，但却表现出与英语相当的强相关性。我们在这里的发现为当前的 LLMs 提供了新的视角，使以英语以外的语言为中心的 LLMs 有可能为多语言模型提供更有效的基础。

14.LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens

标题:LongRoPE：将 LLM 上下文窗口扩展到 200 万个代币以上

author:Yiran Ding, Li Lyna Zhang, Chengruidong Zhang, Yuanyuan Xu, Ning Shang, Jiahang Xu, Fan Yang, Mao Yang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13753v1

摘要：
大语境窗口是大型语言模型（LLM）的理想功能。然而，由于微调成本高、长文本稀缺以及新标记位置引入的灾难性值，目前的扩展上下文窗口仅限于 128k 左右的标记。本文介绍了 LongRoPE，它首次将预训练 LLM 的上下文窗口扩展到了令人印象深刻的 2048k 标记，在 256k 的训练长度内只需 1k 个微调步骤，同时保持了原始短上下文窗口的性能。这是通过三项关键创新实现的：(i) 我们通过高效搜索识别并利用位置插值中的两种不均匀性，为微调提供更好的初始化，并在非微调情况下实现 8 倍扩展；(ii) 我们引入渐进扩展策略，首先微调 256k 长度的 LLM，然后在微调扩展的 LLM 上进行第二次位置插值，以实现 2048k 上下文窗口；(iii) 我们在 8k 长度上重新调整 LongRoPE，以恢复短上下文窗口性能。在 LLaMA2 和 Mistral 上对各种任务进行的大量实验证明了我们方法的有效性。通过 LongRoPE 扩展的模型保留了原始架构，只对位置嵌入稍作修改，并且可以重复使用大部分已有的优化。

15.From Text to CQL: Bridging Natural Language and Corpus Search Engine

标题:从文本到 CQL：衔接自然语言和语料库搜索引擎

author:Luming Lu, Jiyuan An, Yujie Wang, Liner yang, Cunliang Kong, Zhenghao Liu, Shuo Wang, Haozhe Lin, Mingwei Fang, Yaping Huang, Erhong Yang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13740v1

摘要：
自然语言处理（NLP）技术彻底改变了我们与信息系统交互的方式，其重点是将自然语言查询转换为正式查询语言（如 SQL）。然而，人们对语料库查询语言（CQL）的重视程度较低，而 CQL 是语言学研究和文本语料库详细分析的重要工具。手动构建 CQL 查询是一项复杂而耗时的任务，需要大量的专业知识，这对研究人员和从业人员都是一个显著的挑战。本文首次提出了文本到 CQL 任务，旨在将自然语言自动翻译成 CQL。我们为这项任务提出了一个全面的框架，包括一个专门策划的大规模数据集和利用大型语言模型（LLM）的方法，以有效地完成文本到 CQL 任务。此外，我们还建立了先进的评估指标，以评估生成查询的语法和语义准确性。我们创建了基于 LLM 的创新转换方法并进行了详细的实验。实验结果证明了我们方法的有效性，并让我们深入了解了文本到 CQL 任务的复杂性。

16. $\infty$ Bench: Extending Long Context Evaluation Beyond 100K Tokens

标题: $in f t y$ Bench：将长语境评估扩展到 100K 标记之外

author:Xinrong Zhang, Yingfa Chen, Shengding Hu, Zihang Xu, Junhao Chen, Moo Khai Hao, Xu Han, Zhen Leng Thai, Shuo Wang, Zhiyuan Liu, Maosong Sun

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13718v2

摘要：
处理和推理长语境对于大型语言模型（LLM）的许多实际应用（如文档理解和代理构建）至关重要。尽管最近在使 LLM 处理超过 10 万个词组的上下文方面取得了长足进步，但目前仍缺乏评估这种长上下文能力的标准化基准。现有的公开基准通常侧重于 10K 左右的上下文，这限制了对 LLM 处理更长上下文的评估和比较。在本文中，我们提出了 $\infty$ Bench，它是第一个平均数据长度超过 10 万 token 的 LLM 基准。 $\infty$ Bench由跨不同领域的合成任务和现实任务组成，以中英文两种语言呈现。 $\infty$ Bench中的任务需要很好地理解上下文中的长依赖关系，因此仅仅从上下文中检索有限数量的段落不足以完成这些任务。在基于 $\infty$ Bench 的实验中，我们评估了专为处理长上下文而定制的最先进的专有和开源 LLM。结果表明，现有的长上下文 LLM 仍需大幅改进，才能有效处理 100K 以上的上下文。我们进一步介绍了有关处理长上下文的 LLM 行为的三项引人入胜的分析。

17.Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent

标题:Neeko：利用动态 LoRA 实现高效的多角色角色扮演代理

author:Xiaoyan Yu, Tongxu Luo, Yifan Wei, Fangyu Lei, Yiming Huang, Peng Hao, Liehuang Zhu

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13717v1

摘要：
大型语言模型（LLM）为开放域对话代理带来了革命性的变化，但在多角色扮演（MCRP）场景中却遇到了挑战。为了解决这个问题，我们提出了 Neeko，这是一个专为高效多角色模仿而设计的创新框架。与现有方法不同，Neeko 采用了动态低等级适配器（LoRA）策略，使其能够无缝适应各种角色。我们的框架将角色扮演过程分解为代理预培训、多角色扮演和角色增量学习，可有效处理见过和没见过的角色。这种动态方法与每个角色独特的 LoRA 模块相结合，增强了 Neeko 对独特属性、个性和说话模式的适应性。因此，与大多数现有方法相比，Neeko 在 MCRP 中表现出了卓越的性能，为用户提供了更具吸引力和更多用途的交互体验。代码和数据请访问 https://github.com/weiyifan1023/Neeko。

18.GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model

标题:GCOF：利用大语言模型自迭代生成文案文本

author:Jianghui Zhou, Ya Gao, Jie Liu, Xuemin Zhao, Zhaohua Yang, Yue Wu, Lirong Shi

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13667v1

摘要：
大型语言模型（LLM）（如 ChatGPT）大大简化了营销文案的生成，但要制作出满足特定领域要求（如有效吸引客户）的内容仍然是一项重大挑战。在这项工作中，我们引入了遗传文案优化框架（GCOF），旨在提高营销文案创建的效率和吸引力。我们在 LLM 的提示中进行了明确的特征工程。此外，我们还修改了遗传算法（GA）中的交叉算子，将其集成到 GCOF 中，以实现自动特征工程。这种整合促进了营销文案的自我迭代完善。与人工策划的文案相比，在线结果表明，由我们的框架生成的文案的点击率（CTR）平均提高了 50% 以上。

19.User-LLM: Efficient LLM Contextualization with User Embeddings

标题:User-LLM：利用用户嵌入实现高效的 LLM 上下文关联化

author:Lin Ning, Luyang Liu, Jiaxing Wu, Neo Wu, Devora Berlowitz, Sushant Prakash, Bradley Green, Shawn O’Banion, Jun Xie

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13598v1

摘要：
大型语言模型（LLM）为自然语言处理带来了革命性的变化。然而，有效整合复杂且可能存在噪声的用户交互数据仍然是一项挑战。为了解决这个问题，我们提出了 User-LLM，这是一个新颖的框架，它利用用户嵌入对 LLM 进行语境化。这些内嵌数据是通过自监督预训练从不同的用户交互中提炼出来的，可以捕捉潜在的用户偏好及其随时间的演变。我们通过交叉关注和软提示将这些用户嵌入信息与 LLM 相结合，使 LLM 能够动态地适应用户上下文。我们在 MovieLens、Amazon Review 和 Google Local Review 数据集上进行的综合实验表明，我们在各种任务中都取得了显著的性能提升。值得注意的是，在长序列任务和需要深入理解用户的任务上，我们的方法优于基于文本提示的上下文化，同时计算效率也很高。我们进一步加入了感知器层，以简化用户编码器和 LLM 之间的集成，从而降低计算需求。

20.LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

标题:语言学习者与长视频相遇：利用交互式视觉适配器促进学习者对长视频的理解

author:Yunxin Li, Xinyu Chen, Baotain Hu, Min Zhang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13546v1

摘要：
长视频理解是多媒体和人工智能交叉领域的一项重大而持续的挑战。利用大型语言模型（LLMs）理解视频成为一种新兴且前景广阔的方法。然而，由于视频标记数量庞大，这种方法的计算成本很高；标记聚合会降低视觉清晰度；在回答与视频相关的问题时，还会面临无关视觉标记带来的挑战。为了缓解这些问题，我们在 LLM 中提出了交互式视觉适配器（IVA），旨在增强与细粒度视觉元素的交互。具体来说，我们首先利用视觉编码器和经过预训练的因果转换器将长视频转换成时态视频标记，然后将它们与视频指令一起输入 LLM。随后，我们在 LLM 的内部区块中集成了 IVA，其中包含一个轻量级时帧选择器和一个空间特征交互器，以捕捉指令感知和细粒度的视觉信号。因此，拟议的视频 LLM 可通过适当的长视频建模和精确的视觉交互来促进对长视频内容的全面理解。我们在九个视频理解基准上进行了广泛的实验，实验结果表明，我们的交互式视觉适配器显著提高了视频 LLM 在长视频质量保证任务上的性能。消融研究进一步验证了 IVA 在长视频和短视频理解方面的有效性。

你可能感兴趣的:(LLMs论文时报,人工智能,语言模型,深度学习,LLM,大语言模型,论文推送)

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
今天的彭格列依然被世界游戏吓得瑟瑟发抖呢云染舒倦
前言有一天，有一个白兰的大魔王想要毁灭世界，创世者非常不高兴，于是，创始者用吞噬一切，包容一切的大空（泽田纲吉）、捉摸不定的雾（六道骸）、孤高的浮云（云雀恭弥）、愤怒的忠岚（狱寺隼人）、晕染一切的雨（山本武）、守护之雷（蓝波）、热血之晴（晴川了平）创造了七位拯救世界的勇士（用属性制造勇士），让他们跟白兰对抗。。。［白兰的力量是游戏，于是要打败他，只要同样在世界布置的游戏中，赢过白兰就行了~］图片发
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
大模型量化终极对决：FP8 vs AWQ INT4，谁才是性能与精度的王者？曦紫沐大模型人工智能大模型量化 FP8 AWQ_INT4
摘要在大模型部署与优化中，量化技术是突破性能瓶颈的关键。FP8量化与AWQINT4量化作为当前主流方案，分别以“高精度”和“极致压缩”为核心优势。本文通过表格对比二者的数据格式、精度损失、硬件依赖及适用场景，助您在不同需求下精准选择最优方案。一、数据格式：浮点与整数的底层差异FP8量化采用浮点数（FP8），包含E4M3（4位阶码+3位尾数）和E5M2（5位阶码+2位尾数）两种格式，保留动态范围；而
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
2019-04-05 诚信装饰祝希信
2019年4月5日星期五天气晴(451)六年级七班祝全文今天是清明节，都放假了，好多人外出游玩踏青。一大早醒来去提水浇菜园子，全文还在呼呼睡大觉，浇完菜园子，简单吃了点饭就去干活了。中午回到家，厨房里乱七八糟，全文自己的脏衣服也没有洗，心里感觉真不是滋味，怎么会这样？优秀的孩子不是这样的，是我不该发脾气吗？还是回家继续忙碌，他人爱怎么怎么？家庭是共同的家庭，应该都有责任去承担，不要整天说来说去。全
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.20-2024.02.25

论文目录~

1.Zero-shot cross-lingual transfer in instruction tuning of large language model

2.Scaling Efficient LLMs

3.LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition

4.Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard

5.Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?

6.Can Language Models Act as Knowledge Bases at Scale?

7.Take the Bull by the Horns: Hard Sample-Reweighted Continual Training Improves LLM Generalization

8.Can Large Language Models Detect Misinformation in Scientific News Reporting?

9.FanOutQA: Multi-Hop, Multi-Document Question Answering for Large Language Models

10.LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons

11.Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models

12.Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models

13.What Linguistic Features and Languages are Important in LLM Translation?

14.LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens

15.From Text to CQL: Bridging Natural Language and Corpus Search Engine

16. ∞ \infty ∞Bench: Extending Long Context Evaluation Beyond 100K Tokens

17.Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent

18.GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model

19.User-LLM: Efficient LLM Contextualization with User Embeddings

20.LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

你可能感兴趣的:(LLMs论文时报,人工智能,语言模型,深度学习,LLM,大语言模型,论文推送)

16. $\infty$ Bench: Extending Long Context Evaluation Beyond 100K Tokens