小小帅AIGC

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.25-2024.03.01

论文目录~

1.Arithmetic Control of LLMs for Diverse User Preferences: Directional Preference Alignment with Multi-Objective Rewards
2.Keeping LLMs Aligned After Fine-tuning: The Crucial Role of Prompt Templates
3.Meta-Task Prompting Elicits Embedding from Large Language Models
4.The First Place Solution of WSDM Cup 2024: Leveraging Large Language Models for Conversational Multi-Doc QA
5.Towards Generalist Prompting for Large Language Models by Mental Models
6.Unsupervised Information Refinement Training of Large Language Models for Retrieval-Augmented Generation
7.Cause and Effect: Can Large Language Models Truly Understand Causality?
8.Datasets for Large Language Models: A Comprehensive Survey
9.A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems
10.The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
11.Evaluating Very Long-Term Conversational Memory of LLM Agents
12.Tower: An Open Multilingual Large Language Model for Translation-Related Tasks
13.TruthX: Alleviating Hallucinations by Editing Large Language Models in Truthful Space
14.Training-Free Long-Context Scaling of Large Language Models
15.Investigating Continual Pretraining in Large Language Models: Insights and Implications
16.Speak Out of Turn: Safety Vulnerability of Large Language Models in Multi-turn Dialogue
17.When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method
18.Can Large Language Models Recall Reference Location Like Humans?
19.Do Large Language Models Latently Perform Multi-Hop Reasoning?
20.ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors
21.Improving LLM-based Machine Translation with Systematic Self-Correction
22.CodeS: Towards Building Open-source Language Models for Text-to-SQL
23.PeriodicLoRA: Breaking the Low-Rank Bottleneck in LoRA Optimization

1.Arithmetic Control of LLMs for Diverse User Preferences: Directional Preference Alignment with Multi-Objective Rewards

标题:针对不同用户偏好的 LLM 算法控制：多目标奖励的定向偏好调整

author:Haoxiang Wang, Yong Lin, Wei Xiong, Rui Yang, Shizhe Diao, Shuang Qiu, Han Zhao, Tong Zhang

publish:The code and model are released at
https://github.com/Haoxiang-Wang/directional-preference-alignment

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18571v2

摘要：
对大型语言模型（LLMs）进行细粒度控制仍然是一项重大挑战，这阻碍了它们对不同用户需求的适应性。虽然人类反馈强化学习（RLHF）在对齐 LLM 方面大有可为，但它对标量奖励的依赖往往限制了其在实际应用中捕捉不同用户偏好的能力。为了解决这一局限性，我们引入了定向偏好对齐（DPA）框架。与标量奖励的 RLHF 不同，DPA 结合了多目标奖励建模，以表示不同的偏好特征。此外，DPA 还将用户偏好建模为奖励空间中的方向（即单位向量），以实现用户偏好控制。我们的方法包括训练一个多目标奖励模型，然后用 Llama 2 采用的一种 RLHF 方法–拒绝采样微调（RSF）的偏好条件变体对 LLM 进行微调。这种方法能在各种奖励目标之间实现更好的性能权衡。与标量奖励 RLHF 相比，DPA 为用户提供了对 LLM 生成的直观控制：他们可以通过算术方法指定所需的权衡（例如，在减少啰嗦的同时提供更多帮助）。我们还通过 Mistral-7B 上的实际配准实验验证了 DPA 的有效性。我们的方法提供了对有用性和冗长性之间权衡的直接算术控制，同时保持了与直接偏好优化（DPO）等强大基线的竞争性能。

2.Keeping LLMs Aligned After Fine-tuning: The Crucial Role of Prompt Templates

标题:微调后的 LLM 保持一致：提示模板的关键作用

author:Kaifeng Lyu, Haoyu Zhao, Xinran Gu, Dingli Yu, Anirudh Goyal, Sanjeev Arora

publish:20 pages

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18540v1

摘要：
公共 LLM（如 Llama 2-Chat）推动了 LLM 研究的巨大发展。这些模型经过了对齐训练，被认为是安全的。最近，Qi 等人（2023 年）报告说，即使是良性微调（例如，在看似安全的数据集上）也会导致模型出现不安全行为。本文介绍的是减轻这种对齐损失的方法和最佳实践。通过在几个聊天模型（Meta 的 Llama 2-Chat、Mistral AI 的 Mistral 7B Instruct v0.2，以及 OpenAI 的 GPT-3.5 Turbo）上进行大量实验，本文发现微调和推理过程中使用的提示模板在保持安全一致性方面起着至关重要的作用，并提出了 “纯粹微调，安全测试”（PTST）原则–在没有安全提示的情况下对模型进行微调，但在测试时加入安全提示。在 GSM8K、ChatDoctor 和 OpenOrca 上进行的微调实验表明，PTST 显著减少了不安全行为的增加，甚至在某些情况下几乎消除了不安全行为。

3.Meta-Task Prompting Elicits Embedding from Large Language Models

标题:元任务提示从大型语言模型中提取嵌入信息

author:Yibin Lei, Di Wu, Tianyi Zhou, Tao Shen, Yu Cao, Chongyang Tao, Andrew Yates

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18458v1

摘要：
在这项工作中，我们介绍了一种新的无监督嵌入方法–带有明确单词限制的元任务提示（Meta-Task Prompting with Explicit One-Word Limitation，简称 MetaEOL），用于从大型语言模型（Large Language Models，简称 LLM）生成高质量的句子嵌入，而无需对模型进行微调或针对特定任务进行工程设计。利用元任务提示功能，MetaEOL 通过一系列精心设计的提示来引导 LLM 生成嵌入句子，这些提示涉及多个表征方面。我们的综合实验证明，从各种元任务中平均得出的嵌入结果在语义文本相似性（STS）基准测试中具有竞争力，并且在下游任务中表现出色，超过了对比训练模型。我们的研究结果为嵌入生成提出了一种新的缩放规律，为以句子为中心的各种嵌入提取提供了一种多功能、资源节约型方法。

4.The First Place Solution of WSDM Cup 2024: Leveraging Large Language Models for Conversational Multi-Doc QA

标题:WSDM Cup 2024 第一名解决方案：利用大型语言模型进行会话式多文档质量保证

author:Yiming Li, Zhao Zhang

publish:1st solution for WSDM Cup 2024

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18385v1

摘要：
对话式多文档问题解答旨在根据检索到的文档和上下文对话回答特定问题。在本文中，我们介绍了我们在 WSDM Cup 2024 的 "对话式多文档问题解答 "挑战赛中获胜的方法，该方法利用了大型语言模型（LLM）的卓越自然语言理解和生成能力。我们首先根据任务调整 LLM，然后设计了一种混合训练策略，以充分利用域内无标注数据。此外，我们还采用了先进的文本嵌入模型来过滤潜在的不相关文档，并设计和比较了几种模型组合方法。在所有这些技术的支持下，我们的解决方案最终在 "WSDM Cup 2024 "中获得了第一名，在很大程度上超越了竞争对手。源代码已在 https://github.com/zhangzhao219/WSDM-Cup-2024 上发布。

5.Towards Generalist Prompting for Large Language Models by Mental Models

标题:通过心理模型实现大型语言模型的通用提示

author:Haoxiang Guan, Jiyan He, Shuxin Zheng, En-Hong Chen, Weiming Zhang, Nenghai Yu

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18252v1

摘要：
大型语言模型（LLM）在许多任务中都表现出了令人印象深刻的性能。然而，要达到最佳性能，仍需要专门设计的提示方法。这些方法要么依赖于需要一定领域知识的特定任务实例，要么设计简单，但只能在少数类型的任务中表现出色。在这项工作中，我们尝试引入通用提示的概念，其设计原则是在广泛的任务中实现最佳或接近最佳的性能，同时无需人工选择和定制针对特定问题的提示。此外，我们还提出了 MeMo（心理模型），这是一种创新的提示方法，设计简单，却能有效满足通用提示的标准。MeMo 将各种提示方法的核心提炼为单个心智模型，并允许 LLM 自主选择最适合问题的心智模型，从而在各种任务（如 STEM、逻辑推理和零镜头环境下的常识推理）中取得或接近最先进的结果。我们希望本文提出的见解能激励人们进一步探索针对 LLM 的通用提示方法。

6.Unsupervised Information Refinement Training of Large Language Models for Retrieval-Augmented Generation

标题:无监督信息提炼训练大型语言模型，实现检索增强型生成

author:Shicheng Xu, Liang Pang, Mo Yu, Fandong Meng, Huawei Shen, Xueqi Cheng, Jie Zhou

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18150v1

摘要：
检索增强生成（RAG）通过整合来自检索的附加信息来增强大型语言模型（LLM）。然而，研究表明，大语言模型在有效利用检索信息方面仍然面临挑战，甚至会忽略检索信息或被检索信息误导。其关键原因在于，对 LLM 的训练并不能让 LLM 明确学会如何利用输入的不同质量的检索文本。在本文中，我们提出了一个新的视角，将 LLMs 在 RAG 中的角色视为 “信息提炼者”，即无论检索文本的正确性、完整性或有用性如何，LLMs 都能持续地整合检索文本中的知识和模型参数，生成比检索文本更简洁、准确和完整的文本。为此，我们提出了一种名为 InFO-RAG 的信息提炼训练方法，以无监督的方式优化 RAG 的 LLM。InFO-RAG 成本低，适用于各种任务。对包括问题解答、槽填充、语言建模、对话和代码生成在内的不同任务中的 11 个数据集的零点预测进行的广泛实验表明，InFO-RAG 平均将 LLaMA2 的性能提高了 9.39% 的相对点。InFO-RAG 在上下文学习和鲁棒性方面也显示出 RAG 的优势。

7.Cause and Effect: Can Large Language Models Truly Understand Causality?

标题:因果关系：大型语言模型能否真正理解因果关系？

author:Swagata Ashwani, Kshiteesh Hegde, Nishith Reddy Mannuru, Mayank Jindal, Dushyant Singh Sengar, Krishna Chaitanya Rao Kathala, Dishant Banga, Vinija Jain, Aman Chadha

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18139v1

摘要：
随着大型语言模型（LLMs）的兴起，了解它们在破译和解释语言所包含的复杂因果关系网络方面的能力和局限性变得至关重要。目前的方法要么使用显式因果推理，要么使用隐式因果推理，但我们亟需一种将两者结合起来的统一方法，以更有效地处理各种因果关系。本研究提出了一种名为 "情境感知推理增强与反事实分析（CARE CA）"框架的新架构，以增强因果推理和可解释性。所提出的框架包含一个带有 ConceptNet 和反事实陈述的显式因果检测模块，以及通过 LLMs 进行的隐式因果检测。我们的框架更进一步，增加了一层反事实解释，以加强 LLM 对因果关系的理解。来自 ConceptNet 的知识增强了多种因果推理任务的性能，如因果发现、因果识别和反事实推理。反事实句子增加了非因果情景的明确知识。通过结合这些功能强大的模块，我们的模型旨在提供对因果关系的更深入理解，从而增强可解释性。对基准数据集的评估表明，在准确率、精确度、召回率和 F1 分数等所有指标上，我们的模型都取得了更好的性能。我们还介绍了 CausalNet，这是一个新的数据集，并附有我们的代码，以促进该领域的进一步研究。

8.Datasets for Large Language Models: A Comprehensive Survey

标题:大型语言模型的数据集：全面调查

author:Yang Liu, Jiahuan Cao, Chongyu Liu, Kai Ding, Lianwen Jin

publish:181 pages, 21 figures

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18041v1

摘要：
本文开始探索大型语言模型（LLM）数据集，这些数据集在 LLM 的显著进步中发挥着至关重要的作用。这些数据集是基础架构，类似于支撑和培育 LLM 发展的根系统。因此，对这些数据集的研究成为研究中的一个重要课题。为了解决目前缺乏对 LLM 数据集的全面概述和透彻分析的问题，并深入了解这些数据集的现状和未来趋势，本调查从五个方面对 LLM 数据集的基本方面进行了整合和分类：(1) 预训练语料库；(2) 指令微调数据集；(3) 偏好数据集；(4) 评估数据集；(5) 传统自然语言处理 (NLP) 数据集。调查揭示了当前面临的挑战，并指出了未来研究的潜在途径。此外，还对现有的数据集资源进行了全面回顾，包括来自 444 个数据集的统计数据，涵盖 8 个语言类别和 32 个领域。数据集统计包含 20 个维度的信息。调查的总数据量超过了 774.5 TB（预训练语料库）和 7 亿个实例（其他数据集）。我们的目标是展示 LLM 文本数据集的全貌，为该领域的研究人员提供全面的参考，并为未来的研究做出贡献。相关资源请访问：https://github.com/lmmlzn/Awesome-LLMs-Datasets。

9.A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems

标题:基于 LLM 的多轮对话系统最新进展概览

author:Zihao Yi, Jiarui Ouyang, Yuwen Liu, Tianhao Liao, Zhe Xu, Ying Shen

publish:35 pages, 10 figures, ACM Computing Surveys

date Time:2024-02-28

paper pdf:http://arxiv.org/pdf/2402.18013v1

摘要：
本调查报告全面回顾了多轮对话系统的研究，尤其关注基于大型语言模型（LLM）的多轮对话系统。本文旨在：(a) 总结现有的大型语言模型和使大型语言模型适应下游任务的方法；(b) 阐述多轮对话系统的最新进展，包括基于大型语言模型的开放域对话（ODD）系统和面向任务的对话（TOD）系统，以及数据集和评估指标；© 讨论大型语言模型的发展和对多轮对话系统日益增长的需求所带来的一些未来重点和最新研究问题。

10.The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

标题:1 位 LLM 时代：所有大型语言模型均为 1.58 位

author:Shuming Ma, Hongyu Wang, Lingxiao Ma, Lei Wang, Wenhui Wang, Shaohan Huang, Li Dong, Ruiping Wang, Jilong Xue, Furu Wei

publish:Work in progress

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17764v1

摘要：
最近的研究，如 BitNet，正在为 1 位大语言模型（LLM）的新时代铺平道路。在这项工作中，我们引入了一种 1 位 LLM 变体，即 BitNet b1.58，其中 LLM 的每个参数（或权重）都是三元{-1, 0, 1}。在困惑度和任务结束性能方面，它与具有相同模型大小和训练令牌的全精度（即 FP16 或 BF16）Transformer LLM 相匹配，同时在延迟、内存、吞吐量和能耗方面明显更具成本效益。更深远的意义在于，1.58 位 LLM 定义了一种新的缩放规律，也是训练新一代 LLM 的秘诀，这种 LLM 性能高、成本低。此外，它还实现了一种新的计算模式，并为设计针对 1 位 LLM 进行优化的特定硬件打开了大门。

11.Evaluating Very Long-Term Conversational Memory of LLM Agents

标题:评估 LLM 代理的超长期对话记忆

author:Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov, Mohit Bansal, Francesco Barbieri, Yuwei Fang

publish:19 pages; Project page: https://snap-research.github.io/locomo/

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17753v1

摘要：
关于长期开放域对话的现有研究主要集中在评估模型在不超过五个聊天会话的上下文中的反应。尽管长语境大型语言模型（LLMs）和检索增强生成（RAG）技术取得了进步，但它们在长期对话中的功效仍有待探索。为了填补这一研究空白，我们引入了一种机器-人工管道，利用基于 LLM 的代理架构，并将其对话建立在角色和时间事件图的基础上，从而生成高质量的长期对话。此外，我们还为每个代理配备了共享图像和对图像做出反应的功能。生成的对话将由人类注释者进行验证和编辑，以确保长距离一致性和事件图的基础性。利用这一管道，我们收集了 LoCoMo，这是一个包含长期对话的数据集，每个对话在长达 35 个会话中平均包含 300 个回合和 9K 个标记。在 LoCoMo 的基础上，我们提出了衡量模型中长期记忆的综合评估基准，包括问题解答、事件总结和多模态对话生成任务。我们的实验结果表明，长时记忆模型在理解冗长对话和理解对话中的长时动态和因果动态方面面临挑战。采用长语境 LLMs 或 RAG 等策略可以有所改进，但这些模型仍然大大落后于人类的表现。

12.Tower: An Open Multilingual Large Language Model for Translation-Related Tasks

标题:塔用于翻译相关任务的开放式多语种大语言模型

author:Duarte M. Alves, José Pombal, Nuno M. Guerreiro, Pedro H. Martins, João Alves, Amin Farajian, Ben Peters, Ricardo Rei, Patrick Fernandes, Sweta Agrawal, Pierre Colombo, José G. C. de Souza, André F. T. Martins

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17733v1

摘要：
虽然通用大型语言模型（LLM）在翻译领域的多个任务上都表现出了卓越的能力，但基于开放式 LLM 的方法只有在专门处理单一任务时才具有竞争力。在本文中，我们提出了一种针对翻译工作流中的多种任务定制 LLM 的方法。我们在单语和平行数据的多语种混合物上进行持续的预训练，创建了 TowerBase，然后在与翻译流程相关的指令上进行微调，创建了 TowerInstruct。我们的最终模型在多个与翻译工作流相关的任务上超越了其他开放式模型，与通用封闭式 LLM 相比也具有竞争力。为了促进未来的研究，我们在我们的基准上发布了 Tower 模型、我们的专业化数据集、专注于翻译生态系统的 LLM 评估框架，以及包括我们在内的模型生成集合。

13.TruthX: Alleviating Hallucinations by Editing Large Language Models in Truthful Space

标题:TruthX：通过编辑真实空间中的大型语言模型缓解幻觉

author:Shaolei Zhang, Tian Yu, Yang Feng

publish:Code: https://github.com/ictnlp/TruthX, A Llama-2-7B-Chat model with
baked-in TruthX: https:// huggingface.co/ICTNLP/Llama-2-7b-chat-TruthX

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17811v1

摘要：
大型语言模型（LLM）在各种任务中都表现出了非凡的能力。然而，它们有时也会产生幻觉，特别是在拥有正确知识的情况下，它们可能会产生不真实的回答。在本文中，我们提出了 TruthX，这是一种推理时方法，可通过编辑 LLMs 在真实空间中的内部表征来激发其真实性。TruthX 采用自动编码器将 LLM 的表征分别映射到语义空间和真实潜在空间中，并应用对比学习来确定真实空间中的真实编辑方向。在推理过程中，通过编辑 LLM 在真实空间中的内部表征，TruthX 可以有效提高 LLM 的真实性。实验表明，在 TruthfulQA 基准测试中，TruthX 有效地提高了 13 个高级 LLM 的真实性，平均提高了 20%。进一步的分析表明，TruthX 获取的真实空间在控制 LLM 产生真实或幻觉反应方面发挥了关键作用。

14.Training-Free Long-Context Scaling of Large Language Models

标题:大型语言模型的免训练长语境扩展

author:Chenxin An, Fei Huang, Jun Zhang, Shansan Gong, Xipeng Qiu, Chang Zhou, Lingpeng Kong

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17463v1

摘要：
当输入标记的数量超过预训练长度时，大型语言模型（LLM）处理和生成连贯文本的能力就会明显减弱。考虑到使用较长序列对大型模型进行微调的高昂开销，我们提出了双块注意力（DCA），使 Llama2 70B 无需持续训练即可支持超过 100k 标记的上下文窗口。通过将长序列的注意力计算分解为基于分块的模块，DCA 能够有效捕捉同一分块内（Intra-Chunk）和不同分块间（Inter-Chunk）标记的相对位置信息，并与 Flash Attention 无缝集成。除了令人印象深刻的外推能力外，DCA 在实际的长语境任务中的表现与微调模型相当，甚至更好。与专有模型相比，我们的免训练 70B 模型达到了 gpt-3.5-16k 性能的 94%，这表明它是一个可行的开源替代方案。这项工作中使用的所有代码和数据都发布在 \url{https://github.com/HKUNLP/ChunkLlama} 上。

15.Investigating Continual Pretraining in Large Language Models: Insights and Implications

标题:调查大型语言模型中的持续预训练：见解与启示

author:Çağatay Yıldız, Nishaanth Kanna Ravichandran, Prishruit Punia, Matthias Bethge, Beyza Ermis

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17400v1

摘要：
本文研究了大型语言模型（LLM）中不断发展的持续学习（CL）领域，重点是开发高效和可持续的训练策略。我们的主要重点是持续的领域自适应预训练，这一过程旨在使 LLM 具备整合来自不同领域的新信息的能力，同时保留以前学习的知识，并在不依赖特定领域识别的情况下加强跨领域知识转移。以往的研究大多集中在有限的任务或领域选择上，主要目的是解决遗忘问题，与此不同，我们的研究评估的是 LLM 在实际场景中对不断变化的数据景观的适应性和能力。为此，我们引入了一个新的基准，旨在衡量 LLM 对这些不断变化的数据环境的适应性，从而提供一个全面的评估框架。我们研究了模型大小对学习效率和遗忘的影响，以及新兴领域的进展和相似性如何影响这些模型内的知识转移。我们的研究结果揭示了几个关键见解：(i) 当领域序列显示出语义相似性时，与单独的微调相比，持续的预训练能使 LLM 更好地专注于当前领域；(ii) 跨不同领域的训练能增强后向和前向知识转移；(iii) 较小的模型对持续的预训练特别敏感，其遗忘率和学习率都最为显著。我们认为，我们的研究标志着在研究 LLM 中的 CL 方面，我们正朝着建立一个更切合实际的基准迈进，并有可能在指导该领域未来研究方向方面发挥关键作用。

16.Speak Out of Turn: Safety Vulnerability of Large Language Models in Multi-turn Dialogue

标题:越权发言：多轮对话中大型语言模型的安全漏洞

author:Zhenhong Zhou, Jiuyang Xiang, Haopeng Chen, Quan Liu, Zherui Li, Sen Su

publish:working in progress 23pages, 18 figures

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17262v1

摘要：
大型语言模型（LLMs）已被证明会产生非法或不道德的反应，尤其是在 "越狱 "的情况下。有关 "越狱 "的研究凸显了大型语言模型的安全问题。然而，之前的研究主要集中在单轮对话上，忽略了多轮对话可能带来的复杂性和风险，而多轮对话是人类从 LLMs 获取信息的重要模式。本文认为，人类可以利用多轮对话诱导 LLM 生成有害信息。在多轮对话中，即使每轮对话都是为了一个恶意目的而进行的，LLM 也可能无意拒绝警示性或边缘性的不安全查询。因此，通过将一个不安全查询分解为多个多轮对话的子查询，我们诱导 LLM 逐步回答有害的子问题，最终形成一个整体的有害响应。我们在多种 LLM 中进行的实验表明，目前多轮对话中的 LLM 安全机制存在不足。我们的研究结果揭示了在涉及多轮对话的复杂场景中 LLM 的脆弱性，为 LLM 的安全性提出了新的挑战。

17.When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method

标题:当缩放遇到 LLM 微调：数据、模型和微调方法的影响

author:Biao Zhang, Zhongtao Liu, Colin Cherry, Orhan Firat

publish:ICLR24

date Time:2024-02-27

paper pdf:http://arxiv.org/pdf/2402.17193v1

摘要：
虽然大型语言模型（LLM）经常采用微调来释放其在下游应用中的能力，但我们对不同微调方法的归纳偏差（尤其是缩放特性）的了解仍然有限。为了填补这一空白，我们进行了系统实验，研究不同的缩放因子（包括 LLM 模型大小、预训练数据大小、新微调参数大小和微调数据大小）是否以及如何影响微调性能。我们考虑了两种类型的微调–全模型微调（FMT）和参数高效微调（PET，包括及时微调和 LoRA），并探讨了它们在数据有限机制下的缩放行为，在这种机制下，LLM 模型的大小大大超过了微调数据的大小。基于从 1B 到 16B 的两组预训练双语 LLM，以及在双语机器翻译和多语摘要基准上的实验，我们发现：1）LLM 微调遵循微调数据大小和每个其他缩放因子之间基于幂的乘法联合缩放规律；2）LLM 微调更多受益于 LLM 模型缩放而非预训练数据缩放，而 PET 参数缩放通常无效；3）最佳微调方法高度依赖于任务和微调数据。我们希望我们的发现能对理解、选择和开发 LLM 微调方法有所启发。

18.Can Large Language Models Recall Reference Location Like Humans?

标题:大型语言模型能像人类一样回忆参考位置吗？

author:Ye Wang, Xinrun Xu, Rui Xie, Wenxin Hu, Wei Ye

date Time:2024-02-26

paper pdf:http://arxiv.org/pdf/2402.17010v1

摘要：
在完成知识密集型任务时，人类有时不仅需要答案，还需要相应的参考段落进行辅助阅读。以往的方法需要通过额外的检索模型来获取预先分割好的文章块。本文探讨了如何利用大语言模型（LLM）预训练阶段存储的参数化知识，从任意起始位置独立调用参考段落。我们提出了一个两阶段框架，模拟人类回忆容易遗忘的参考文献的情景。首先，提示 LLM 回想文档标题标识符，以获得粗粒度文档集。然后，在获得的粗粒度文档集的基础上，再召回细粒度段落。在两阶段的召回过程中，我们使用了约束解码，以确保不会生成存储文档之外的内容。为了提高速度，我们在第二阶段只召回短前缀，然后定位其位置以检索完整段落。在 KILT 知识敏感任务上的实验验证了 LLMs 可以在各种任务形式中独立地召回参考段落位置，所获得的参考段落对下游任务有很大帮助。

19.Do Large Language Models Latently Perform Multi-Hop Reasoning?

标题:大型语言模型是否能潜在执行多跳推理？

author:Sohee Yang, Elena Gribovskaya, Nora Kassner, Mor Geva, Sebastian Riedel

date Time:2024-02-26

paper pdf:http://arxiv.org/pdf/2402.16837v1

摘要：
我们研究了大型语言模型（LLMs）是否会对诸如"'Superstition’歌手的母亲是 “这样的复杂提示进行多跳推理。我们寻找一种潜在推理路径的证据，在这种路径中，大型语言模型（LLM）（1）将”'Superstition’的歌手 "潜在地识别为桥梁实体 Stevie Wonder，（2）使用其关于 Stevie Wonder 母亲的知识来完成提示。我们单独分析这两个跳转，并将它们的共同出现视为潜在多跳推理的标志。对于第一跳，我们测试的是改变提示间接提及桥梁实体而不是其他实体是否会增加 LLM 对桥梁实体的内部回忆。对于第二跳，我们测试这种回忆的增加是否会使 LLM 更好地利用它对桥梁实体的了解。在某些关系类型的提示中，我们发现了潜在多跳推理的有力证据，80% 以上的提示都使用了推理路径。不过，推理途径的使用与具体情况密切相关，不同类型的提示会有不同的使用情况。而且，平均而言，第二跳和完整多跳遍历的证据相当有限，只有第一跳的证据相当可观。此外，我们还发现，随着模型规模的增大，第一跳推理有明显的缩放趋势，但第二跳则没有。我们的实验结果为 LLMs 未来的发展和应用提出了潜在的挑战和机遇。

20.ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors

标题:ShieldLM：增强 LLM 的能力，使其成为一致、可定制和可解释的安全探测器

author:Zhexin Zhang, Yida Lu, Jingyuan Ma, Di Zhang, Rui Li, Pei Ke, Hao Sun, Lei Sha, Zhifang Sui, Hongning Wang, Minlie Huang

publish:17 pages

date Time:2024-02-26

paper pdf:http://arxiv.org/pdf/2402.16444v1

摘要：
近年来，大型语言模型（LLM）的安全性越来越受到人们的关注，但仍然缺乏一种全面的方法，以统一、可定制和可解释的方式检测 LLM 响应中的安全问题。在本文中，我们提出了基于 LLM 的安全检测器 ShieldLM，它符合一般的人类安全标准，支持可定制的检测规则，并能对其决定做出解释。为了训练 ShieldLM，我们编制了一个大型双语数据集，其中包括 14,387 个查询-响应对，并根据各种安全标准对响应的安全性进行了注释。通过广泛的实验，我们证明了 ShieldLM 在四个测试集上超越了强大的基线，展示了出色的可定制性和可解释性。除了在标准检测数据集上表现出色外，ShieldLM 作为高级 LLM 的安全评估工具在现实世界中也被证明是有效的。我们在 \url{https://github.com/thu-coai/ShieldLM} 上发布了 ShieldLM，以支持在各种安全标准下进行准确且可解释的安全检测，为不断提高 LLM 的安全性做出贡献。

21.Improving LLM-based Machine Translation with Systematic Self-Correction

标题:用系统自校正改进基于 LLM 的机器翻译

author:Zhaopeng Feng, Yan Zhang, Hao Li, Wenqiang Liu, Jun Lang, Yang Feng, Jian Wu, Zuozhu Liu

date Time:2024-02-26

paper pdf:http://arxiv.org/pdf/2402.16379v1

摘要：
大型语言模型（LLM）在机器翻译（MT）领域取得了令人瞩目的成就。然而，通过人工仔细评估发现，大型语言模型生成的译文仍然包含多种错误。重要的是，将这些错误信息反馈给 LLM 可以实现自我修正，从而提高翻译性能。受这些见解的启发，我们引入了一个基于 LLM 的系统化自我校正翻译框架，命名为 TER（Translate, Estimate, and Refine），标志着我们在这一方向上迈出了重要一步。我们的研究结果表明：1）无论是从高资源语言到低资源语言，还是以英语为中心或以其他语言为中心，我们的自校正框架都能成功帮助 LLM 提高各种语言的翻译质量；2）与之前的方法相比，TER 表现出更高的系统性和可解释性；3）不同的估算策略会对人工智能反馈产生不同的影响，直接影响最终校正的效果。我们进一步比较了不同的 LLM，并进行了涉及自校正和跨模型校正的各种实验，以研究 LLM 的翻译和评估能力之间的潜在关系。

22.CodeS: Towards Building Open-source Language Models for Text-to-SQL

标题:CodeS：为文本到 SQL 构建开源语言模型

author:Haoyang Li, Jing Zhang, Hanbing Liu, Ju Fan, Xiaokang Zhang, Jun Zhu, Renjie Wei, Hongyan Pan, Cuiping Li, Hong Chen

publish:Accepted to SIGMOD 2024

date Time:2024-02-26

paper pdf:http://arxiv.org/pdf/2402.16347v1

摘要：
语言模型在将自然语言问题翻译成 SQL 查询（文本到 SQL）的任务中表现出了良好的性能。然而，大多数最先进的（SOTA）方法都依赖于强大但闭源的大型语言模型（LLM），如 ChatGPT 和 GPT-4，这些模型可能存在模型架构不清晰、数据隐私风险和推理开销昂贵等局限性。为了解决这些局限性，我们引入了 CodeS，这是一系列预先训练好的语言模型，参数范围从 1B 到 15B，专为文本到 SQL 任务而设计。CodeS 是一种完全开源的语言模型，它能以更小的参数规模实现更高的准确性。本文研究了构建 CodeS 所面临的研究挑战。为了提高 CodeS 的 SQL 生成能力，我们采用了一种增量预训练方法，使用专门策划的以 SQL 为中心的语料库。在此基础上，我们通过战略性提示构建和双向数据增强技术，解决了模式链接和快速领域适应的难题。我们在多个数据集上进行了全面评估，包括广泛使用的 Spider 基准、最新发布的 BIRD 基准、鲁棒性诊断基准（如 Spider-DK、Spider-Syn、Spider-Realistic 和 Dr.Spider），以及为金融和学术应用创建的两个真实世界数据集。实验结果表明，我们的 CodeS 在几乎所有具有挑战性的文本到 SQL 基准上都达到了新的 SOTA 准确性和鲁棒性。

23.PeriodicLoRA: Breaking the Low-Rank Bottleneck in LoRA Optimization

标题:PeriodicLoRA：打破 LoRA 优化中的低链瓶颈

author:Xiangdi Meng, Damai Dai, Weiyao Luo, Zhe Yang, Shaoxiang Wu, Xiaochen Wang, Peiyi Wang, Qingxiu Dong, Liang Chen, Zhifang Sui

date Time:2024-02-25

paper pdf:http://arxiv.org/pdf/2402.16141v1

摘要：
监督微调是使大型语言模型（LLM）适应下游任务的最常用方法，但对 LLM 进行全面微调需要大量计算资源。最近，参数效率微调（PEFT）方法因其成本效益而被广泛研究。LoRA 是应用最广泛的方法之一，它假定优化过程本质上是低维的。虽然 LoRA 微调很有效，但与完全微调相比，其性能仍有差距，因为其权重更新仅限于低秩矩阵。为了打破 LoRA 优化中的低秩瓶颈，我们提出了周期性 LoRA（PLoRA），通过多次累积低秩更新矩阵来获得更高的更新秩。PLoRA 有多个训练阶段。在每个阶段，我们仍然只更新 LoRA 权重。不过，在每个阶段结束时，我们会将 LoRA 权重卸载到主干参数中，然后重新初始化 LoRA 状态。实验结果表明，PLoRA 具有更强的学习能力，最多约为 LoRA 学习能力的 1.8 倍，但不会增加内存使用量。此外，我们还为 PLoRA 引入了基于动量的卸载策略，以减轻训练的不稳定性。

你可能感兴趣的:(LLMs论文时报,人工智能,语言模型,自然语言处理,LLM,大语言模型,深度学习,论文推送)

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
今天的彭格列依然被世界游戏吓得瑟瑟发抖呢云染舒倦
前言有一天，有一个白兰的大魔王想要毁灭世界，创世者非常不高兴，于是，创始者用吞噬一切，包容一切的大空（泽田纲吉）、捉摸不定的雾（六道骸）、孤高的浮云（云雀恭弥）、愤怒的忠岚（狱寺隼人）、晕染一切的雨（山本武）、守护之雷（蓝波）、热血之晴（晴川了平）创造了七位拯救世界的勇士（用属性制造勇士），让他们跟白兰对抗。。。［白兰的力量是游戏，于是要打败他，只要同样在世界布置的游戏中，赢过白兰就行了~］图片发
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
大模型量化终极对决：FP8 vs AWQ INT4，谁才是性能与精度的王者？曦紫沐大模型人工智能大模型量化 FP8 AWQ_INT4
摘要在大模型部署与优化中，量化技术是突破性能瓶颈的关键。FP8量化与AWQINT4量化作为当前主流方案，分别以“高精度”和“极致压缩”为核心优势。本文通过表格对比二者的数据格式、精度损失、硬件依赖及适用场景，助您在不同需求下精准选择最优方案。一、数据格式：浮点与整数的底层差异FP8量化采用浮点数（FP8），包含E4M3（4位阶码+3位尾数）和E5M2（5位阶码+2位尾数）两种格式，保留动态范围；而
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
2019-04-05 诚信装饰祝希信
2019年4月5日星期五天气晴(451)六年级七班祝全文今天是清明节，都放假了，好多人外出游玩踏青。一大早醒来去提水浇菜园子，全文还在呼呼睡大觉，浇完菜园子，简单吃了点饭就去干活了。中午回到家，厨房里乱七八糟，全文自己的脏衣服也没有洗，心里感觉真不是滋味，怎么会这样？优秀的孩子不是这样的，是我不该发脾气吗？还是回家继续忙碌，他人爱怎么怎么？家庭是共同的家庭，应该都有责任去承担，不要整天说来说去。全
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul