hitrjj

【AI视野·今日NLP 自然语言处理论文速览第五十期】Mon, 9 Oct 2023

AI视野·今日CS.NLP 自然语言处理论文速览
Mon, 9 Oct 2023
Totally 32 papers
上期速览✈更多精彩请移步主页

Daily Computation and Language Papers

RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective Augmentation
Authors Fangyuan Xu, Weijia Shi, Eunsol Choi
在推理时检索文档并将其添加到上下文中可以提高语言模型 LM 在各种任务上的性能。然而，这些文档通常跨越数百个单词，使得推理成本大大增加。我们建议在上下文集成之前将检索到的文档压缩为文本摘要。这不仅降低了计算成本，还减轻了语言模型在长检索文档中识别相关信息的负担。我们提出了两个压缩器，一个是提取压缩器，它从检索到的文档中选择有用的句子，另一个是抽象压缩器，它通过合成来自多个文档的信息来生成摘要。当生成的摘要被添加到 LM 输入之前时，两个压缩器都经过训练，以提高 LM 在最终任务上的性能，同时保持摘要简洁。如果检索到的文档与输入无关或未向 LM 提供任何附加信息，我们的压缩器可以返回空字符串，实现选择性增强。我们评估我们在语言建模任务和开放域问答任务上的方法。我们实现了低至 6 的压缩率，同时这两项任务的性能损失最小，显着优于现成的摘要模型。

Policy-Gradient Training of Language Models for Ranking
Authors Ge Gao, Jonathan D. Chang, Claire Cardie, Kiant Brantley, Thorsten Joachim
文本检索在将决策的事实知识纳入语言处理管道（从基于聊天的网络搜索到问答系统）方面发挥着至关重要的作用。当前最先进的文本检索模型利用预先训练的大型语言模型 LLM 来实现有竞争力的性能，但通过典型的对比损失训练基于 LLM 的检索器需要复杂的启发式方法，包括选择硬负例和使用额外的监督作为学习信号。这种对启发式的依赖源于这样一个事实：对比损失本身是启发式的，并且不会直接优化处理管道末端的决策质量的下游指标。为了解决这个问题，我们引入了 Neural PG RANK，这是一种新颖的训练算法，它通过将 LLM 实例化为 Plackett Luce 排名策略来学习排名。神经 PG RANK 提供了一种通过策略梯度对检索模型进行端到端训练的原则性方法，作为较大决策系统的一部分，几乎不依赖于复杂的启发式方法，并且它有效地将训练目标与下游决策质量统一起来。我们对各种文本检索基准进行了广泛的实验。

Improving Stability in Simultaneous Speech Translation: A Revision-Controllable Decoding Approach
Authors Junkun Chen, Jian Xue, Peidong Wang, Jing Pan, Jinyu Li
语音到文本同步翻译在实时跨语言交流中发挥着至关重要的作用。尽管近年来取得了进步，但在实现翻译过程的稳定性方面仍然存在挑战，这一问题主要表现在部分结果的闪烁上。在本文中，我们提出了一种新颖的修订可控方法来解决这个问题。我们的方法在集束搜索修剪过程中引入了允许的修订窗口，以筛选出可能导致大量修订的候选翻译，从而大幅减少闪烁，最重要的是，提供完全消除闪烁的能力。

Transferring speech-generic and depression-specific knowledge for Alzheimer's disease detection
Authors Ziyun Cui, Wen Wu, Wei Qiang Zhang, Ji Wu, Chao Zhang
从自发语音中检测阿尔茨海默病 AD 引起了越来越多的关注，而训练数据的稀疏性仍然是一个重要问题。本文通过知识转移来处理这个问题，特别是从语音通用知识和抑郁症特定知识。该论文首先研究了在大量语音和文本数据上预训练的通用基础模型的顺序知识迁移。基于从不同基础模型的不同中间块中提取的表示，对 AD 诊断进行块分析。除了来自语音通用表征的知识之外，本文还提出基于抑郁症和 AD 的高共病率，同时迁移来自语音抑郁症检测任务的知识。研究了并行知识转移框架，该框架共同学习这两个任务之间共享的信息。

Large-Scale Korean Text Dataset for Classifying Biased Speech in Real-World Online Services
Authors Dasol Choi, Jooyoung Song, Eunsun Lee, Jinwoo Seo, Heejune Park, Dongbin Na
随着在线服务的增长，对高级文本分类算法（例如情感分析和偏见文本检测）的需求变得越来越明显。在线服务的匿名性质常常导致存在偏见和有害语言，给维护在线社区的健康带来挑战。这种现象在韩国尤其重要，因为韩国尚未广泛探索大规模仇恨言论检测算法。在本文中，我们介绍了从韩国知名 SNS 平台收集的新的综合性大规模数据集。我们提出的数据集为文本样本提供了注释，包括 1 个偏好、2 个脏话和 3 种九种偏差，支持多任务学习以同时对用户生成的文本进行分类。利用最先进的基于 BERT 的语言模型，我们的方法在各种分类任务中超越了人类水平的准确性（通过各种指标衡量）。除了学术贡献之外，我们的工作还可以为现实世界的仇恨言论和偏见缓解提供实用的解决方案，直接为改善在线社区的健康做出贡献。我们的工作为未来旨在提高在线话语质量和促进社会福祉的研究奠定了坚实的基础。

A Comprehensive Evaluation of Large Language Models on Benchmark Biomedical Text Processing Tasks
Authors Israt Jahan, Md Tahmid Rahman Laskar, Chun Peng, Jimmy Huang
最近，大型语言模型法学硕士展示了解决各种任务的令人印象深刻的能力。然而，尽管他们在各种任务上取得了成功，但之前还没有研究他们在生物医学领域的能力。为此，本文旨在评估法学硕士在基准生物医学任务上的表现。为此，我们对 26 个数据集的 6 种不同生物医学任务中的 4 名热门法学硕士进行了全面评估。据我们所知，这是第一篇对生物医学领域各种法学硕士进行广泛评估和比较的工作。有趣的是，根据我们的评估，我们发现在具有较小训练集的生物医学数据集中，零样本法学硕士甚至优于当前最先进的微调生物医学模型。这表明，对大型文本语料库的预训练使得法学硕士即使在生物医学领域也相当专业。我们还发现，没有一个法学硕士可以在所有任务上都优于其他法学硕士，不同的法学硕士的表现可能会因任务而异。

Written and spoken corpus of real and fake social media postings about COVID-19
Authors Ng Bee Chin, Ng Zhi Ee Nicole, Kyla Kwan, Lee Yong Han Dylann, Liu Fang, Xu Hong
这项研究调查了假新闻和真实新闻的语言特征。本研究分为文本数据和语音数据两部分。本研究的文本数据由 Patwa 等人重新过滤的 6420 条与 COVID 19 相关的推文组成。 2021 年。清理后，数据集包含 3049 条推文，其中 2161 条标记为真实，888 条标记为假。本研究的语音数据收集自 TikTok，重点关注与 COVID 19 相关的视频。研究助理使用可靠来源对每个视频的内容进行了事实检查，并将其标记为“真实”、“虚假”或“可疑”，从而生成了来自 200 个 TikTok 视频的 91 个真实条目和 109 个虚假条目的数据集，总字数为 53,710 个单词。使用语言查询和字数统计 LIWC 软件对数据进行分析，以检测语言数据中的模式。结果表明了一组语言特征，可以在书面和语音数据中区分假新闻和真实新闻。

Automatic Aspect Extraction from Scientific Texts
Authors Anna Marshalova, Elena Bruches, Tatiana Batura
能够从科学论文中提取其要点、关键见解和其他重要信息（此处称为方面）可能会促进进行科学文献综述的过程。因此，我们研究的目的是创建一个从任何领域的俄语科学文本中自动提取方面的工具。在本文中，我们提出了一个俄语科学文本的跨领域数据集，标注了任务、贡献、方法和结论等方面，以及基于我们的多语言 BERT 模型微调的方面提取基线算法。数据。我们表明，不同领域的方面表示存在一些差异，但即使我们的模型是在有限数量的科学领域进行训练的，它仍然能够推广到新领域，正如跨领域实验所证明的那样。

Analysis of the Reasoning with Redundant Information Provided Ability of Large Language Models
Authors Wenbei Xie
大型语言模型的最新进展法学硕士在一系列自然语言处理任务中展示了令人印象深刻的能力，特别是在推理方面，这是实现通用人工智能 AGI 的基石。然而，常用的基准可能无法完全封装这些模型在现实场景中的推理能力。为了弥补这一差距，引入了一种新形式的问答 QA 任务，称为提供冗余信息的推理 RRIP。该研究设计了小学数学 8K GSM 8K 数据集的修改版本，该数据集有多个变体，专注于冗余信息的不同属性。这项调查评估了两种流行的 LLM，LlaMA2 13B chat 和生成式预训练 Transformer 3.5 GPT 3.5，将它们在传统 QA 任务和 RRIP 任务上的表现进行对比。研究结果表明，虽然这些模型在标准 QA 基准上取得了一定的成功，但在 RRIP 任务评估时，它们的性能显着下降。

Enhancing Financial Sentiment Analysis via Retrieval Augmented Large Language Models
Authors Boyu Zhang, Hongyang Yang, Tianyu Zhou, Ali Babar, Xiao Yang Liu
财务情绪分析对于估值和投资决策至关重要。然而，传统的 NLP 模型受到参数大小和训练数据集范围的限制，这限制了它们在该领域的泛化能力和有效性。最近，在广泛的语料库上进行预训练的大型语言模型法学硕士由于其值得称赞的零样本能力，在各种 NLP 任务中表现出了卓越的性能。然而，直接将法学硕士应用于金融情绪分析面临着挑战。法学硕士的预训练目标与预测情绪标签之间的差异可能会影响其预测性能。此外，财经新闻的简洁性通常缺乏足够的背景，可能会显着降低法学硕士情绪分析的可靠性。为了应对这些挑战，我们引入了用于金融情绪分析的检索增强法学硕士框架。该框架包括一个指令调整的 LLM 模块，该模块确保 LLM 充当情感标签的预测器，以及一个检索增强模块，该模块从可靠的外部源检索附加上下文。

SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation
Authors Abe Bohan Hou, Jingyu Zhang, Tianxing He, Yichen Wang, Yung Sung Chuang, Hongwei Wang, Lingfeng Shen, Benjamin Van Durme, Daniel Khashabi, Yulia Tsvetkov
现有的水印算法由于其令牌级设计而容易受到释义攻击。为了解决这个问题，我们提出了 SemStamp，一种基于局部敏感哈希 LSH 的鲁棒句子级语义水印算法，它对句子的语义空间进行划分。该算法对LLM生成的候选句子进行编码和LSH哈希，并进行句子级拒绝采样，直到采样的句子落入语义嵌入空间中的水印分区中。基于余量的约束用于增强其鲁棒性。为了展示我们算法的优势，我们提出了一种二元组释义攻击，使用与原始句子具有最少二元组重叠的释义。这种攻击被证明可以有效对抗现有的令牌级水印方法。

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder
Authors Zih Jyun Lin, Yi Ju Chen, Po Chih Kuo, Likai Huang, Chaur Jong Hu, Cheng Yu Chen
痴呆症的诊断需要一系列不同的测试方法，既复杂又耗时。早期发现痴呆症至关重要，因为它可以防止病情进一步恶化。本文利用语音识别模型在图片描述任务中构建了一个针对普通话使用者的痴呆症评估系统。通过在与现实世界场景非常相似的语音数据上训练基于注意力的语音识别模型，我们显着增强了模型的识别能力。随后，我们从语音识别模型中提取了编码器，并添加了用于痴呆症评估的线性层。我们收集了 99 名受试者的普通话语音数据，并从当地一家医院获得了他们的临床评估。

Quantized Transformer Language Model Implementations on Edge Devices
Authors Mohammad Wali Ur Rahman, Murad Mehrab Abrar, Hunter Gibbons Copening, Salim Hariri, Sicong Shao, Pratik Satam, Soheil Salehi
基于大规模 Transformer 的模型（例如来自 Transformers BERT 的双向编码器表示）广泛用于自然语言处理 NLP 应用，其中这些模型最初使用具有数百万个参数的大型语料库进行预训练，然后针对下游 NLP 任务进行微调。这些大型模型的主要限制之一是，由于模型尺寸较大且推理延迟增加，它们无法部署在资源受限的设备上。为了克服这些限制，此类大型模型可以转换为优化的 FlatBuffer 格式，专为部署在资源受限的边缘设备上而定制。在这里，我们评估了这种 FlatBuffer 转换的 MobileBERT 模型在三种不同边缘设备上的性能，并针对 RepLab 2013 数据集中的英语推文的声誉分析进行了微调。此外，这项研究还包括对已部署模型的评估，其中对它们的延迟、性能和资源效率进行了仔细评估。我们的实验结果表明，与原始 BERT 大模型相比，经过转换和量化的 MobileBERT 模型的占用空间小了 160 倍，在边缘设备上每秒至少分析一条推文时，精度下降了 4.1 倍。

Chain of Natural Language Inference for Reducing Large Language Model Ungrounded Hallucinations
Authors Deren Lei, Yaxi Li, Mengya Mia Hu, Mingyu Wang, Vincent Yun, Emily Ching, Eslam Kamal
当给定相关文档作为背景上下文时，大型语言模型法学硕士可以生成流畅的自然语言文本。这种能力引起了人们对法学硕士开发行业应用的极大兴趣。然而，法学硕士很容易产生不受所提供来源支持的幻觉。在本文中，我们提出了一个分层框架来检测和减轻这种毫无根据的幻觉。我们的框架使用自然语言推理链 CoNLI 进行幻觉检测并通过后期编辑减少幻觉。我们的方法在幻觉检测方面实现了最先进的性能，并通过重写提高文本质量，使用法学硕士，无需任何微调或特定领域的提示工程。

Exploring the evolution of research topics during the COVID-19 pandemic
Authors Francesco Invernici, Anna Bernasconi, Stefano Ceri
COVID 19 大流行改变了大多数科学界的研究议程，导致医学、病毒学、流行病学、经济、心理学等各个领域的研究文章大量涌现。其中建立了多个开放获取语料库和文献中心，COVID 19 开放研究数据集 CORD 19 通过收集和索引超过 100 万篇文章，系统地收集了 2.5 年来的科学贡献。在这里，我们介绍了 CORD 19 主题可视化工具 CORToViz，这是一种用于检查 CORD 19 科学摘要文本语料库的方法和相关可视化工具。我们的方法基于对包括大型语言模型在内的最新技术的仔细选择，从而产生了沿正交维度对文章进行聚类的体系结构以及用于时间主题挖掘的提取技术。主题检查由交互式仪表板支持，提供快速、一键式的主题内容可视化（词云形式）和主题趋势（时间序列形式），并配备易于驱动的统计测试，用于分析主题在任意选择的时间窗口中出现的重要性。

Evaluating Multi-Agent Coordination Abilities in Large Language Models
Authors Saaket Agashe, Yue Fan, Xin Eric Wang
当代人工智能研究的一个关键目标是开发精通多智能体协调的智能体，从而实现与人类和其他系统的有效协作。大型语言模型法学硕士以其以类似人类的方式理解、生成和解释语言的显着能力，成为开发此类代理的有希望的候选者。在这项研究中，我们构建并评估了在各种协调场景中使用 LLM 制作的代理的有效性。我们推出了LLM Coordination LLM Co Framework，专门为让LLM能够玩协调游戏而设计。借助LLM Co框架，我们在三种游戏环境下进行评估，并将评估分为心理理论、情景推理、持续协调、对合作伙伴的鲁棒性和显式协助五个方面。首先，对心理理论和情景推理的评估揭示了法学硕士推断合作伙伴意图并相应推理行动的能力。然后，围绕对合作伙伴的持续协调和稳健性的评估进一步展示了法学硕士在复杂的长期任务中与未知合作伙伴进行协调的能力，其表现优于强化学习基线。最后，为了测试显式协助（指代理主动提供帮助的能力），我们在 Overcooked AI 基准测试中引入了两种新颖的布局，检查代理是否可以优先帮助其合作伙伴，从而牺牲本可以花费在任务上的时间。

Automatic and Human-AI Interactive Text Generation
Authors Yao Dou, Philippe Laban, Claire Gardent, Wei Xu
在本教程中，我们重点关注文本到文本生成，这是一类自然语言生成 NLG 任务，它将一段文本作为输入，然后生成根据某些特定标准（例如可读性或语言风格）进行改进的修订版本，而很大程度上保留了原文的含义和文本的长度。这包括许多有用的应用程序，例如文本简化、释义生成、风格转换等。与文本摘要和开放式文本完成（例如故事）相比，我们在本教程中讨论的文本到文本生成任务在以下方面受到更多限制：语义一致性和目标语言风格。这种控制级别使这些任务成为研究模型生成语义充分且风格适当的文本的能力的理想测试平台。此外，从技术角度来看，这些任务很有趣，因为它们需要词汇和句法转换、文体控制以及对事实知识的遵守的复杂组合。本教程特别关注文本简化和修订，旨在从数据、模型、人类人工智能协作和评估四个主要方面概述最先进的自然语言生成研究，并讨论和展示一些重要的和最新进展 1 非回归方法的使用 2 从微调到大型语言模型提示的转变 3 新的可学习度量和细粒度人类评估框架的开发 4 越来越多的非英语研究和数据集 5

PrIeD-KIE: Towards Privacy Preserved Document Key Information Extraction
Authors Saifullah Saifullah 1 and 2 , Stefan Agne 2 and 3 , Andreas Dengel 1 and 2 , Sheraz Ahmed 2 and 3 1 Department of Computer Science, University of Kaiserslautern Landau, Kaiserslautern, Rhineland Palatinate, Germany, 2 German Research Center for Artificial Intelligence, DFKI GmbH, Kaiserslautern, Rhineland Palatinate, Germany, 3 DeepReader GmbH, Kaiserlautern, Germany
在本文中，我们介绍了通过利用大型预训练文档基础模型并结合差分隐私 DP、联邦学习 FL 和差分隐私联邦学习 DP FL 来开发私钥信息提取 KIE 系统的策略。通过对六个基准数据集 FUNSD、CORD、SROIE、WildReceipts、XFUND 和 DOCILE 的广泛实验，我们证明大型文档基础模型可以针对私有设置下的 KIE 任务进行有效的微调，以实现足够的性能，同时保持强大的隐私保证。此外，通过深入分析各种训练和模型参数对模型性能的影响，我们提出了简单而有效的指导方针，以实现全局 DP 下 KIE 任务的最佳隐私效用权衡。最后，我们介绍 FeAm DP，这是一种新颖的 DP FL 算法，可以有效地将全局 DP 从独立上下文升级到多客户端联合环境。我们对各种客户端和隐私设置的算法进行了全面评估，并证明了即使在容纳越来越多的参与客户端的情况下，其也能实现与独立 DP 相当的性能和隐私保证。总的来说，我们的研究为私有 KIE 系统的开发提供了宝贵的见解，并强调了文档基础模型在保护隐私的文档 AI 应用程序中的潜力。

Investigating Alternative Feature Extraction Pipelines For Clinical Note Phenotyping
Authors Neil Daniel
医疗行业的常见做法是使用临床记录，其中包含详细的患者观察。然而，电子健康记录系统通常不以结构化格式包含这些观察结果，这使得患者信息难以自动评估和评价。使用计算系统提取医疗属性提供了许多应用，包括患者的纵向分析、风险评估和医院评估。最近的工作构建了成功的表型分析方法，从临床记录中提取医学属性。基于 BERT 的模型可用于将临床记录转换为一系列表示形式，然后根据其 CLS 嵌入将其压缩为单个文档表示形式，并传递到 LSTM Mulyar 等人，2020。尽管该管道比以前的结果产生了相当大的性能改进，但它需要大量的收敛时间。

Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models
Authors Andy Zhou, Kai Yan, Michal Shlapentokh Rothman, Haohan Wang, Yu Xiong Wang
虽然大型语言模型法学硕士在一系列决策任务中表现出了令人印象深刻的性能，但它们依赖于简单的执行过程，无法作为自主代理进行广泛部署。我们引入了 LATS 语言代理树搜索，这是一个通用框架，可以协同法学硕士在规划、行动和推理方面的能力。受到基于模型的强化学习中蒙特卡罗树搜索的启发，LATS 采用 LLM 作为代理、价值函数和优化器，重新利用其潜在优势来增强决策。该方法的关键是使用外部反馈环境，它提供了一种更加深思熟虑和适应性更强的问题解决机制，超越了现有技术的限制。我们跨不同领域（例如编程、HotPotQA 和 WebShop）的实验评估说明了 LATS 在推理和行动方面的适用性。

Hermes: Unlocking Security Analysis of Cellular Network Protocols by Synthesizing Finite State Machines from Natural Language Specifications
Authors Abdullah Al Ishtiaq, Sarkar Snigdha Sarathi Das, Syed Md Mukit Rashid, Ali Ranjbar, Kai Tu, Tianwei Wu, Zhezheng Song, Weixuan Wang, Mujtahid Akon, Rui Zhang, Syed Rafiul Hussain
在本文中，我们提出了 Hermes，这是一个端到端框架，可以根据自然语言细胞规范自动生成形式表示。我们首先开发一个神经选区解析器 NEUTREX 来处理转换相关文本并提取转换组件，即状态、条件和动作。我们还设计了一种领域特定语言，通过利用依赖解析树将这些转换组件转换为逻辑公式。最后，我们编译这些逻辑公式以生成转换并创建作为有限状态机的形式模型。为了证明 Hermes 的有效性，我们在 4G NAS、5G NAS 和 5G RRC 规范上对其进行了评估，并获得了 81 87 的整体精度，这比现有技术有了实质性的改进。

Amortizing intractable inference in large language models
Authors Edward J. Hu, Moksh Jain, Eric Elmoznino, Younesse Kaddar, Guillaume Lajoie, Yoshua Bengio, Nikolay Malkin
自回归大型语言模型法学硕士通过下一个令牌条件分布压缩训练数据中的知识。这限制了对这些知识的易于处理的查询以开始到结束自回归采样。然而，许多感兴趣的任务，包括序列延续、填充和其他形式的约束生成，都涉及从棘手的后验分布中进行采样。我们通过使用摊销贝叶斯推理从这些棘手的后验中进行采样来解决这一限制。这种摊销是通过多样性寻求强化学习算法生成流网络 GFlowNets 微调 LLM 在算法上实现的。我们凭经验证明，LLM 微调的这种分布匹配范例可以作为最大似然训练和奖励最大化策略优化的有效替代方案。

Keyword Augmented Retrieval: Novel framework for Information Retrieval integrated with speech interface
Authors Anupam Purwar, Rahul Sundar
使用语言模型从结构化和非结构化数据的组合中以快速且低成本的方式检索答案，而不产生幻觉，是阻碍在知识检索自动化中使用语言模型的主要障碍。当人们想要集成语音接口时，这一点就会变得更加突出。此外，对于商业搜索和聊天机器人应用程序，完全依赖商业大型语言模型LLM（例如GPT 3.5等）的成本可能非常高。在这项工作中，作者通过首先开发一个基于关键字的搜索框架来解决这个问题，该框架增强了对大型语言模型提供的上下文的发现。关键字依次由 LLM 生成并缓存，以便与 LLM 针对所提出的查询生成的关键字进行比较。这显着减少了在文档中查找上下文的时间和成本。一旦设置了上下文，法学硕士就会根据为问答量身定制的提示来提供答案。这项研究工作表明，在上下文识别中使用关键字可以减少信息检索的整体推理时间和成本。鉴于关键字增强检索框架减少了推理时间和成本，集成了用于用户输入和响应读出的基于语音的界面。

mlirSynth: Automatic, Retargetable Program Raising in Multi-Level IR using Program Synthesis
Authors Alexander Brauckmann, Elizabeth Polgreen, Tobias Grosser, Michael F. P. O Boyle
MLIR 是用于现代硬件的新兴编译器基础设施，但如果现有程序以较低级别的通用语言描述，则无法利用 MLIR 的高性能编译。因此，为了避免需要手动重写程序，人们努力在 MLIR 中自动将较低级别的方言提升到较高级别的方言。

How to Capture Higher-order Correlations? Generalizing Matrix Softmax Attention to Kronecker Computation
Authors Josh Alman, Zhao Song
在经典的 Transformer Attention 方案中，我们得到三个 n 乘以 d 大小的矩阵 Q、K、V 作为查询、键和值标记，目标是计算一个新的 n 乘以 d 大小的矩阵 D 1 exp QK top V，其中D mathrm diag exp QK top bf 1 n 。在这项工作中，我们研究了捕获三重相关性的注意力泛化。这种概括能够解决有关检测三重连接的问题，而这些问题对于变压器来说是不可能的。这种概括的潜在缺点是，计算似乎更加困难，因为简单的算法需要 n 的立方时间。然而，我们表明，在实践中出现的有界进入设置中，并且在理论和实践中都得到了充分研究，实际上存在一种近线性时间算法。

HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model
Authors Takashi Maekaku, Jiatong Shi, Xuankai Chang, Yuya Fujita, Shinji Watanabe
最近，自监督表示学习 SSRL 方法的有用性已在各种下游任务中得到证实。其中许多模型（例如 HuBERT 和 WavLM）使用从光谱特征或模型自身的表示特征生成的伪标签。从之前的研究可知，伪标签包含语义信息。然而，HuBERT 的学习标准屏蔽预测任务侧重于局部上下文信息，可能无法有效利用全局语义信息，如说话人、演讲主题等。在本文中，我们提出了一种丰富 HuBERT 语义表示的新方法。我们将主题模型应用于伪标签，为每个话语生成主题标签。 HuBERT 中添加了一个辅助主题分类任务，以主题标签为教师。这允许以无监督的方式合并附加的全局语义信息。实验结果表明，我们的方法在大多数任务中实现了与基线相当或更好的性能，包括自动语音识别和八个 SUPERB 任务中的五个。此外，我们发现主题标签包含有关话语的各种信息，例如性别、说话者及其主题。

Thought Propagation: An Analogical Approach to Complex Reasoning with Large Language Models
Authors Junchi Yu, Ran He, Rex Ying
随着提示方法的发展，大型语言模型法学硕士在推理任务中取得了显着的成功。然而，现有的提示方法无法重用解决类似问题的见解，并且会在多步骤推理中遭受累积错误，因为它们提示法学硕士从头开始推理文本。为了解决这些问题，我们提出了textbf textit Thought Propagation TP，它探索类似的问题并利用它们的解决方案来增强法学硕士的复杂推理能力。这些类似的问题与输入问题相关，具有可重用的解决方案和问题解决策略。因此，传播解决先前类似问题的见解以激发新问题的解决是有希望的。为了实现这一目标，TP 首先提示法学硕士提出并解决一组与输入问题相关的类似问题。然后，TP重用类似问题的结果来直接产生新的解决方案，或者导出知识密集型的执行计划来修改从头开始获得的初始解决方案。 TP 与现有的提示方法兼容，允许在各种任务中进行即插即用的概括和增强，而无需在特定任务的提示工程中花费太多精力。三项具有挑战性任务的实验表明，TP 在最短路径推理中寻找最佳解决方案方面比基线有了显着的提高，平均绝对提高了 12 倍，在创意写作方面人类偏好提高了 13 倍，LLM 的任务完成率提高了 15 倍

Trustworthy Formal Natural Language Specifications
Authors Colin S. Gordon, Sergey Matskevich
交互式证明助手是精心构建的计算机程序，用于以高度可信的方式检查人类设计的数学主张的证明。然而，这仅验证了正式主张的真实性，该主张可能是从自然语言提出的主张中翻译错误的。当使用证明助手正式验证软件相对于自然语言规范的正确性时，这尤其成问题。

Benchmarking a foundation LLM on its ability to re-label structure names in accordance with the AAPM TG-263 report
Authors Jason Holmes, Lian Zhang, Yuzhen Ding, Hongying Feng, Zhengliang Liu, Tianming Liu, William W. Wong, Sujay A. Vora, Jonathan B. Ashman, Wei Liu

Contextualized Structural Self-supervised Learning for Ontology Matching
Authors Zhu Wang
本体匹配 OM 需要识别两个或多个知识图谱 KG 中概念之间的语义关系，并且是集成各种来源的 KG 的关键步骤。深度 OM 模型的最新进展利用了基于 Transformer 的语言模型的强大功能和知识图嵌入的优势。尽管如此，这些 OM 模型仍然面临持续的挑战，例如缺乏参考对齐、运行时延迟以及端到端框架内未探索的不同图形结构。在这项研究中，我们引入了一种新颖的带有输入本体的自监督学习 OM 框架，称为 LaKERMap。该框架通过将隐性知识集成到转换器中，利用概念的上下文和结构信息。具体来说，我们的目标是通过采用不同的培训目标来捕捉涵盖本地和全球互动的多种结构背景。为了评估我们的方法，我们利用 Bio ML 数据集和任务。我们的创新方法的结果表明，LaKERMap 在对齐质量和推理时间方面超越了最先进的系统。

HandMeThat: Human-Robot Communication in Physical and Social Environments
Authors Yanming Wan, Jiayuan Mao, Joshua B. Tenenbaum
我们推出了 HandMeThat，这是一个对物理和社会环境中的指令理解和遵循进行整体评估的基准。以前的数据集主要侧重于语言基础和规划，而 HandMeThat 则根据物理对象状态和关系以及社会人类行为和目标信息来考虑解决具有歧义的人类指令。 HandMeThat 包含 10,000 个人类机器人交互片段。在每一集中，机器人首先观察人类朝着其内部目标行动的轨迹。接下来，机器人接收人类指令，并应采取行动来完成通过指令设定的子目标。在本文中，我们为我们的基准测试提供了一个文本界面，其中机器人通过文本命令与虚拟环境进行交互。

Differentiable Outlier Detection Enable Robust Deep Multimodal Analysis
Authors Zhu Wang, Sourav Medya, Sathya N. Ravi
通常，深度网络模型在训练期间和对未见过的数据进行推理时纯粹是归纳的。因此，当此类模型用于预测时，众所周知，它们通常无法捕获总体水平上的对象或概念之间存在的语义信息和隐式依赖关系。此外，目前还不清楚如何以反向传播友好的方式指定领域或先验模态知识，特别是在大规模和嘈杂的环境中。在这项工作中，我们提出了一种包含显式知识图的端到端视觉和语言模型。我们还引入了使用隐式网络运算符的交互式分布外 OOD 层。该层用于过滤外部知识库带来的噪声。在实践中，我们将我们的模型应用于多个视觉和语言下游任务，包括不同数据集上的视觉问答、视觉推理和图像文本检索。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com

你可能感兴趣的:(NLP,LLM,Papers,自然语言处理,NLP,人工智能,文本检索,文本摘要,情绪识别,语言转文字)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
日更50天有什么收益？星湾二宝
坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
第28章汇编语言--- 异常处理 hummhumm 汇编算法开发语言程序设计高级语言异常处理汇编语言
在汇编语言中，异常处理是一个重要的概念，它涉及到处理器如何响应和处理程序运行时发生的非正常情况。异常可以是硬件错误（例如除零错误、非法指令）或者软件触发的中断（例如系统调用）。当发生异常时，处理器会暂停当前正在执行的程序，并转移到一个预先定义好的位置来处理这个异常。为了详细阐述第28章关于汇编语言中的异常处理，我们可以考虑一个简化的例子，展示异常处理的基本结构。请注意，实际的代码将取决于具体的处理
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
车载刷写架构 --- 刷写思考扩展汽车电子实验室电子电器架构——刷写方案架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
免费排版助手：智能修正段落 + 删除干扰符，杂乱文本一键变规范
各位文字工作者们！你们有没有被排版折磨到崩溃的时候？我跟你们说，我之前排版一篇文章，那简直就像在走迷宫，头晕眼花的！不过后来我发现了一款软件——排版助手！软件下载地址安装包这玩意儿是个文章智能排版工具，专门给新闻编辑、文摘网站这些文字工作者用的。它功能老多了，能修正段落，把那些乱七八糟的段落变得规规矩矩；还能删除干扰符，就像给文章做了个大扫除，把没用的东西都清理掉；简繁转换也不在话下，不管是简体还
《路远连着天》第二章在路上 7 亚宁
大路镇的街道两旁尽是店铺，气派者是红门柱子雕花门窗，一般则多为布匹小百货店，还有几家门面朝外的车马大店，和一家颇有气势的典当铺。街上来往人还真不少，有挑担叫卖水果的，有背篓子路过的，还有衣冠楚楚，悠哉悠哉，甩着双手散步的有钱爷。耿六想着先寻姑妈家，还是先到兵营看那几个土匪呢？也只是一转念，他选择了后者，跟在几个闲人后，就来到了在镇外山头上曾看到过的那处飘着晴天白日旗的兵营门外。这里，围观的人乱哄哄
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
900 万人次都在用！打印机驱动大师：兄弟驱动安装一步到位文哥工具箱2 软件工程电脑开源软件
各位打印界的老铁们，你们知道吗？我就是那个传说中服务PT-18R标签打印机的“最佳损友”小助手！当你想把电脑里那些花里胡哨的标签设计变成能摸得着的实物时，嘿嘿，软件下载地址本助手就闪亮登场啦！插上USB线的瞬间，我立马在你电脑里“安营扎寨”，悄悄给你和打印机搭起一座“鹊桥”，让你们无障碍沟通，那叫一个丝滑！你在编辑软件里鼓捣的文字、条形码，甚至那些可可爱爱的小图标，全靠我这个“翻译官”精准转换成打
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
2022-07-25走着走着就会发现真相既现实又残酷我傻我笨但我真
人是环境的产物，如果你不主动引导自己成为自己想成为的那种人，那么你就只能被动地被环境所塑造。做有心人，干困难事，做难事必有所得。先处理情绪，在处理问题。我们要支配习惯，而不是被习惯支配。只要你担心别人怎么看你，他们就能左右你的情绪。担心的越多，在意的越多，情绪就越不稳定，容易被情绪控制。当我们没有那么多的在意，只朝着自己最重要的那个目标去努力，去拼搏的时候，不仅有动力，而且情绪稳定。只有当你不从自
2023-05-11 要开心呀88
对于敏感型的人来说，情绪价值真的非常非常的重要，身边如果有个情绪稳定又温柔的人，这简直比吃药都管用，一个能够给你提供情绪价值的人，他身上珍贵的品质，甚至超过了很多物质的力量，情绪价值就是治愈伤痛最好的良药！！
说文解字8示部和衣部亢龙有悔_cb5a
“示”的字形演变过程“示”的甲骨文字形为一横一竖的指事符号，上面的横画代表上天，下面的竖画代表上天向人间显露的征兆，那么，“示”的造字本义是天神以天象显露天意中国古代没有形成像西方社会那样的宗教传统，而是以宗法制度为纽带的世俗社会。所谓宗法，简单来说就是祖先崇拜。就是把祖先上升到神的地位。所以，带“示”的字大都和祖先、神祇有关。“示”在作为偏旁部首时分为在左“礻”和在下“示”两种情况，分别举例说明
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
【阳光️️☀️苑长幸福365】7月9日《就此刻确知》阳光苑长
音频文字原创|阳光苑长图片发自App一夜的梦境，情景相当的壮烈，那是前前后后多个情节的叠加，那是因为极其在意在正义的，完满的，在早已经确认——万古之先已经确认了一切美好的事物当中。当有假象，当有一些不好的势力，试图想去破坏夺取的时候，在梦境中一直得力的征战，为着身边最挚爱的朋友，为他，为所有美好的事业而守望。守望，英文叫做watcher，就是观望者。图片发自App在这个毫不奇怪，事实上一直发生的征
C++编程基础与面向对象概念解析侯昂面向对象编程 C++语法函数类与对象继承与多态性
C++编程基础与面向对象概念解析背景简介C++是一种广泛使用的面向对象编程语言，它允许开发者创建高效、灵活且功能强大的程序。本文基于《C++Primer》一书的章节内容，深入解析C++的核心概念和面向对象编程原则，旨在帮助读者构建扎实的C++编程基础。面向对象编程的原则软件危机与进化介绍了软件危机的产生和软件进化的必要性，强调了面向对象编程（OOP）在应对这些问题中的优势。面向对象编程范式讨论了面
手把手教你用C语言实现顺序表
hello，大家好，本篇文章旨在为大家讲解如何使用C语言实现顺序表，还有就是小编自己复习一下相关知识，OK，那我们现在开始。在通讯录中，有增删查改等功能，那么顺序表我们也会对以上功能进行实现。一、创建并初始化顺序表1.创建typedefintSLDataType;#defineINIT_CAPACITY4//动态顺序表--按需申请typedefstructSeqList{SLDataType*a;
和孩子在一起——太阳男孩儿嘟噜
昂，本意是指抬起，抬高，引申义是表现情绪高之意。带着厚厚小眼镜的昂同学，就是这样一个孩子，从来都是积极阳光，乐观向上的。起初我认为他是个表现欲极强的孩子，每次提问他都会举手，有时候的确会有意想不到的回答，更多时候是支支吾吾，答非所问，尤其是读课文更是吃力的很。第一次听他读课文，才发现他的视力不是一般的差。后来了解到他天生视力不好，即便在第一排，黑板上的字看着也很模糊。能把课文读完，大都是靠记忆，他
中原焦点团队坚持原创分享第 1172天金JJ
信阳案例督导：在学生出现危机时，学校启动心理应急程序，一位心理老师安抚个案的同时，其他心理老师给班级同学进行团体心理辅导，学校方面马上通知家长前来学校。学校危机干预应急流程的成熟，能有效降低个案的自杀风险。个案不愿谈及家庭及自己自杀行为等问题时，用沙盘、玩具等分散注意力，谈论他感兴趣的话题，老师温和的态度，关切的言语，个案的情绪逐渐平复。从个案自己说的，流露的非言语，家长、老师、同学、以往的记录，
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
旋转安静的影子
图片发自App傍晚你带我们去万象城说是试营业到了大厦底下好家伙这么壮观我望向楼顶直达蓝天白云啊整个大楼似乎在转圈我蒙了又很奇妙的感觉我透过大厦望天空就感觉到在旋转真的感觉到动态的效果很神奇我慌忙叫你看快看快看大厦好像会旋转你说我知道知道知道也不知道你是否感觉到了真的很美妙的体会是天空在转吗我感觉大厦也在旋转很美妙很美妙图片发自App图片发自App
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

【AI视野·今日NLP 自然语言处理论文速览 第五十期】Mon, 9 Oct 2023

Daily Computation and Language Papers

你可能感兴趣的:(NLP,LLM,Papers,自然语言处理,NLP,人工智能,文本检索,文本摘要,情绪识别,语言转文字)

【AI视野·今日NLP 自然语言处理论文速览第五十期】Mon, 9 Oct 2023