Python&LLM 第99页

Editing Large Language Models: Problems, Methods, and Opportunities

UnknownBody·2023-07-20 20:41

亚马逊云科技现已支持 Meta 推出的最新 Llama 2 基础模型

亚马逊云开发者·2023-07-20 18:11

【LLM】2023 年最值得考虑的 10 个最强大语言模型

大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流个人主页－Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。如果你对这个系列感兴趣的话，可以关注订阅哟文章目录

Sonhhxg_柒·2023-07-20 15:17

【LLM】深入剖析 GOOGLE PALM 2：全面概述

大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流个人主页－Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。如果你对这个系列感兴趣的话，可以关注订阅哟文章目录

Sonhhxg_柒·2023-07-20 15:17

IBM也下场LLM了，自对齐、高效率的单峰驼Dromedary来了

近期IBMResearch发布了dromedary，并指出这个模型通过一种称为自对齐（SELF-ALIGN）的新方法，结合了原则驱动（principle-driven）的推理和LLM的生成能力，用于AI

才能我浪费·2023-07-20 14:17

近期关于AIGC方面的学习笔记和思路整理

LLM对于LLM，我现在重点关注在这几个方面：开源且可私有化部署的代码生成模型：因为大部分软件企业对于安全都很重视，文档、数据、代码一般都会尽量避免被泄露。

才能我浪费·2023-07-20 14:16

不止是数据，RedPajama的模型也出来了，RedPajama 7B, 一个开源的高效LLM模型

资源/参考链接：官网：TOGETHER博客:https://www.together.xyz/blog/redpajama-models-v1GitHub：Together介绍RedPajama和它背后的公司Together其实都挺有意思的。Together，由苹果前高管VipulVedPrakash，斯坦福大模型研究中心主任PercyLiang，苏黎世联邦理工大学助理教授张策等人联合创办。Red

才能我浪费·2023-07-20 14:16

【术语解释】LoRA

来源：https://huggingface.co/kaiokendev/SuperCOT-LoRA这里的LoRA是指：“Low-RankAdaptationofLLM”（低秩适配法），具体是指，在LLM

从416到北京的ZMZ·2023-07-20 10:21

格局打开，Meta 发布免费商业应用的开源 AI 模型 Llama 2，网友：微软又赢麻了！...

今天是OSSAI胜利的一天；随着Meta最新发布一个新的开源AI模型——Llama2，网上盛赞的声音不绝于耳，甚至图灵奖得主、卷积网络之父、Meta首席人工智能科学家YannLeCun更是直言，「这将改变LLM

CSDN资讯·2023-07-20 09:04

【LLM】金融大模型场景和大模型Lora微调实战

金融大模型背景二、大模型的研究问题三、大模型技术路线四、LLaMA家族模型五、Lora模型微调的原理六、基于mt0-large进行Lora微调实战Reference一、金融大模型背景金融行业需要垂直领域LLM

山顶夕景·2023-07-20 08:04

M7二极管-ASEMI迷你贴片整流二极管M7二极管

编辑：llM7二极管-ASEMI迷你贴片整流二极管M7二极管型号：M7二极管品牌：ASEMI芯片个数：1芯片尺寸：46MIL封装：SMAF恢复时间：ns工作温度：-50°C~150°C浪涌电流：30A正向电流

ASEMI99·2023-07-20 05:52

谈谈 LLM 在推荐域的渗透，探索推荐新范式

前言最近大模型真的很火，从个人到公司，各行各业都在学习大模型、总结大模型和尝试应用大模型。大模型其实不是一个新的产物，已经在NLP发展了很多年。ChatGPT的诞生，经验的效果震惊了所有人，虽然也有一些瑕疵，但是瑕不掩瑜。微软投资OpenAI看到了它的未来。微软快速围绕ChatGPT对相关的产品进行了产品升级，从搜索到微软365各种产品。5.29号有机会和部门的一些同事一起到上海微软进行了参观访问

阿里云云栖号·2023-07-20 04:29

LLM模型微调方法及经验总结

如何避免灾难遗忘参考：在现在这大规模语言模型（LLM）盛行的时代，由于模型参数和显卡配置的因素，预训练基本是大公司或者高校可以完成的事情，而对于小公司或个人，则只

dzysunshine·2023-07-20 02:35

LLM资料

大语言模型(LLM)课程、论文与资料推荐现在CV和NLP越来越紧密，AIGC、多模态、大模型越来越火，尤其是在LLM(代表成果ChatGPT)的席卷之下。

莫杨94·2023-07-19 23:48

LangChain大型语言模型(LLM)应用开发(三)：Chains

它提供了一套工具、组件和接口，可简化创建由大型语言模型(LLM)和聊天模型提供支持的应用程序的过程。LangChain可以轻松管理与语言模型的交互，将多个组件链接在一起，以便在不同的应用程序中使用。

-派神-·2023-07-19 22:05

论文解读: 2023-ChatLaw: Open-Source Legal Large Language Model with Integrated External Knowledge Bases

现在看一下他们的技术报告：ChatLaw:Open-SourceLegalLargeLanguageModelwithIntegratedExternalKnowledgeBases，给大家以LLM+外部知识库构建领域模型提供参考思路

hj_caas·2023-07-19 15:45

论文解读: 2023-Lost in the Middle: How Language Models Use Long Contexts

外部知识库+LLM的方法可以缓解大模型幻觉，但是如何撰写Prompt才能发挥LLM的性能。下面介绍这篇论文说明上下文信息出现在Prompt什么位置使模型表现最佳，以及上下文文本长度对LLM性能的影响。

hj_caas·2023-07-19 15:44

在LLM的支持下使游戏NPC具有记忆化的方法

问题使用GPT这样的LLM去处理游戏中的NPC和玩家的对话是个很好的点子，那么如何处理记忆化的问题呢。

hhy不许摸鱼·2023-07-19 14:24

【AI 大模型】a16z：LLM 应用程序的新兴架构：Emerging Architectures for LLM Applications

目录LLM应用程序的新兴架构：EmergingArchitecturesforLLMApplicationsThestack技术堆栈

禅与计算机程序设计艺术·2023-07-19 14:18

LLM微调 | Prompt-tuning

简单水一下，不知我理解的prompt-tuning是不是这样。prompt-tuning其实就是给每个任务定义了自己的prompt，拼接到数据上作为输入，然后微调。在prompt-tuning中，我们需要使用特定的prompt和任务数据集对模型进行微调，以适应特定的任务和prompt。这个微调的过程是非常重要的，它可以让模型更好地适应特定的任务和prompt，从而获得更好的性能。如情感分类任务中，

#苦行僧·2023-07-19 11:15

LLM微调 | LoRA: Low-Rank Adaptation of Large Language Models

发表于论文：(2021)LoRA:Low-RankAdaptationofLargeLanguageModels目的：大模型预训练+微调范式，微调成本高。LoRA只微调新增的小部分参数。文章目录1、背景2、动机3、LoRA原理4、总结1、背景adapter增加了模型层数，引入了额外的推理延迟；prefix-tuning比较难训练，效果不如直接finetune。LoRA不会引入额外的延迟，甚至原文中

#苦行僧·2023-07-19 11:41

大语言模型（LLM）评估综述

论文地址：https://arxiv.org/abs/2307.03109Github地址：https://github.com/MLGroupJLU/LLM-eval-survey一、背景随着ChatGPT

wshzd·2023-07-19 10:55

大模型开发(七)：LLM提示工程（Prompt）与思维链（CoT）

一、LLM模型的涌现能力在GPT没有爆火之前，一直以来的共识都是：模型的规模越大，模型在下游任务上的能力越多、越强。

算法小陈·2023-07-19 10:51

ToT：利用大语言模型解决需要深思熟虑的问题（下）

V(p,S)4.搜索算法实验24游戏1).任务设置2).基准3).ToT设置4).结果5).错误分析创意写作1).任务设置2).基准3).ToT设置4).结果交叉词相关工作规划和决策自我反省程序引导的LLM

露葵025·2023-07-19 10:20

大模型开发(一)：GPT、ChatGPT与大模型，一次搞懂这些AI概念

一、什么是大模型⼤模型全称为LLM（LargeLanguageModel）是指⼤型的⾃然语⾔处理（NLP）模型。

算法小陈·2023-07-19 10:50

利用大模型进行法律判决预测

过去的方法主要是通过学习、微调或示例来教授大型语言模型（LLM）进行法律判决预测。这些方法存在的问题是学习样本有限，解释性差。

无数据不智能·2023-07-19 07:09

2019 杭电多校第3场 1006 Fansblog (HDU 6608)

){if(a==0&&b==0)return-1;if(b==0){x=1;y=0;returna;}lld=exgcd(b,a%b,y,x);y-=a/b*x;returnd;}llinv(lla,llm

zzuli_hanjk·2023-07-19 05:54

大语言模型评估全解：评估流程、评估方法及常见问题

编者按：随着对大语言模型（LLM）评估领域的深入研究，我们更加清楚地认识到全面理解评估过程中的问题对于有效评估LLM至关重要。

Baihai IDP·2023-07-19 01:10

“百模大战”愈演愈烈，AI大模型的现状与发展

最近，随着OpenAI发布的以用户为中心的聊天机器人ChatGPT的发布，大型语言模型(LLM)引起了人们的关注。大模型的好坏与否，主要涉及三个方面：算法、算力和数据。

csdn_aspnet·2023-07-18 12:54

当DevOps遇到AI，黑马迎来3.0时代丨IDCF

IDCF社区·2023-07-18 10:17

LangChain-Evaluation—如何评估LLM及其应用（三）

省流：目前没有真正完美的解决方案，比如分类有精度这样接近完美的评估方案，但LLM目前没有ThissectionofdocumentationcovershowweapproachandthinkaboutevaluationinLangChain.Bothevaluationofinternalchains

思考实践·2023-07-18 08:07

【LLM】Langchain使用[四]（评估、代理）

note评估目的：检验LLM是否达到验收标准；分析改动对于LLM应用性能的影响思路：利用语言模型和链，辅助评估代理：代理能方便地将LLM连接自己的信息来源（数据）、API等PythonREPLTool工具

山顶夕景·2023-07-18 08:03

langchain源码阅读系列（二）之数据接入层

本节是langchian源码阅读系列第二篇，下面进入DataConnection模块LLM应用构建实践笔记D

莫尔索随笔·2023-07-18 07:22

【LangChain】数据连接(Data connection)

概要许多LLM申请需要特定于用户的数据，这些数据不属于模型训练集的一部分。

山鬼谣me·2023-07-18 07:47

P4799 世界冰球锦标赛 ( 折半查找

includeusingnamespacestd;usingVI=vector;usingPII=pair;usingll=longlong;usingull=unsignedlonglong;lln;llm

stay fool·2023-07-18 06:47

LLM搭建金融系统

背景：这篇文章主要给大家介绍如何基于LLM模型配合各种pluging工具（这边主要是跟数据连接、检索的工具相关：知识图谱、向量库...)。

远洋之帆·2023-07-18 05:02

Chatglm实现agent控制

背景：这个系列文章，会从LLM搭建应用生态角度来写。从0到1训练一个大的通用的模型对于大部分人和团队来讲是不现实的。重资金，重技术含量、重投入这几个门槛可以把很多团队直接劝退。

远洋之帆·2023-07-18 05:00

SeeKeR: 寻找知识的语言模型

本文要解决的问题： 1.当前的LLM能够产生通顺的句子，但就事实性上而言可能并不正确，即不符合客观事实，增大模型尺寸也无法解决； 2.知识库无法实时更新，模型不能get到最新的信息，即只能在训练集

夏小悠·2023-07-18 00:58

人工智能LLM模型：奖励模型的训练、PPO 强化学习的训练、RLHF

人工智能LLM模型：奖励模型的训练、PPO强化学习的训练1.奖励模型的训练1.1大语言模型中奖励模型的概念在大语言模型完成SFT监督微调后，下一阶段是构建一个奖励模型来对问答对作出得分评价。

汀、人工智能·2023-07-18 00:25

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍1.大语言模型的预训练1.LLM预训练的基本概念预训练属于迁移学习的范畴。

汀、人工智能·2023-07-18 00:20

LLM-Client一个轻量级的LLM集成工具

大型语言模型(llm)已经彻底改变了我们与文本交互的方式，OpenAI、Google、AI21、HuggingfaceHub、Anthropic和众多开源模型提供了不同的功能和优势。

deephub·2023-07-17 22:57

使用 ChatGPT API 构建系统课程要点总结

BuildingSystemswiththeChatGPTAPI课程链接：https://learn.deeplearning.ai/chatgpt-building-system/第一节简介介绍了两种LLM

python算法工程师·2023-07-17 22:30

FinGPT 研究

FinGPT通过利用预先存在的LLM并根据特定的金融应用对其进行微调,做出了创新性的回应。

python算法工程师·2023-07-17 21:08

LangChain for LLM Application Development 课程要点

课程链接:https://learn.deeplearning.ai/langchain/第一节Introduction简介了一下LangChain等。第二节Model,PromptsandparsersLangChain提供的一个关键能力就是outputparsing，如果需要返回结构化（JSON）的结果，可以考虑使用ResponseSchema、StructuredOutputParser。第

python算法工程师·2023-07-17 21:38

【NLP】国外新动态--LLM模型

这是关于在实践中使用大型语言模型（LLM）的系列文章中的一篇文章。在这里，我将介绍LLM，并介绍使用它们的3个级别。

无水先生·2023-07-17 20:57

理解LLM中的ReAct

largelanguagemodels(LLMs)大语言模型在语义理解和交互式决策方面有着不错的表现。ReAct在一次交互中循环使用推理和行动两个操作解决复杂问题，推理即利用模型自身语义理解能力，行动则利用模型以外的能力（如计算、搜索最新消息，用户自定义的行动）。一个使用ReAct的例子QuestionWhatistheelevationrangefortheareathattheeasterns

小何才露尖尖角·2023-07-17 18:29

Unifying Large Language Models and Knowledge Graphs: A Roadmap

UnknownBody·2023-07-17 17:00

【吴恩达】prompt engineering（原则迭代文本概括推断、订餐机器人）

简介Introduction基础的LLM训练的模型，问法国的首都什么，可能会将答案预测为“法国最大的城市是什么，法国的人口是多少”许多LLMs的研究和实践的动力正在指令调整的LLMs上。

山顶夕景·2023-07-17 15:38

海睿思分享 | 类chatgpt模型在信息抽取领域的应用

大语言模型（LLM，LargeLanguageModel）是指能够处理海量数据、拥有百亿级参数的深度学习模型，它已成为⼈⼯智能领域中的新热点。

海睿思·2023-07-17 13:42

LLM Prompt Technique 论文精读-1

下面为笔者最近看的一些prompttechnique领域的新兴论文以及对应的总结，分享给大家一起学习。持续更新中…Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModels思维链提示引发大型语言模型的推理能力链接：https://arxiv.org/pdf/2201.11903.pdf时间：2022摘要：我们探讨了如何生成一系列中间

Zeeland·2023-07-17 13:22

推荐频道

Python&LLM