E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
Editing Large Language Models: Problems, Methods, and Opportunities
本文是
LLM
相关的系列文章,针对《EditingLargeLanguageModels:Problems,Methods,andOpportunities》的翻译。
UnknownBody
·
2023-07-20 20:41
LLM
综述文章
语言模型
人工智能
自然语言处理
亚马逊云科技现已支持 Meta 推出的最新 Llama 2 基础模型
Llama2大语言模型(
LLM
)系列是经过预训练
亚马逊云开发者
·
2023-07-20 18:11
科技
llama
【
LLM
】2023 年最值得考虑的 10 个最强大语言模型
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2023-07-20 15:17
LLMs(大型语言模型)
语言模型
人工智能
自然语言处理
【
LLM
】深入剖析 GOOGLE PALM 2:全面概述
大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流个人主页-Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。如果你对这个系列感兴趣的话,可以关注订阅哟文章目录
Sonhhxg_柒
·
2023-07-20 15:17
自然语言处理(NLP)
LLMs(大型语言模型)
自然语言处理
人工智能
IBM也下场
LLM
了,自对齐、高效率的单峰驼Dromedary来了
近期IBMResearch发布了dromedary,并指出这个模型通过一种称为自对齐(SELF-ALIGN)的新方法,结合了原则驱动(principle-driven)的推理和
LLM
的生成能力,用于AI
才能我浪费
·
2023-07-20 14:17
人工智能
机器学习
近期关于AIGC方面的学习笔记和思路整理
LLM
对于
LLM
,我现在重点关注在这几个方面:开源且可私有化部署的代码生成模型:因为大部分软件企业对于安全都很重视,文档、数据、代码一般都会尽量避免被泄露。
才能我浪费
·
2023-07-20 14:16
AIGC
学习
笔记
不止是数据,RedPajama的模型也出来了,RedPajama 7B, 一个开源的高效
LLM
模型
资源/参考链接:官网:TOGETHER博客:https://www.together.xyz/blog/redpajama-models-v1GitHub:Together介绍RedPajama和它背后的公司Together其实都挺有意思的。Together,由苹果前高管VipulVedPrakash,斯坦福大模型研究中心主任PercyLiang,苏黎世联邦理工大学助理教授张策等人联合创办。Red
才能我浪费
·
2023-07-20 14:16
开源
人工智能
机器学习
【术语解释】LoRA
来源:https://huggingface.co/kaiokendev/SuperCOT-LoRA这里的LoRA是指:“Low-RankAdaptationofLLM”(低秩适配法),具体是指,在
LLM
从416到北京的ZMZ
·
2023-07-20 10:21
人工智能
深度学习
格局打开,Meta 发布免费商业应用的开源 AI 模型 Llama 2,网友:微软又赢麻了!...
今天是OSSAI胜利的一天;随着Meta最新发布一个新的开源AI模型——Llama2,网上盛赞的声音不绝于耳,甚至图灵奖得主、卷积网络之父、Meta首席人工智能科学家YannLeCun更是直言,「这将改变
LLM
CSDN资讯
·
2023-07-20 09:04
人工智能
llama
【
LLM
】金融大模型场景和大模型Lora微调实战
金融大模型背景二、大模型的研究问题三、大模型技术路线四、LLaMA家族模型五、Lora模型微调的原理六、基于mt0-large进行Lora微调实战Reference一、金融大模型背景金融行业需要垂直领域
LLM
山顶夕景
·
2023-07-20 08:04
#
自然语言处理
深度学习
#
LLM大模型
大模型
金融垂直领域
模型微调
M7二极管-ASEMI迷你贴片整流二极管M7二极管
编辑:
llM
7二极管-ASEMI迷你贴片整流二极管M7二极管型号:M7二极管品牌:ASEMI芯片个数:1芯片尺寸:46MIL封装:SMAF恢复时间:ns工作温度:-50°C~150°C浪涌电流:30A正向电流
ASEMI99
·
2023-07-20 05:52
二极管
电子
开关电源
单片机
嵌入式硬件
汽车
谈谈
LLM
在推荐域的渗透,探索推荐新范式
前言最近大模型真的很火,从个人到公司,各行各业都在学习大模型、总结大模型和尝试应用大模型。大模型其实不是一个新的产物,已经在NLP发展了很多年。ChatGPT的诞生,经验的效果震惊了所有人,虽然也有一些瑕疵,但是瑕不掩瑜。微软投资OpenAI看到了它的未来。微软快速围绕ChatGPT对相关的产品进行了产品升级,从搜索到微软365各种产品。5.29号有机会和部门的一些同事一起到上海微软进行了参观访问
阿里云云栖号
·
2023-07-20 04:29
我是程序员
人工智能
chatgpt
云计算
LLM
模型微调方法及经验总结
如何避免灾难遗忘参考:在现在这大规模语言模型(
LLM
)盛行的时代,由于模型参数和显卡配置的因素,预训练基本是大公司或者高校可以完成的事情,而对于小公司或个人,则只
dzysunshine
·
2023-07-20 02:35
ChatGPT
LLM微调
chatgpt
LLM
资料
大语言模型(
LLM
)课程、论文与资料推荐现在CV和NLP越来越紧密,AIGC、多模态、大模型越来越火,尤其是在
LLM
(代表成果ChatGPT)的席卷之下。
莫杨94
·
2023-07-19 23:48
自然语言处理
LLM
人工智能
自然语言处理
LangChain大型语言模型(
LLM
)应用开发(三):Chains
它提供了一套工具、组件和接口,可简化创建由大型语言模型(
LLM
)和聊天模型提供支持的应用程序的过程。LangChain可以轻松管理与语言模型的交互,将多个组件链接在一起,以便在不同的应用程序中使用。
-派神-
·
2023-07-19 22:05
ChatGPT
自然语言处理
Langchain
langchain
语言模型
chatgpt
人工智能
论文解读: 2023-ChatLaw: Open-Source Legal Large Language Model with Integrated External Knowledge Bases
现在看一下他们的技术报告:ChatLaw:Open-SourceLegalLargeLanguageModelwithIntegratedExternalKnowledgeBases,给大家以
LLM
+外部知识库构建领域模型提供参考思路
hj_caas
·
2023-07-19 15:45
自然语言处理
语言模型
人工智能
自然语言处理
论文解读: 2023-Lost in the Middle: How Language Models Use Long Contexts
外部知识库+
LLM
的方法可以缓解大模型幻觉,但是如何撰写Prompt才能发挥
LLM
的性能。下面介绍这篇论文说明上下文信息出现在Prompt什么位置使模型表现最佳,以及上下文文本长度对
LLM
性能的影响。
hj_caas
·
2023-07-19 15:44
自然语言处理
语言模型
人工智能
自然语言处理
在
LLM
的支持下使游戏NPC具有记忆化的方法
问题使用GPT这样的
LLM
去处理游戏中的NPC和玩家的对话是个很好的点子,那么如何处理记忆化的问题呢。
hhy不许摸鱼
·
2023-07-19 14:24
NLP
游戏
自然语言处理
【AI 大模型】a16z:
LLM
应用程序的新兴架构:Emerging Architectures for
LLM
Applications
目录
LLM
应用程序的新兴架构:EmergingArchitecturesforLLMApplicationsThestack技术堆栈
禅与计算机程序设计艺术
·
2023-07-19 14:18
架构师必知必会系列
ChatGPT
大数据AI人工智能
人工智能
架构
自然语言处理
语言模型
编程实践
开发语言
LLM
LLM
微调 | Prompt-tuning
简单水一下,不知我理解的prompt-tuning是不是这样。prompt-tuning其实就是给每个任务定义了自己的prompt,拼接到数据上作为输入,然后微调。在prompt-tuning中,我们需要使用特定的prompt和任务数据集对模型进行微调,以适应特定的任务和prompt。这个微调的过程是非常重要的,它可以让模型更好地适应特定的任务和prompt,从而获得更好的性能。如情感分类任务中,
#苦行僧
·
2023-07-19 11:15
#
LLM微调
自然语言处理
prompt-tuning
prompt
大模型
人工智能
深度学习
LLM
微调 | LoRA: Low-Rank Adaptation of Large Language Models
发表于论文:(2021)LoRA:Low-RankAdaptationofLargeLanguageModels目的:大模型预训练+微调范式,微调成本高。LoRA只微调新增的小部分参数。文章目录1、背景2、动机3、LoRA原理4、总结1、背景adapter增加了模型层数,引入了额外的推理延迟;prefix-tuning比较难训练,效果不如直接finetune。LoRA不会引入额外的延迟,甚至原文中
#苦行僧
·
2023-07-19 11:41
#
LLM微调
LoRA
大模型
llm
微调
nlp
人工智能
深度学习
大语言模型(
LLM
)评估综述
论文地址:https://arxiv.org/abs/2307.03109Github地址:https://github.com/MLGroupJLU/
LLM
-eval-survey一、背景随着ChatGPT
wshzd
·
2023-07-19 10:55
语言模型
人工智能
自然语言处理
大模型开发(七):
LLM
提示工程(Prompt)与思维链(CoT)
一、
LLM
模型的涌现能力在GPT没有爆火之前,一直以来的共识都是:模型的规模越大,模型在下游任务上的能力越多、越强。
算法小陈
·
2023-07-19 10:51
prompt
openai
ChatGPT
思维链(CoT)
提示工程(Prompt)
few-shot
LLM
ToT: 利用大语言模型解决需要深思熟虑的问题(下)
V(p,S)4.搜索算法实验24游戏1).任务设置2).基准3).ToT设置4).结果5).错误分析创意写作1).任务设置2).基准3).ToT设置4).结果交叉词相关工作规划和决策自我反省程序引导的
LLM
露葵025
·
2023-07-19 10:20
论文
语言模型
人工智能
自然语言处理
大模型开发(一):GPT、ChatGPT与大模型,一次搞懂这些AI概念
一、什么是大模型⼤模型全称为
LLM
(LargeLanguageModel)是指⼤型的⾃然语⾔处理(NLP)模型。
算法小陈
·
2023-07-19 10:50
人工智能
chatgpt
gpt
AIGC
llama
agi
利用大模型进行法律判决预测
过去的方法主要是通过学习、微调或示例来教授大型语言模型(
LLM
)进行法律判决预测。这些方法存在的问题是学习样本有限,解释性差。
无数据不智能
·
2023-07-19 07:09
chatgpt
gpt
自然语言处理
2019 杭电 多校第3场 1006 Fansblog (HDU 6608)
){if(a==0&&b==0)return-1;if(b==0){x=1;y=0;returna;}lld=exgcd(b,a%b,y,x);y-=a/b*x;returnd;}llinv(lla,
llm
zzuli_hanjk
·
2023-07-19 05:54
数学
大语言模型评估全解:评估流程、评估方法及常见问题
编者按:随着对大语言模型(
LLM
)评估领域的深入研究,我们更加清楚地认识到全面理解评估过程中的问题对于有效评估
LLM
至关重要。
Baihai IDP
·
2023-07-19 01:10
人工智能
深度学习
白海科技
大语言模型
大语言模型评估
LLMOps
LMOps
“百模大战”愈演愈烈,AI大模型的现状与发展
最近,随着OpenAI发布的以用户为中心的聊天机器人ChatGPT的发布,大型语言模型(
LLM
)引起了人们的关注。大模型的好坏与否,主要涉及三个方面:算法、算力和数据。
csdn_aspnet
·
2023-07-18 12:54
人工智能
gpt
AI
人工智能
gpt
AI
模型
当DevOps遇到AI,黑马迎来3.0时代丨IDCF
大规模语言模型
LLM
和相关应用的快速发展正在对研发团队的工作方式产生深远影响,这几乎象征着新的生产力革命的到来。那么,作为一名工程师,如何紧跟时代潮流,探索出软件开发的新工序?
IDCF社区
·
2023-07-18 10:17
人工智能
大数据
LangChain-Evaluation—如何评估
LLM
及其应用(三)
省流:目前没有真正完美的解决方案,比如分类有精度这样接近完美的评估方案,但
LLM
目前没有ThissectionofdocumentationcovershowweapproachandthinkaboutevaluationinLangChain.Bothevaluationofinternalchains
思考实践
·
2023-07-18 08:07
LangChain
langchain
评估
Evaluation
【
LLM
】Langchain使用[四](评估、代理)
note评估目的:检验
LLM
是否达到验收标准;分析改动对于
LLM
应用性能的影响思路:利用语言模型和链,辅助评估代理:代理能方便地将
LLM
连接自己的信息来源(数据)、API等PythonREPLTool工具
山顶夕景
·
2023-07-18 08:03
#
LLM大模型
#
自然语言处理
langchain
大模型
问答系统
langchain源码阅读系列(二)之数据接入层
本节是langchian源码阅读系列第二篇,下面进入DataConnection模块
LLM
应用构建实践笔记D
莫尔索随笔
·
2023-07-18 07:22
LLM应用构建实践笔记
大语言模型开发者教程
langchain
AIGC
AI编程
文心一言
prompt
AI-native
python
【LangChain】数据连接(Data connection)
概要许多
LLM
申请需要特定于用户的数据,这些数据不属于模型训练集的一部分。
山鬼谣me
·
2023-07-18 07:47
LangChain
AI
langchain
P4799 世界冰球锦标赛 ( 折半查找
includeusingnamespacestd;usingVI=vector;usingPII=pair;usingll=longlong;usingull=unsignedlonglong;lln;
llm
stay fool
·
2023-07-18 06:47
搜索
深度优先
算法
LLM
搭建金融系统
背景:这篇文章主要给大家介绍如何基于
LLM
模型配合各种pluging工具(这边主要是跟数据连接、检索的工具相关:知识图谱、向量库...)。
远洋之帆
·
2023-07-18 05:02
金融
AIGC
人工智能
机器学习
算法
Chatglm实现agent控制
背景:这个系列文章,会从
LLM
搭建应用生态角度来写。从0到1训练一个大的通用的模型对于大部分人和团队来讲是不现实的。重资金,重技术含量、重投入这几个门槛可以把很多团队直接劝退。
远洋之帆
·
2023-07-18 05:00
AIGC
语言模型
人工智能
深度学习
机器学习
SeeKeR: 寻找知识的语言模型
本文要解决的问题: 1.当前的
LLM
能够产生通顺的句子,但就事实性上而言可能并不正确,即不符合客观事实,增大模型尺寸也无法解决; 2.知识库无法实时更新,模型不能get到最新的信息,即只能在训练集
夏小悠
·
2023-07-18 00:58
前沿论文
语言模型
人工智能
自然语言处理
人工智能
LLM
模型:奖励模型的训练、PPO 强化学习的训练、RLHF
人工智能
LLM
模型:奖励模型的训练、PPO强化学习的训练1.奖励模型的训练1.1大语言模型中奖励模型的概念在大语言模型完成SFT监督微调后,下一阶段是构建一个奖励模型来对问答对作出得分评价。
汀、人工智能
·
2023-07-18 00:25
AI前沿技术汇总
人工智能
深度学习
强化学习
深度强化学习
PPO算法
奖励模型
RLHF
大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍
大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍1.大语言模型的预训练1.
LLM
预训练的基本概念预训练属于迁移学习的范畴。
汀、人工智能
·
2023-07-18 00:20
AI前沿技术汇总
语言模型
神经网络
transformer
人工智能
NLP
自然语言处理
bert
LLM
-Client一个轻量级的
LLM
集成工具
大型语言模型(
llm
)已经彻底改变了我们与文本交互的方式,OpenAI、Google、AI21、HuggingfaceHub、Anthropic和众多开源模型提供了不同的功能和优势。
deephub
·
2023-07-17 22:57
深度学习
大语言模型
langchain
人工智能
使用 ChatGPT API 构建系统 课程要点总结
BuildingSystemswiththeChatGPTAPI课程链接:https://learn.deeplearning.ai/chatgpt-building-system/第一节简介介绍了两种
LLM
python算法工程师
·
2023-07-17 22:30
随笔
chatgpt
人工智能
FinGPT 研究
FinGPT通过利用预先存在的
LLM
并根据特定的金融应用对其进行微调,做出了创新性的回应。
python算法工程师
·
2023-07-17 21:08
随笔
gpt
人工智能
python
chatgpt
LangChain for
LLM
Application Development 课程要点
课程链接:https://learn.deeplearning.ai/langchain/第一节Introduction简介了一下LangChain等。第二节Model,PromptsandparsersLangChain提供的一个关键能力就是outputparsing,如果需要返回结构化(JSON)的结果,可以考虑使用ResponseSchema、StructuredOutputParser。第
python算法工程师
·
2023-07-17 21:38
随笔
langchain
人工智能
【NLP】国外新动态--
LLM
模型
这是关于在实践中使用大型语言模型(
LLM
)的系列文章中的一篇文章。在这里,我将介绍
LLM
,并介绍使用它们的3个级别。
无水先生
·
2023-07-17 20:57
NLP入门到精通
人工智能
chatgpt
理解
LLM
中的ReAct
largelanguagemodels(LLMs)大语言模型在语义理解和交互式决策方面有着不错的表现。ReAct在一次交互中循环使用推理和行动两个操作解决复杂问题,推理即利用模型自身语义理解能力,行动则利用模型以外的能力(如计算、搜索最新消息,用户自定义的行动)。一个使用ReAct的例子QuestionWhatistheelevationrangefortheareathattheeasterns
小何才露尖尖角
·
2023-07-17 18:29
Python
LLM
LLM
ReAct
react
推理
行动
Unifying Large Language Models and Knowledge Graphs: A Roadmap
本文依旧是
LLM
系列的相关文章,
LLM
与知识图谱结合,针对《UnifyingLargeLanguageModelsandKnowledgeGraphs:ARoadmap》的翻译。
UnknownBody
·
2023-07-17 17:00
综述文章
LLM
知识图谱
语言模型
知识图谱
人工智能
【吴恩达】prompt engineering(原则 迭代 文本概括 推断、订餐机器人)
简介Introduction基础的
LLM
训练的模型,问法国的首都什么,可能会将答案预测为“法国最大的城市是什么,法国的人口是多少”许多LLMs的研究和实践的动力正在指令调整的LLMs上。
山顶夕景
·
2023-07-17 15:38
#
自然语言处理
#
LLM大模型
prompt
gpt
大模型
对话机器人
海睿思分享 | 类chatgpt模型在信息抽取领域的应用
大语言模型(
LLM
,LargeLanguageModel)是指能够处理海量数据、拥有百亿级参数的深度学习模型,它已成为⼈⼯智能领域中的新热点。
海睿思
·
2023-07-17 13:42
chatgpt
人工智能
机器学习
LLM
Prompt Technique 论文精读-1
下面为笔者最近看的一些prompttechnique领域的新兴论文以及对应的总结,分享给大家一起学习。持续更新中…Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModels思维链提示引发大型语言模型的推理能力链接:https://arxiv.org/pdf/2201.11903.pdf时间:2022摘要:我们探讨了如何生成一系列中间
Zeeland
·
2023-07-17 13:22
chatgpt专栏
Promptulate专栏
prompt
人工智能
GPT
LLM
ChatGPT
上一页
95
96
97
98
99
100
101
102
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他