E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
[
LLM
+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析(文心一言 | 讯飞星火)
基于此,为更好地学习前沿AI知识,了解
LLM
和AIGC应用实战,本人在忙完博士学业后,立刻开启
Eastmount
·
2023-09-19 06:06
LLM+AIGC实战
AIGC
chatgpt
文心一言
大语言模型
应用实战
(2023,LENS & 视觉模型 &
LLM
)迈向可见的语言模型:通过自然语言的镜头来看计算机视觉
TowardsLanguageModelsThatCanSee:ComputerVisionThroughtheLENSofNaturalLanguage公众号:EDPJ(添加VX:CV_EDPJ进交流群获取资料)目录0.摘要1.简介2.相关工作2.1大语言模型能力2.2解决视觉和语言任务的对比模型2.3用于视觉应用的大型语言模型2.3.1图像标题(Captioning)生成2.3.2视觉和语言任
EDPJ
·
2023-09-18 22:47
论文笔记
深度学习
人工智能
The Rise and Potential of Large Language Model Based Agents: A Survey
本文是
LLM
系列文章,针对《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》的翻译。
UnknownBody
·
2023-09-18 18:21
LLM
语言模型
人工智能
自然语言处理
微调语言模型前,需要考虑这三个关键方面
编者按:随着大语言模型(
LLM
)的迅速发展,越来越多团队希望针对特定领域进行模型微调。但是实践运用中总是存在一些困难,直接应用并不总是能达到理想效果。
·
2023-09-18 16:51
大模型与数据库:AI 时代的双向助推力
随着AIGC的时代到来,以GPT为首的大型语言模型(LargeLanguageModel,
LLM
)已经成为当今人工智能领域最热门的话题之一。
·
2023-09-18 16:12
Investigating Answerability of LLMs for Long-Form Question Answering
本文是
LLM
系列的文章,针对《InvestigatingAnswerabilityofLLMsforLong-FormQuestionAnswering》的翻译。
UnknownBody
·
2023-09-18 13:51
LLM
人工智能
语言模型
KnowledGPT:Enhancing Large Language Models with Retrieval and Storage Access on Knowledge Bases
本文是
LLM
系列文章,针对《KnowledGPT:EnhancingLargeLanguageModelswithRetrievalandStorageAccessonKnowledgeBases》的翻译
UnknownBody
·
2023-09-18 13:50
LLM
语言模型
人工智能
自然语言处理
Textbooks Are All You Need
本文是
LLM
系列文章,针对《TextbooksAreAllYouNeed》的翻译。
UnknownBody
·
2023-09-18 13:18
LLM
语言模型
人工智能
虹科分享 | 谷歌Vertex AI平台使用Redis搭建大语言模型
文章来源:虹科云科技点此阅读原文基础模型和高性能数据层这两个基本组件始终是创建高效、可扩展语言模型应用的关键,利用Redis搭建大语言模型,能够实现高效可扩展的语义搜索、检索增强生成、
LLM
缓存机制、
LLM
虹科电子科技
·
2023-09-18 12:52
云科技
人工智能
redis
语言模型
搭建本地人工智能框架LocalAI
它允许您在本地使用消费级硬件运行
LLM
(不仅如此),支持与ggml格式兼容的多个模型系列。不需要GPU。
杨浦老苏
·
2023-09-18 12:15
群晖
docker
人工智能
AI
揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速
关键词:Transformer;PLM;SLM;NLM;
LLM
;Galactica;OPT;OPT-IML;BLOOM;BLOOMZ;GLM;Reddit;H100;H800;A100;A800;MI200
高性能服务器
·
2023-09-18 12:32
gracehopper
HBM3e
L40S
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
A800|H100关键词:M2芯片;Ultra;M1芯片;UltraFusion;ULTRAMAN;RTX4090、A800;A100;H100;LLAMA、LM、AIGC、CHATGLM、LLVM、
LLM
高性能服务器
·
2023-09-18 12:01
A100
H100
H800
A800
Learn Prompt-为什么用 ChatGPT API?
引用人工智能先驱吴恩达先生说过的话:“一个系统需要的远不止一个提示(prompt)或者一个对
LLM
(大性语言模型)的调用。”
xiaoshun007~
·
2023-09-18 11:29
ChatGPT
chatgpt
prompt
人工智能
LLM
(一)| 百川智能baichuan7B、13B、53B以及baichuan2总结
之前在文章baichuan-53BVSChatGLM-6B对比中做过百川大模型53B和ChatGLM6B模型的效果对比,由于百川大模型的内测模型是53B,因此本次对比参数量差异较大,但仍然可以看到两个模型的效果。百川大模型在benchmark上有超越ChatGLM和LLaMA的迹象,尤其是在中文任务上的表现,下面分别对7B、13B和53B模型进行简单总结:一、baichuan-7B2023年6月1
wshzd
·
2023-09-18 11:14
ChatGPT
NLP
笔记
chatgpt
AIGC
吴恩达ChatGPT《Finetuning Large Language Models》笔记
learn.deeplearning.ai/finetuning-large-language-models/lesson/1/introductionIntroduction动机:虽然编写提示词(Prompt)可以让
LLM
datamonday
·
2023-09-18 08:49
AIGC
chatgpt
prompt
llm
llama
finetune
【自然语言处理】【大模型】RWKV:基于RNN的
LLM
相关博客【自然语言处理】【大模型】RWKV:基于RNN的
LLM
【自然语言处理】【大模型】CodeGen:一个用于多轮程序合成的代码大语言模型【自然语言处理】【大模型】CodeGeeX:用于代码生成的多语言预训练模型
BQW_
·
2023-09-18 05:01
自然语言处理
自然语言处理
rnn
RWKV
LLM
模型结构
AIgents时代 - (二.) Agents 能力解密
在以
LLM
驱动的Agent系统中,
LLM
扮演着Agent的大脑角色,并辅以几个关键组件:规划:
LLM
能够进行全面的规划,不仅仅是简单的任务拆分。
NaiveCode
·
2023-09-17 20:31
人工智能
[NLP]
LLM
---<训练中文LLama2(五)>对SFT后的LLama2进行DPO训练
当前关于
LLM
的共识大型语言模型(
LLM
)使NLP中微调模型的过程变得更加复杂。最初,当ChatGPT等模型首次出现时,最主要的方法是先训练奖励模型,然后优化
LLM
策略。
舒克与贝克
·
2023-09-17 15:37
自然语言处理
人工智能
深度学习
[NLP]
LLM
---<训练中文LLama2(四)方式一>对LLama2进行SFT微调
指令精调指令精调阶段的任务形式基本与StanfordAlpaca相同。训练方案也采用了LoRA进行高效精调,并进一步增加了可训练参数数量。在prompt设计上,精调以及预测时采用的都是原版StanfordAlpaca不带input的模版。对于包含input字段的数据,采用f"{instruction}+\n+{input}"的形式进行拼接。其中,StanfordAlpaca格式如下所示:[{"in
舒克与贝克
·
2023-09-17 10:34
自然语言处理
人工智能
[NLP]
LLM
---<训练中文LLama2(一)>训练一个中文LLama2的步骤
一数据集【Awesome-Chinese-
LLM
中文数据集】【awesome-instruction-dataset】【awesome-instruction-datasets】【LLaMA-Efficient-Tuning
舒克与贝克
·
2023-09-17 10:09
自然语言处理
人工智能
类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中
月1日,荷兰出版巨头Elsevier为其Scopus数据库的部分用户发布了由ChatGPT支持的AI界面,而英国公司DigitalScience则宣布对其Dimensions数据库进行AI大语言模型(
LLM
人工智能学家
·
2023-09-17 09:12
搜索引擎
chatgpt
人工智能
LaaS
LLM
as a service
LaaSLLMasaservice核心构成GPT产业链如何进行商业化
LLM
(LargeLanguageModel)发展和趋势
LLM
(LargeLanguageModel)对于行业公司的分层
LLM
(LargeLanguageModel
简简单单OnlineZuozuo
·
2023-09-17 09:34
杂项
人工智能
机器学习
深度学习
从GFS到GPT,AI Infra的激荡20年
导读最近AIGC和
LLM
的浪潮层层迭起,大有把AI行业过去十年画的饼,一夜之间完全变现的势头。而AIInfra(构建AI所需的基础设施),也成了讨论的焦点之一。
高德技术
·
2023-09-17 07:57
人工智能
gpt
LLM
-2021:GPT-J【GPT-3开源替代品】【EleutherAI 】
GitHub-kingoflolz/mesh-transformer-jax:ModelparalleltransformersinJAXandHaikuGPT-J是一个基于GPT-3,由60亿个参数组成的自然语言处理AI模型。该模型在一个800GB的开源文本数据集上进行训练,并且能够与类似规模的GPT-3模型相媲美2020年,微软与OpenAI达成了协议,微软将拥有对GPT-3源代码的独家访问权
u013250861
·
2023-09-17 04:40
#
LLM/经典模型
gpt-3
人工智能
深度学习
怎么更好的训练一个会数学推理的
LLM
大模型呢?
前言大模型如火如荼,最近越来越多的工作针对代码和数学两个技能点进行了单独训练,相继推出了math和code大模型。今天我们就先来看看截止目前,一些已经针对数学优化的开源工作。一共涉及到四篇比较出色的paper。在最后也进行了一点简单的总结,供大家参考,一起学习,共同进步。RFT论文:https://arxiv.org/pdf/2308.01825.pdf本文首先给出了一个经验:那就是训练的数据集量
weixin_42001089
·
2023-09-16 20:43
人工智能机器学习
chatgpt
gpt-3
Recommender Systems in the Era of Large Language Models (LLMs)
本文是
LLM
系列文章,针对《RecommenderSystemsintheEraofLargeLanguageModels(LLMs)》的翻译。
UnknownBody
·
2023-09-16 18:57
LLM
综述文章
推荐系统
语言模型
人工智能
自然语言处理
PMC-LLaMA: Towards Building Open-source Language Models for Medicine
本文是
LLM
系列文章,针对《PMC-LLaMA:TowardsBuildingOpen-sourceLanguageModelsforMedicine》的翻译。
UnknownBody
·
2023-09-16 14:34
LLM
llama
语言模型
人工智能
打造生产级Llama大模型服务
对于任何想要尝试人工智能或本地
LLM
,又不想因为意外的云账单或API费用而感到震惊的人,我可以告诉你我自己的旅程是如何的,以及如何开始使用廉价的消费级硬件执行Llama2推理。
新缸中之脑
·
2023-09-16 11:30
llama
Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs
本文是
LLM
系列文章,针对《ExploringthePotentialofLargeLanguageModels(LLMs)inLearningonGraphs》的翻译。
UnknownBody
·
2023-09-16 08:21
LLM
图神经网络
语言模型
人工智能
大数据
Right to be Forgotten in the Era of Large Language Models: Implications, Challenges, and Solutions
本文是
LLM
系列文章,针对《RighttobeForgottenintheEraofLargeLanguageModels:Implications,Challenges,andSolutions》的翻译
UnknownBody
·
2023-09-16 08:21
LLM
语言模型
人工智能
自然语言处理
Secrets of RLHF in Large Language Models Part I: PPO
本文是
LLM
系列文章,针对《SecretsofRLHFinLargeLanguageModelsPartI:PPO》的翻译。
UnknownBody
·
2023-09-16 08:21
LLM
语言模型
人工智能
自然语言处理
Challenges and Applications of Large Language Models
本文是
LLM
系列文章,针对《ChallengesandApplicationsofLargeLanguageModels》的翻译。
UnknownBody
·
2023-09-16 08:20
LLM
综述文章
语言模型
人工智能
自然语言处理
LLM
构建AI应用 —— 工程师如何使用黑盒工具
LLM
,LargeLanguage
搜狐技术产品小编2023
·
2023-09-16 05:41
人工智能
LLM
04-大模型的数据
LLM
03-大模型的数据到目前为止,我们已经讨论了大型语言模型的行为(能力和损害)。现在,我们要剥开洋葱的第一层,开始讨论这些模型是如何构建的。
Gocara
·
2023-09-16 00:21
LLM
python
语言模型
nlp
LLM
03-大模型的有害性
LLM
03-大模型的有害性3.1引言1在这次内容中,我们将开始探讨大型语言模型的有害性(危害)。
Gocara
·
2023-09-15 23:50
LLM
人工智能
python
语言模型
nlp
LLM
05-大模型法律
LLM
05-大模型法律5.1简介在这个教程中,我们将探讨法律对大型语言模型的开发和部署有何规定。
Gocara
·
2023-09-15 23:44
LLM
nlp
人工智能
语言模型
万字长文总结检索增强
LLM
连接:https://zhuanlan.zhihu.com/p/655272123ChatGPT的出现,让我们看到了大语言模型(LargeLanguageModel,
LLM
)在语言和代码理解、人类指令遵循
WitsMakeMen
·
2023-09-15 21:37
LLM
Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers
将
LLM
语言模型当做了元优化器,将ICL当做了隐式的fine-tuning,并且通过实验来验证了ICL和显示的fine-tuning是有类似效果的。
WitsMakeMen
·
2023-09-15 21:07
gpt
语言模型
人工智能
C. Fill in the Matrix Codeforces Round 896 (Div. 2)
最大1//#includeusingnamespacestd;typedeflonglongll;constintN=2e5+5;intn;lla[N];voidinit(){}voidsolve(){
llm
timidcatt
·
2023-09-15 18:13
贪心
算法
c++
数据结构
使用 LangChain、Activeloop 和 DeepInfra 对 Twitter 算法进行逆向工程的简明指南
利用VectorStore、ConversationalRetrieverChain和
LLM
等先进模型,LangChain将我们的代码理解和生成提升到了一个新的水平。
npk191954
·
2023-09-15 12:47
langchain
使用 LoRA 和 QLoRA 对大型语言模型进行参数高效的微调
在本文中,我们将探讨PEFT方法如何优化大型语言模型(
LLM
)对特定任务的适应。
TD程序员
·
2023-09-15 09:37
自然语言处理实战篇
语言模型
人工智能
自然语言处理
LLM
推理部署(一):
LLM
七种推理服务框架总结
发布以来,国内外的开源大模型如雨后春笋般成长,但是对于很多企业和个人从头训练预训练模型不太现实,即使微调开源大模型也捉襟见肘,那么直接部署这些开源大模型服务于企业业务将会有很大的前景,本文将介绍七中主流的
LLM
wshzd
·
2023-09-15 02:38
chatgpt
LLM
本地知识库问答系统(二):如何正确使用LlamaIndex索引
推荐阅读列表:
LLM
本地知识库问答系统(一):使用LangChain和LlamaIndex从零构建PDF聊天机器人指南上一篇文章我们介绍了使用LlamaIndex构建PDF聊天机器人,本文将介绍一下LlamaIndex
wshzd
·
2023-09-15 02:37
ChatGPT
人工智能
扩散模型实战(八):微调扩散模型
扩散模型的发展扩散模型实战(三):扩散模型的应用扩散模型实战(四):从零构建扩散模型扩散模型实战(五):采样过程扩散模型实战(六):DiffusersDDPM初探扩散模型实战(七):Diffusers蝴蝶图像生成实战微调在
LLM
wshzd
·
2023-09-15 02:37
ChatGPT
笔记
AIGC
chatgpt
MindMap: Knowledge Graph Prompting Sparks Graph of Thoughts in Large Language Models
本文是
LLM
系列文章,针对《MindMap:KnowledgeGraphPromptingSparksGraphofThoughtsinLargeLanguageModels》的翻译。
UnknownBody
·
2023-09-15 00:59
LLM
知识图谱
知识图谱
语言模型
人工智能
KNOWLEDGE SOLVER: TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS
本文是
LLM
系列文章,针对《KNOWLEDGESOLVER:TEACHINGLLMSTOSEARCHFORDOMAINKNOWLEDGEFROMKNOWLEDGEGRAPHS》的翻译。
UnknownBody
·
2023-09-15 00:29
知识图谱
LLM
知识图谱
人工智能
Unleashing the Power of Graph Learning through
LLM
-based Autonomous Agents
本文是
LLM
系列文章,针对《UnleashingthePowerofGraphLearningthroughLLM-basedAutonomousAgents》的翻译。
UnknownBody
·
2023-09-15 00:28
LLM
人工智能
语言模型
agent
Continual Pre-Training of Large Language Models: How to (re)warm your model?
本文是
LLM
系列文章,针对《ContinualPre-TrainingofLargeLanguageModels:Howto(re)warmyourmodel?》的翻译。
UnknownBody
·
2023-09-15 00:57
LLM
语言模型
人工智能
使用大型语言模型的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913
brexhq/prompt-engineeringStars:5.8kLicense:MITPromptEngineeringGuide,提供了与大型语言模型(
LLM
)相关的技巧和窍门。
开源服务指南
·
2023-09-14 20:21
开源日报
语言模型
人工智能
自然语言处理
7分钟了解ChatGPT是如何运作的
ChatGPT是现在最为热门的聊天助手应用,它使用了一个大型语言模型(
LLM
),即GPT-3.5。它通过大量的文本数据进行训练,以理解和生成人类语言。但是,你是否有了解过ChatGPT是如何运作的吗?
程序猿DD_
·
2023-09-14 16:49
chatgpt
上一页
82
83
84
85
86
87
88
89
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他