Python&LLM 第86页

[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析（文心一言 | 讯飞星火）

基于此，为更好地学习前沿AI知识，了解LLM和AIGC应用实战，本人在忙完博士学业后，立刻开启

Eastmount·2023-09-19 06:06

（2023，LENS & 视觉模型 & LLM）迈向可见的语言模型：通过自然语言的镜头来看计算机视觉

TowardsLanguageModelsThatCanSee:ComputerVisionThroughtheLENSofNaturalLanguage公众号：EDPJ（添加VX：CV_EDPJ进交流群获取资料）目录0.摘要1.简介2.相关工作2.1大语言模型能力2.2解决视觉和语言任务的对比模型2.3用于视觉应用的大型语言模型2.3.1图像标题（Captioning）生成2.3.2视觉和语言任

EDPJ·2023-09-18 22:47

The Rise and Potential of Large Language Model Based Agents: A Survey

本文是LLM系列文章，针对《TheRiseandPotentialofLargeLanguageModelBasedAgents：ASurvey》的翻译。

UnknownBody·2023-09-18 18:21

微调语言模型前，需要考虑这三个关键方面

编者按：随着大语言模型(LLM)的迅速发展，越来越多团队希望针对特定领域进行模型微调。但是实践运用中总是存在一些困难，直接应用并不总是能达到理想效果。

·2023-09-18 16:51

大模型与数据库：AI 时代的双向助推力

随着AIGC的时代到来，以GPT为首的大型语言模型（LargeLanguageModel，LLM）已经成为当今人工智能领域最热门的话题之一。

·2023-09-18 16:12

Investigating Answerability of LLMs for Long-Form Question Answering

本文是LLM系列的文章，针对《InvestigatingAnswerabilityofLLMsforLong-FormQuestionAnswering》的翻译。

UnknownBody·2023-09-18 13:51

KnowledGPT:Enhancing Large Language Models with Retrieval and Storage Access on Knowledge Bases

本文是LLM系列文章，针对《KnowledGPT:EnhancingLargeLanguageModelswithRetrievalandStorageAccessonKnowledgeBases》的翻译

UnknownBody·2023-09-18 13:50

Textbooks Are All You Need

本文是LLM系列文章，针对《TextbooksAreAllYouNeed》的翻译。

UnknownBody·2023-09-18 13:18

虹科分享 | 谷歌Vertex AI平台使用Redis搭建大语言模型

文章来源：虹科云科技点此阅读原文基础模型和高性能数据层这两个基本组件始终是创建高效、可扩展语言模型应用的关键，利用Redis搭建大语言模型，能够实现高效可扩展的语义搜索、检索增强生成、LLM缓存机制、LLM

虹科电子科技·2023-09-18 12:52

搭建本地人工智能框架LocalAI

它允许您在本地使用消费级硬件运行LLM（不仅如此），支持与ggml格式兼容的多个模型系列。不需要GPU。

杨浦老苏·2023-09-18 12:15

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

关键词：Transformer；PLM；SLM；NLM；LLM；Galactica；OPT；OPT-IML；BLOOM；BLOOMZ；GLM；Reddit；H100；H800；A100；A800；MI200

高性能服务器·2023-09-18 12:32

英伟达 H100 vs. 苹果M2，大模型训练，哪款性价比更高？

A800|H100关键词：M2芯片；Ultra；M1芯片；UltraFusion；ULTRAMAN；RTX4090、A800;A100；H100；LLAMA、LM、AIGC、CHATGLM、LLVM、LLM

高性能服务器·2023-09-18 12:01

Learn Prompt-为什么用 ChatGPT API？

引用人工智能先驱吴恩达先生说过的话：“一个系统需要的远不止一个提示（prompt）或者一个对LLM（大性语言模型）的调用。”

xiaoshun007～·2023-09-18 11:29

LLM（一）| 百川智能baichuan7B、13B、53B以及baichuan2总结

之前在文章baichuan-53BVSChatGLM-6B对比中做过百川大模型53B和ChatGLM6B模型的效果对比，由于百川大模型的内测模型是53B，因此本次对比参数量差异较大，但仍然可以看到两个模型的效果。百川大模型在benchmark上有超越ChatGLM和LLaMA的迹象，尤其是在中文任务上的表现，下面分别对7B、13B和53B模型进行简单总结：一、baichuan-7B2023年6月1

wshzd·2023-09-18 11:14

吴恩达ChatGPT《Finetuning Large Language Models》笔记

learn.deeplearning.ai/finetuning-large-language-models/lesson/1/introductionIntroduction动机：虽然编写提示词（Prompt）可以让LLM

datamonday·2023-09-18 08:49

【自然语言处理】【大模型】RWKV：基于RNN的LLM

BQW_·2023-09-18 05:01

AIgents时代 - (二.) Agents 能力解密

在以LLM驱动的Agent系统中，LLM扮演着Agent的大脑角色，并辅以几个关键组件：规划：LLM能够进行全面的规划，不仅仅是简单的任务拆分。

NaiveCode·2023-09-17 20:31

[NLP] LLM---＜训练中文LLama2(五)＞对SFT后的LLama2进行DPO训练

当前关于LLM的共识大型语言模型（LLM）使NLP中微调模型的过程变得更加复杂。最初，当ChatGPT等模型首次出现时，最主要的方法是先训练奖励模型，然后优化LLM策略。

舒克与贝克·2023-09-17 15:37

[NLP] LLM---＜训练中文LLama2(四)方式一＞对LLama2进行SFT微调

指令精调指令精调阶段的任务形式基本与StanfordAlpaca相同。训练方案也采用了LoRA进行高效精调，并进一步增加了可训练参数数量。在prompt设计上，精调以及预测时采用的都是原版StanfordAlpaca不带input的模版。对于包含input字段的数据，采用f"{instruction}+\n+{input}"的形式进行拼接。其中，StanfordAlpaca格式如下所示：[{"in

舒克与贝克·2023-09-17 10:34

[NLP] LLM---＜训练中文LLama2(一)＞训练一个中文LLama2的步骤

一数据集【Awesome-Chinese-LLM中文数据集】【awesome-instruction-dataset】【awesome-instruction-datasets】【LLaMA-Efficient-Tuning

舒克与贝克·2023-09-17 10:09

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

月1日，荷兰出版巨头Elsevier为其Scopus数据库的部分用户发布了由ChatGPT支持的AI界面，而英国公司DigitalScience则宣布对其Dimensions数据库进行AI大语言模型(LLM

人工智能学家·2023-09-17 09:12

LaaS LLM as a service

LaaSLLMasaservice核心构成GPT产业链如何进行商业化LLM(LargeLanguageModel)发展和趋势LLM(LargeLanguageModel)对于行业公司的分层LLM(LargeLanguageModel

简简单单OnlineZuozuo·2023-09-17 09:34

从GFS到GPT，AI Infra的激荡20年

导读最近AIGC和LLM的浪潮层层迭起，大有把AI行业过去十年画的饼，一夜之间完全变现的势头。而AIInfra（构建AI所需的基础设施），也成了讨论的焦点之一。

高德技术·2023-09-17 07:57

LLM-2021：GPT-J【GPT-3开源替代品】【EleutherAI 】

GitHub-kingoflolz/mesh-transformer-jax:ModelparalleltransformersinJAXandHaikuGPT-J是一个基于GPT-3，由60亿个参数组成的自然语言处理AI模型。该模型在一个800GB的开源文本数据集上进行训练，并且能够与类似规模的GPT-3模型相媲美2020年，微软与OpenAI达成了协议，微软将拥有对GPT-3源代码的独家访问权

u013250861·2023-09-17 04:40

怎么更好的训练一个会数学推理的LLM大模型呢？

前言大模型如火如荼，最近越来越多的工作针对代码和数学两个技能点进行了单独训练，相继推出了math和code大模型。今天我们就先来看看截止目前，一些已经针对数学优化的开源工作。一共涉及到四篇比较出色的paper。在最后也进行了一点简单的总结，供大家参考，一起学习，共同进步。RFT论文：https://arxiv.org/pdf/2308.01825.pdf本文首先给出了一个经验：那就是训练的数据集量

weixin_42001089·2023-09-16 20:43

Recommender Systems in the Era of Large Language Models (LLMs)

本文是LLM系列文章，针对《RecommenderSystemsintheEraofLargeLanguageModels(LLMs)》的翻译。

UnknownBody·2023-09-16 18:57

PMC-LLaMA: Towards Building Open-source Language Models for Medicine

本文是LLM系列文章，针对《PMC-LLaMA:TowardsBuildingOpen-sourceLanguageModelsforMedicine》的翻译。

UnknownBody·2023-09-16 14:34

打造生产级Llama大模型服务

对于任何想要尝试人工智能或本地LLM，又不想因为意外的云账单或API费用而感到震惊的人，我可以告诉你我自己的旅程是如何的，以及如何开始使用廉价的消费级硬件执行Llama2推理。

新缸中之脑·2023-09-16 11:30

Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs

本文是LLM系列文章，针对《ExploringthePotentialofLargeLanguageModels(LLMs)inLearningonGraphs》的翻译。

UnknownBody·2023-09-16 08:21

Right to be Forgotten in the Era of Large Language Models: Implications, Challenges, and Solutions

本文是LLM系列文章，针对《RighttobeForgottenintheEraofLargeLanguageModels:Implications,Challenges,andSolutions》的翻译

UnknownBody·2023-09-16 08:21

Secrets of RLHF in Large Language Models Part I: PPO

本文是LLM系列文章，针对《SecretsofRLHFinLargeLanguageModelsPartI:PPO》的翻译。

UnknownBody·2023-09-16 08:21

Challenges and Applications of Large Language Models

本文是LLM系列文章，针对《ChallengesandApplicationsofLargeLanguageModels》的翻译。

UnknownBody·2023-09-16 08:20

LLM构建AI应用 —— 工程师如何使用黑盒工具

LLM，LargeLanguage

搜狐技术产品小编2023·2023-09-16 05:41

LLM 04-大模型的数据

LLM03-大模型的数据到目前为止，我们已经讨论了大型语言模型的行为（能力和损害）。现在，我们要剥开洋葱的第一层，开始讨论这些模型是如何构建的。

Gocara·2023-09-16 00:21

LLM 03-大模型的有害性

LLM03-大模型的有害性3.1引言1在这次内容中，我们将开始探讨大型语言模型的有害性（危害）。

Gocara·2023-09-15 23:50

LLM 05-大模型法律

LLM05-大模型法律5.1简介在这个教程中，我们将探讨法律对大型语言模型的开发和部署有何规定。

Gocara·2023-09-15 23:44

万字长文总结检索增强 LLM

连接：https://zhuanlan.zhihu.com/p/655272123ChatGPT的出现，让我们看到了大语言模型(LargeLanguageModel,LLM)在语言和代码理解、人类指令遵循

WitsMakeMen·2023-09-15 21:37

Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers

将LLM语言模型当做了元优化器，将ICL当做了隐式的fine-tuning，并且通过实验来验证了ICL和显示的fine-tuning是有类似效果的。

WitsMakeMen·2023-09-15 21:07

C. Fill in the Matrix Codeforces Round 896 (Div. 2)

最大1//#includeusingnamespacestd;typedeflonglongll;constintN=2e5+5;intn;lla[N];voidinit(){}voidsolve(){llm

timidcatt·2023-09-15 18:13

使用 LangChain、Activeloop 和 DeepInfra 对 Twitter 算法进行逆向工程的简明指南

利用VectorStore、ConversationalRetrieverChain和LLM等先进模型，LangChain将我们的代码理解和生成提升到了一个新的水平。

npk191954·2023-09-15 12:47

使用 LoRA 和 QLoRA 对大型语言模型进行参数高效的微调

在本文中，我们将探讨PEFT方法如何优化大型语言模型(LLM)对特定任务的适应。

TD程序员·2023-09-15 09:37

LLM推理部署（一）：LLM七种推理服务框架总结

发布以来，国内外的开源大模型如雨后春笋般成长，但是对于很多企业和个人从头训练预训练模型不太现实，即使微调开源大模型也捉襟见肘，那么直接部署这些开源大模型服务于企业业务将会有很大的前景，本文将介绍七中主流的LLM

wshzd·2023-09-15 02:38

LLM本地知识库问答系统（二）：如何正确使用LlamaIndex索引

wshzd·2023-09-15 02:37

扩散模型实战（八）：微调扩散模型

扩散模型的发展扩散模型实战（三）：扩散模型的应用扩散模型实战（四）：从零构建扩散模型扩散模型实战（五）：采样过程扩散模型实战（六）：DiffusersDDPM初探扩散模型实战（七）：Diffusers蝴蝶图像生成实战微调在LLM

wshzd·2023-09-15 02:37

MindMap: Knowledge Graph Prompting Sparks Graph of Thoughts in Large Language Models

本文是LLM系列文章，针对《MindMap:KnowledgeGraphPromptingSparksGraphofThoughtsinLargeLanguageModels》的翻译。

UnknownBody·2023-09-15 00:59

KNOWLEDGE SOLVER: TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS

本文是LLM系列文章，针对《KNOWLEDGESOLVER:TEACHINGLLMSTOSEARCHFORDOMAINKNOWLEDGEFROMKNOWLEDGEGRAPHS》的翻译。

UnknownBody·2023-09-15 00:29

Unleashing the Power of Graph Learning through LLM-based Autonomous Agents

本文是LLM系列文章，针对《UnleashingthePowerofGraphLearningthroughLLM-basedAutonomousAgents》的翻译。

UnknownBody·2023-09-15 00:28

Continual Pre-Training of Large Language Models: How to (re)warm your model?

本文是LLM系列文章，针对《ContinualPre-TrainingofLargeLanguageModels:Howto(re)warmyourmodel?》的翻译。

UnknownBody·2023-09-15 00:57

使用大型语言模型的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913

brexhq/prompt-engineeringStars:5.8kLicense:MITPromptEngineeringGuide，提供了与大型语言模型（LLM）相关的技巧和窍门。

开源服务指南·2023-09-14 20:21

7分钟了解ChatGPT是如何运作的

程序猿DD_·2023-09-14 16:49

推荐频道

Python&LLM

[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析（文心一言 | 讯飞星火）

（2023，LENS & 视觉模型 & LLM）迈向可见的语言模型：通过自然语言的镜头来看计算机视觉

The Rise and Potential of Large Language Model Based Agents: A Survey

微调语言模型前，需要考虑这三个关键方面

大模型与数据库：AI 时代的双向助推力

Investigating Answerability of LLMs for Long-Form Question Answering

KnowledGPT:Enhancing Large Language Models with Retrieval and Storage Access on Knowledge Bases

Textbooks Are All You Need

虹科分享 | 谷歌Vertex AI平台使用Redis搭建大语言模型

搭建本地人工智能框架LocalAI

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

英伟达 H100 vs. 苹果M2，大模型训练，哪款性价比更高？

Learn Prompt-为什么用 ChatGPT API？

LLM（一）| 百川智能baichuan7B、13B、53B以及baichuan2总结

吴恩达ChatGPT《Finetuning Large Language Models》笔记

【自然语言处理】【大模型】RWKV：基于RNN的LLM

AIgents时代 - (二.) Agents 能力解密

[NLP] LLM---＜训练中文LLama2(五)＞对SFT后的LLama2进行DPO训练

[NLP] LLM---＜训练中文LLama2(四)方式一＞对LLama2进行SFT微调

[NLP] LLM---＜训练中文LLama2(一)＞训练一个中文LLama2的步骤

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

LaaS LLM as a service

从GFS到GPT，AI Infra的激荡20年

LLM-2021：GPT-J【GPT-3开源替代品】【EleutherAI 】

怎么更好的训练一个会数学推理的LLM大模型呢？

Recommender Systems in the Era of Large Language Models (LLMs)

PMC-LLaMA: Towards Building Open-source Language Models for Medicine

打造生产级Llama大模型服务

Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs

Right to be Forgotten in the Era of Large Language Models: Implications, Challenges, and Solutions

Secrets of RLHF in Large Language Models Part I: PPO

Challenges and Applications of Large Language Models

LLM构建AI应用 —— 工程师如何使用黑盒工具

LLM 04-大模型的数据

LLM 03-大模型的有害性

LLM 05-大模型法律

万字长文总结检索增强 LLM

Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers

C. Fill in the Matrix Codeforces Round 896 (Div. 2)

使用 LangChain、Activeloop 和 DeepInfra 对 Twitter 算法进行逆向工程的简明指南

使用 LoRA 和 QLoRA 对大型语言模型进行参数高效的微调

LLM推理部署（一）：LLM七种推理服务框架总结

LLM本地知识库问答系统（二）：如何正确使用LlamaIndex索引

扩散模型实战（八）：微调扩散模型

MindMap: Knowledge Graph Prompting Sparks Graph of Thoughts in Large Language Models

KNOWLEDGE SOLVER: TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS

Unleashing the Power of Graph Learning through LLM-based Autonomous Agents

Continual Pre-Training of Large Language Models: How to (re)warm your model?

使用大型语言模型的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913

7分钟了解ChatGPT是如何运作的