Python&LLM 第87页

快速幂 c++

一般大家写都是intans=1;for(inti=1;iusingnamespacestd;typedeflonglongLL;LLa,b,m;//m是取模的数LLq_pow(LLa,LLb,LLm){

小王子009·2023-09-14 13:23

transformer大语言模型(LLM)部署方案整理

说明大模型的基本特征就是大，单机单卡部署会很慢，甚至显存不够用。毕竟不是谁都有H100/A100,能有个3090就不错了。目前已经有不少框架支持了大模型的分布式部署，可以并行的提高推理速度。不光可以单机多卡，还可以多机多卡。我自己没啥使用经验，简单罗列下给自己备查。不足之处，欢迎在评论区指出。框架名称出品方开源地址FasterTranaformer英伟达FasterTransformergithu

yuanlulu·2023-09-14 10:52

[Google DeepMind] LARGE LANGUAGE MODELS AS OPTIMIZERS

输入后LLM便会生成一个solution，这个solution由objectivefunction评估并打分。(soluti

ShadyPi·2023-09-14 10:00

大模型升级与设计之道：ChatGLM、LLAMA、Baichuan及LLM结构解析

本文通过深入剖析ChatGLM、LLAMA和Baichuan模型的升级路径，以及探讨大型语言模型结构选型，为大家提供了一个系统性的视角，梳理了大型预训练模型的关键要素。我们希望这些知识能够为大家在实际工程中构建更强大、灵活且高效的大型预训练模型提供有力的参考和指导。引言目前大语言模型在各个领域取得了显著的突破，从ChatGLM、LLAMA到Baichuan等，它们在处理各种自然语言任务时展现出了惊

阿里巴巴淘系技术团队官网博客·2023-09-14 10:26

LLM在电商推荐系统的探索与实践

阿里巴巴淘系技术团队官网博客·2023-09-14 09:53

Textbooks Are All You Need II: phi-1.5 technical report

本文是LLM系列文章，针对《TextbooksAreAllYouNeedII:phi-1.5technicalreport》的翻译。

UnknownBody·2023-09-14 07:19

Baichuan 2: Open Large-scale Language Models

本文是LLM系列文章，针对《Baichuan2:OpenLarge-scaleLanguageModels》的翻译。

UnknownBody·2023-09-14 07:19

Causal Reasoning and Large Language Models: Opening a New Frontier for Causality

本文是LLM系列文章，针对《CausalReasoningandLargeLanguageModels:OpeningaNewFrontierforCausality》的翻译。

UnknownBody·2023-09-14 07:19

When Less is More: Investigating Data Pruning for Pretraining LLMs at Scale

本文是LLM系列的文章，针对《WhenLessisMore:InvestigatingDataPruningforPretrainingLLMsatScale》的翻译。

UnknownBody·2023-09-14 07:45

Multi Query Attention & Group Query Attention

随着LLM的大火，MQA所带来的收益得以放大。

transformer_WSZ·2023-09-14 06:13

Vision-CAIR/MiniGPT-4：使用先进的大型语言模型增强视觉-语言理解

近年来，大型语言模型（LLM）在自然语言处理（NLP）领域取得了令人瞩目的成就，但是它们在视觉-语言任务上的应用还有很多挑战。

senda66·2023-09-14 02:18

【AIGC】斯坦福小镇升级版——AI-Town源码解读

写在前面的话：接上一篇斯坦福小镇升级版——AI-Town搭建指南，本本篇将解读AI-Town使用的技术栈、代码架构、与LLM的交互，以及与斯坦福AI小镇的对比结果（如想直接看结论可跳到文章最后）整体架构技术栈

Smilence_lsy·2023-09-14 01:26

AIGC：【LLM（八）】——Baichuan2技术报告

文章目录摘要1.引言2.预训练2.1预训练数据（Pre-trainingData）2.2架构（Architecture）2.3令牌化器（Tokenizer）2.3.1PositionalEmbeddings2.4激活和规范化（ActivationsandNormalizations）2.5优化（Optimizations）2.6规模定律（ScalingLaws）2.7基础设施（Infrastruc

J_Xiong0117·2023-09-13 23:03

[ACL2023] Symbolic Chain-of-Thought Distillation: Small Models Can Also “Think” Step-by-Step

SymbolicChain-of-ThoughtDistillation:SmallModelsCanAlso“Think”Step-by-Step文章链接虽然CoT作为一种prompt形式在提高LLM

ShadyPi·2023-09-13 18:04

Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement

Self-Polish:EnhanceReasoninginLargeLanguageModelsviaProblemRefinement文章链接核心思想是通过instruction让LLM来优化问题本身

ShadyPi·2023-09-13 18:01

[NLP] LLM---扩充词表LLama2-构建中文tokenization

使用SentencePiece的除了从0开始训练大模型的土豪和大公司外，大部分应该都是使用其为当前开源的大模型扩充词表，比如为LLama扩充通用中文词表（通用中文词表，或者垂直领域词表）。那这部分工作有没有意义呢？或者说值不值得投入资源去做呢？先说自己的结论，有，以下两点的作用，第三点不确定：1.提高模型的编解码的效率，在LLaMa原来的词表上，一个汉字平均1.45个token，扩充后的Chine

舒克与贝克·2023-09-13 17:24

Orca LLM：模拟 ChatGPT 的推理过程

ygtu2018·2023-09-13 13:40

【精华】AI Agent：大模型改变世界的“钥匙”

文章目录1.Auto-GPT2.BabyAGI3.AgentGPT4.GodMode5.AITown6.ChatDev当前大模型的本质是大语言模型（LargeLanguageModel,LLM）。

LeeZhao@·2023-09-13 12:22

如何评估大型语言模型

01对大型语言模型（LLM）的主客观评估在评估大型语言模型时，我们可以进行客观评估和主观评估。主观评估的方法是用户亲自尝试不同的模型，提出一些问题，然后根据自己的感受来判断哪个模型好，哪个模型不好。

叶锦鲤·2023-09-13 12:14

AI文本创作在百度App发文的实践

作者|内容生态端团队导读大语言模型（LLM）指包含数百亿（或更多）参数的语言模型，这些模型通常在大规模数据集上进行训练，以提高其性能和泛化能力。

百度Geek说·2023-09-13 09:56

跟着LangChain参考文档搭建LLM+知识库问答系统

0.环境租用了1台GPU服务器，系统ubuntu20，TeslaV100-16GB（GPU服务器已经关机结束租赁了）SSH地址：*端口：17520SSH账户：root密码：Jaere7pa内网：3389，外网：17518VNC地址：*端口：17519VNC用户名：root密码：Jaere7pa硬件需求，ChatGLM-6B和ChatGLM2-6B相当。量化等级最低GPU显存FP16（无量化）13G

qq_27158179·2023-09-13 07:19

LLM 01-引言

LLM01-引言1.1什么是语言模型语言模型（LM）的经典定义是一种对令牌序列(token)的概率分布。假设我们有一个令牌集的词汇表VVV。

Gocara·2023-09-13 05:17

LLM 02-大模型的能力

LLM02-大模型的能力我们将深入探讨GPT-3——这个具有代表性的大型语言模型的能力。

Gocara·2023-09-13 05:42

记录一次部署Hugo主题lotusdocs到Github Pages实践

目前已经部署好的主题：LabelConvert和Knowledge-QA-LLM

Liekkas Kono·2023-09-13 03:47

【LangChain系列 7】Prompt模版——少样本prompt模版(一)

原文地址：【LangChain系列7】Prompt模版——少样本prompt模版(一)本文速读：prompt样本集合prompt样本选择器少样本模版的意思是：在prompt中包含一些样本，这样LLM就可以根据这些样本

大白爱爬山·2023-09-13 03:43

Generative AI 新世界 | 大模型参数高效微调和量化原理概述

本期文章，我们将探讨两个目前大语言模型（LLM）领域的开发者们都关注的热门话题：大型语言模型的高效微调和量化。微调大型语言模型允许开发者调整开源基础模型，从而提高特定领域任务的性能。

亚马逊云开发者·2023-09-13 01:58

8个免费的AI和LLM游乐场

ygtu2018·2023-09-12 21:50

大语言模型之八-提示工程（Prompt engineer）

LLM中的prompt方法主要用于fine-tune阶段，即在预训练的基础上，针对特定任务的模板或提示语，这些提示语通常包含了问题的关键信息，例如问题类型、答案类型、限制条件等，通过少量的标注数据（提示语

shichaog·2023-09-12 16:10

From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting

本文是LLM系列的文章，针对《FromSparsetoDense:GPT-4SummarizationwithChainofDensityPrompting》的翻译。

UnknownBody·2023-09-12 13:40

LARGE LANGUAGE MODELS AS OPTIMIZERS

本文是LLM系列文章，针对《LARGELANGUAGEMODELSASOPTIMIZERS》的翻译。

UnknownBody·2023-09-12 13:39

LangChain-Chatchat：基于LangChain和ChatGLM2-6B构建本地离线私有化知识库

LangChain-Chatchat：基于LangChain和ChatGLM2-6B构建本地离线私有化知识库一、前言二、介绍2.1、ChatGLM2-6B2.2、LangChain-Chatchat介绍三、模型支持3.1、LLM

徊忆羽菲·2023-09-12 12:56

AI文本创作在百度App发文的实践

作者|内容生态端团队导读大语言模型（LLM）指包含数百亿（或更多）参数的语言模型，这些模型通常在大规模数据集上进行训练，以提高其性能和泛化能力。

·2023-09-12 10:56

Falcon 180B 目前最强大的开源模型

TechnologyInnovationInstitute最近发布了Falcon180B大型语言模型(LLM)，它击败了Llama-270b，与谷歌Bard的基础模型PaLM-2Large不相上下。

·2023-09-12 10:25

Lost in the Middle: How Language Models Use Long Contexts

本文是LLM系列文章，针对《LostintheMiddle:HowLanguageModelsUseLongContexts》的翻译。

UnknownBody·2023-09-12 08:36

开放域问答论文阅读-Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augme

最近，大型语言模型（LLM）（例如ChatGPT）在利用世界知识解决各种任务（包括知识密集型任务）方面表现出了令人印象深刻的能力。

无脑敲代码，bug漫天飞·2023-09-12 07:24

GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

在图像-文本对上调整大语言模型（LLM）的指令已经实现了前所未有的视觉-语言多模态能力。然而，他们的视觉语言对齐仅建立在图像级别上，缺乏区域级别对齐限制了他们在细粒度多模态理解方面的进步。

Spielberg_1·2023-09-12 06:23

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

文章目录一.模型介绍二.模型部署2.1CPU部署2.2GPU部署三.模型推理3.1Chat模型推理3.2Base模型推理四.模型量化4.1量化方法4.2在线量化4.3离线量化4.4量化效果五.模型微调5.1依赖安装5.2单机训练5.3多机训练5.4轻量化微调一.模型介绍Baichuan2是百川智能推出的新一代开源大语言模型，采用2.6万亿Tokens的高质量语料训练。其在多个权威的中文、英文和多语

J_Xiong0117·2023-09-12 06:46

AI大模型(LLM)、聊天机器人整理（持续更新）by pickmind

原文：https://blog.pickmind.xyz/article/3c87123f-d283-4a05-8e43-4ee8550cf22f目录：文章目录国内获批大模型国内大模型深渊图Open-sourceLargeLanguageModelsLeaderboard（国外）lmsys发布的大模型排行榜（国外）**OpenLLMLeaderboard（国外）******AlpacaEvalLe

itsc·2023-09-12 05:35

使用 FastGPT 构建高质量 AI 知识库

尤其在GPT-3.5接口全面开放后，大量的LLM应用如雨后春笋般涌现。然而，由于GPT的可控性、随机性和合规性等问题，很多应用场景都没

·2023-09-11 23:36

大模型外挂知识库优化-大模型辅助向量召回

来自：NLP工作站进NLP群—>加入NLP交流群写在前面大模型时代，通常采用向量召回的方式从文档库里召回和用户问题相关的文档片段，输入到LLM中来增强模型回答质量。

zenRRan·2023-09-11 20:17

OPRO：利用LLM作为优化器，解决一系列用自然语言描述的任务

深度学习自然语言处理原创作者：Winnie前言Google的最新一项研究提出了OPRO优化方法(OptimizationbyPROmpting)，它利用LLM作为优化器，解决一系列用自然语言描述的任务，

zenRRan·2023-09-11 20:17

万字长文: 检索增强 LLM

来自：AI思维单车ChatGPT的出现，让我们看到了大语言模型(LargeLanguageModel,LLM)在语言和代码理解、人类指令遵循、基本推理等多方面的能力，但幻觉问题Hallucinations

zenRRan·2023-09-11 20:47

【面试题】2023知乎暑期实习算法实习生(LLM方向)面经

来源：投稿作者：LSC编辑：学姐1.自我介绍2.介绍操作系统的进程和线程，以及它们的区别3.C++深拷贝和浅拷贝的区别4.Python的列表和元组的区别5.Python的列表和元组是否可以做字典的键6.图像分类的流程7.图像分类的评价指标有哪些？Auc怎么计算?8.交叉熵损失函数的计算公式和计算过程9.编程题有一个无序的整数数组，从数组中可以任意选择两个不重复的数字，以这两个数字所在的位置，可以建

深度之眼·2023-09-11 20:59

Code Llama: Open Foundation Models for Code

本文是LLM系列文章，针对《CodeLlama:OpenFoundationModelsforCode》的翻译。

UnknownBody·2023-09-11 20:13

Augmented Large Language Models with Parametric Knowledge Guiding

本文是LLM系列文章，针对《AugmentedLargeLanguageModelswithParametricKnowledgeGuiding》的翻译。

UnknownBody·2023-09-11 20:13

How Language Model Hallucinations Can Snowball

本文是LLM系列文章，针对《HowLanguageModelHallucinationsCanSnowball》的翻译。语言模型幻觉是如何产生雪球的摘要1引言2为什么我们期待幻觉像滚雪球一样越滚越大？

UnknownBody·2023-09-11 19:42

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

本文是LLM系列文章，针对《Verify-and-Edit:AKnowledge-EnhancedChain-of-ThoughtFramework》的翻译。

UnknownBody·2023-09-11 19:11

Flowise AI：用于构建LLM流的拖放UI

LangChain是一个框架/python库，可帮助您利用LLM构建自己的自定义NLP应用程序。Flowise使用LangChain作为其代理执行器，C

·2023-09-11 18:55

Chinese-LLaMA-Alpaca-2模型的测评

⚔️模型竞技场：http://llm-arena.ymcui.com系统对战胜率（无平局）↓Elo评分Chinese-

柴神·2023-09-11 18:36

使用LLM在移动设备上实现对话交互

·2023-09-11 18:24

推荐频道

Python&LLM

快速幂 c++

transformer大语言模型(LLM)部署方案整理

[Google DeepMind] LARGE LANGUAGE MODELS AS OPTIMIZERS

大模型升级与设计之道：ChatGLM、LLAMA、Baichuan及LLM结构解析

LLM在电商推荐系统的探索与实践

Textbooks Are All You Need II: phi-1.5 technical report

Baichuan 2: Open Large-scale Language Models

Causal Reasoning and Large Language Models: Opening a New Frontier for Causality

When Less is More: Investigating Data Pruning for Pretraining LLMs at Scale

Multi Query Attention & Group Query Attention

Vision-CAIR/MiniGPT-4：使用先进的大型语言模型增强视觉-语言理解

【AIGC】斯坦福小镇升级版——AI-Town源码解读

AIGC：【LLM（八）】——Baichuan2技术报告

[ACL2023] Symbolic Chain-of-Thought Distillation: Small Models Can Also “Think” Step-by-Step

Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement

[NLP] LLM---扩充词表LLama2-构建中文tokenization

Orca LLM：模拟 ChatGPT 的推理过程

【精华】AI Agent：大模型改变世界的“钥匙”

如何评估大型语言模型

AI文本创作在百度App发文的实践

跟着LangChain参考文档搭建LLM+知识库问答系统

LLM 01-引言

LLM 02-大模型的能力

记录一次部署Hugo主题lotusdocs到Github Pages实践

【LangChain系列 7】Prompt模版——少样本prompt模版(一)

Generative AI 新世界 | 大模型参数高效微调和量化原理概述

8个免费的AI和LLM游乐场

大语言模型之八-提示工程（Prompt engineer）

From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting

LARGE LANGUAGE MODELS AS OPTIMIZERS

LangChain-Chatchat：基于LangChain和ChatGLM2-6B构建本地离线私有化知识库

AI文本创作在百度App发文的实践

Falcon 180B 目前最强大的开源模型

Lost in the Middle: How Language Models Use Long Contexts

开放域问答论文阅读-Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augme

GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

AI大模型(LLM)、聊天机器人整理（持续更新）by pickmind

使用 FastGPT 构建高质量 AI 知识库

大模型外挂知识库优化-大模型辅助向量召回

OPRO：利用LLM作为优化器，解决一系列用自然语言描述的任务

万字长文: 检索增强 LLM

【面试题】2023知乎暑期实习算法实习生(LLM方向)面经

Code Llama: Open Foundation Models for Code

Augmented Large Language Models with Parametric Knowledge Guiding

How Language Model Hallucinations Can Snowball

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

Flowise AI：用于构建LLM流的拖放UI

Chinese-LLaMA-Alpaca-2模型的测评

使用LLM在移动设备上实现对话交互