E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
快速幂 c++
一般大家写都是intans=1;for(inti=1;iusingnamespacestd;typedeflonglongLL;LLa,b,m;//m是取模的数LLq_pow(LLa,LLb,
LLm
){
小王子009
·
2023-09-14 13:23
c++
算法
数据结构
快速幂
取模
transformer大语言模型(
LLM
)部署方案整理
说明大模型的基本特征就是大,单机单卡部署会很慢,甚至显存不够用。毕竟不是谁都有H100/A100,能有个3090就不错了。目前已经有不少框架支持了大模型的分布式部署,可以并行的提高推理速度。不光可以单机多卡,还可以多机多卡。我自己没啥使用经验,简单罗列下给自己备查。不足之处,欢迎在评论区指出。框架名称出品方开源地址FasterTranaformer英伟达FasterTransformergithu
yuanlulu
·
2023-09-14 10:52
深度学习论文笔记和实践
transformer
语言模型
深度学习
人工智能
自然语言处理
部署
[Google DeepMind] LARGE LANGUAGE MODELS AS OPTIMIZERS
输入后
LLM
便会生成一个solution,这个solution由objectivefunction评估并打分。(soluti
ShadyPi
·
2023-09-14 10:00
自然语言处理
语言模型
人工智能
自然语言处理
大模型升级与设计之道:ChatGLM、LLAMA、Baichuan及
LLM
结构解析
本文通过深入剖析ChatGLM、LLAMA和Baichuan模型的升级路径,以及探讨大型语言模型结构选型,为大家提供了一个系统性的视角,梳理了大型预训练模型的关键要素。我们希望这些知识能够为大家在实际工程中构建更强大、灵活且高效的大型预训练模型提供有力的参考和指导。引言目前大语言模型在各个领域取得了显著的突破,从ChatGLM、LLAMA到Baichuan等,它们在处理各种自然语言任务时展现出了惊
阿里巴巴淘系技术团队官网博客
·
2023-09-14 10:26
llama
LLM
在电商推荐系统的探索与实践
本文对
LLM
+推荐的结合范式进行了梳理和讨论,并尝试将
LLM
涌现的能力迁移应用在推荐系统之中,利用
LLM
的通用知识来辅助推荐,改善推荐效果和用户体验。
阿里巴巴淘系技术团队官网博客
·
2023-09-14 09:53
Textbooks Are All You Need II: phi-1.5 technical report
本文是
LLM
系列文章,针对《TextbooksAreAllYouNeedII:phi-1.5technicalreport》的翻译。
UnknownBody
·
2023-09-14 07:19
LLM
语言模型
人工智能
Baichuan 2: Open Large-scale Language Models
本文是
LLM
系列文章,针对《Baichuan2:OpenLarge-scaleLanguageModels》的翻译。
UnknownBody
·
2023-09-14 07:19
LLM
语言模型
人工智能
自然语言处理
Causal Reasoning and Large Language Models: Opening a New Frontier for Causality
本文是
LLM
系列文章,针对《CausalReasoningandLargeLanguageModels:OpeningaNewFrontierforCausality》的翻译。
UnknownBody
·
2023-09-14 07:19
LLM
语言模型
人工智能
自然语言处理
When Less is More: Investigating Data Pruning for Pretraining LLMs at Scale
本文是
LLM
系列的文章,针对《WhenLessisMore:InvestigatingDataPruningforPretrainingLLMsatScale》的翻译。
UnknownBody
·
2023-09-14 07:45
LLM
剪枝
算法
机器学习
语言模型
Multi Query Attention & Group Query Attention
随着
LLM
的大火,MQA所带来的收益得以放大。
transformer_WSZ
·
2023-09-14 06:13
nlp
MQA
Vision-CAIR/MiniGPT-4:使用先进的大型语言模型增强视觉-语言理解
近年来,大型语言模型(
LLM
)在自然语言处理(NLP)领域取得了令人瞩目的成就,但是它们在视觉-语言任务上的应用还有很多挑战。
senda66
·
2023-09-14 02:18
AI
语言模型
人工智能
深度学习
【AIGC】斯坦福小镇升级版——AI-Town源码解读
写在前面的话:接上一篇斯坦福小镇升级版——AI-Town搭建指南,本本篇将解读AI-Town使用的技术栈、代码架构、与
LLM
的交互,以及与斯坦福AI小镇的对比结果(如想直接看结论可跳到文章最后)整体架构技术栈
Smilence_lsy
·
2023-09-14 01:26
AIGC
游戏开发
AIGC
人工智能
AI小镇
typescript
AIGC:【
LLM
(八)】——Baichuan2技术报告
文章目录摘要1.引言2.预训练2.1预训练数据(Pre-trainingData)2.2架构(Architecture)2.3令牌化器(Tokenizer)2.3.1PositionalEmbeddings2.4激活和规范化(ActivationsandNormalizations)2.5优化(Optimizations)2.6规模定律(ScalingLaws)2.7基础设施(Infrastruc
J_Xiong0117
·
2023-09-13 23:03
LLMs
自然语言处理
前沿技术paper
AIGC
[ACL2023] Symbolic Chain-of-Thought Distillation: Small Models Can Also “Think” Step-by-Step
SymbolicChain-of-ThoughtDistillation:SmallModelsCanAlso“Think”Step-by-Step文章链接虽然CoT作为一种prompt形式在提高
LLM
ShadyPi
·
2023-09-13 18:04
自然语言处理
语言模型
自然语言处理
Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement
Self-Polish:EnhanceReasoninginLargeLanguageModelsviaProblemRefinement文章链接核心思想是通过instruction让
LLM
来优化问题本身
ShadyPi
·
2023-09-13 18:01
自然语言处理
语言模型
人工智能
自然语言处理
[NLP]
LLM
---扩充词表LLama2-构建中文tokenization
使用SentencePiece的除了从0开始训练大模型的土豪和大公司外,大部分应该都是使用其为当前开源的大模型扩充词表,比如为LLama扩充通用中文词表(通用中文词表,或者垂直领域词表)。那这部分工作有没有意义呢?或者说值不值得投入资源去做呢?先说自己的结论,有,以下两点的作用,第三点不确定:1.提高模型的编解码的效率,在LLaMa原来的词表上,一个汉字平均1.45个token,扩充后的Chine
舒克与贝克
·
2023-09-13 17:24
自然语言处理
人工智能
Orca
LLM
:模拟 ChatGPT 的推理过程
推荐:使用NSDT场景编辑器快速搭建3D应用场景介绍在大型语言模型(
LLM
)领域,人们一直在追求在不影响其效率的情况下增强小型模型的功能。
ygtu2018
·
2023-09-13 13:40
chatgpt
人工智能
深度学习
【精华】AI Agent:大模型改变世界的“钥匙”
文章目录1.Auto-GPT2.BabyAGI3.AgentGPT4.GodMode5.AITown6.ChatDev当前大模型的本质是大语言模型(LargeLanguageModel,
LLM
)。
LeeZhao@
·
2023-09-13 12:22
人工智能
AIGC
AI
Agent
如何评估大型语言模型
01对大型语言模型(
LLM
)的主客观评估在评估大型语言模型时,我们可以进行客观评估和主观评估。主观评估的方法是用户亲自尝试不同的模型,提出一些问题,然后根据自己的感受来判断哪个模型好,哪个模型不好。
叶锦鲤
·
2023-09-13 12:14
语言模型
人工智能
自然语言处理
AI文本创作在百度App发文的实践
作者|内容生态端团队导读大语言模型(
LLM
)指包含数百亿(或更多)参数的语言模型,这些模型通常在大规模数据集上进行训练,以提高其性能和泛化能力。
百度Geek说
·
2023-09-13 09:56
人工智能
百度
AI辅助创作
文心一言
智能生成文案
跟着LangChain参考文档搭建
LLM
+知识库问答系统
0.环境租用了1台GPU服务器,系统ubuntu20,TeslaV100-16GB(GPU服务器已经关机结束租赁了)SSH地址:*端口:17520SSH账户:root密码:Jaere7pa内网:3389,外网:17518VNC地址:*端口:17519VNC用户名:root密码:Jaere7pa硬件需求,ChatGLM-6B和ChatGLM2-6B相当。量化等级最低GPU显存FP16(无量化)13G
qq_27158179
·
2023-09-13 07:19
深度学习
Python
人工智能
LLM
01-引言
LLM
01-引言1.1什么是语言模型语言模型(LM)的经典定义是一种对令牌序列(token)的概率分布。假设我们有一个令牌集的词汇表VVV。
Gocara
·
2023-09-13 05:17
LLM
python
人工智能
nlp
语言模型
LLM
02-大模型的能力
LLM
02-大模型的能力我们将深入探讨GPT-3——这个具有代表性的大型语言模型的能力。
Gocara
·
2023-09-13 05:42
LLM
人工智能
语言模型
nlp
记录一次部署Hugo主题lotusdocs到Github Pages实践
目前已经部署好的主题:LabelConvert和Knowledge-QA-
LLM
Liekkas Kono
·
2023-09-13 03:47
杂项
Github
Pages
Hugo
【LangChain系列 7】Prompt模版——少样本prompt模版(一)
原文地址:【LangChain系列7】Prompt模版——少样本prompt模版(一)本文速读:prompt样本集合prompt样本选择器少样本模版的意思是:在prompt中包含一些样本,这样
LLM
就可以根据这些样本
大白爱爬山
·
2023-09-13 03:43
LangChain
langchain
prompt
人工智能
Generative AI 新世界 | 大模型参数高效微调和量化原理概述
本期文章,我们将探讨两个目前大语言模型(
LLM
)领域的开发者们都关注的热门话题:大型语言模型的高效微调和量化。微调大型语言模型允许开发者调整开源基础模型,从而提高特定领域任务的性能。
亚马逊云开发者
·
2023-09-13 01:58
人工智能
8个免费的AI和
LLM
游乐场
推荐:使用NSDT场景编辑器快速搭建3D应用场景在本文中,我们的目标是通过引入八个用户友好的平台来弥合这一差距,这些平台使任何人都可以免费测试和比较开源AI模型。此外,它们还提供多种更新型号,确保您及时了解最新进展。1.ChatbotArenaChatbotArena让您体验各种各样的模型,如Vicuna,Koala,RMKV-4-Raven,Alpaca,ChatGLM,LLaMA,Dolly,
ygtu2018
·
2023-09-12 21:50
人工智能
AI
大语言模型之八-提示工程(Prompt engineer)
LLM
中的prompt方法主要用于fine-tune阶段,即在预训练的基础上,针对特定任务的模板或提示语,这些提示语通常包含了问题的关键信息,例如问题类型、答案类型、限制条件等,通过少量的标注数据(提示语
shichaog
·
2023-09-12 16:10
神经网络&人工智能
语言模型
prompt
人工智能
From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting
本文是
LLM
系列的文章,针对《FromSparsetoDense:GPT-4SummarizationwithChainofDensityPrompting》的翻译。
UnknownBody
·
2023-09-12 13:40
LLM
语言模型
人工智能
LARGE LANGUAGE MODELS AS OPTIMIZERS
本文是
LLM
系列文章,针对《LARGELANGUAGEMODELSASOPTIMIZERS》的翻译。
UnknownBody
·
2023-09-12 13:39
LLM
语言模型
人工智能
机器学习
LangChain-Chatchat:基于LangChain和ChatGLM2-6B构建本地离线私有化知识库
LangChain-Chatchat:基于LangChain和ChatGLM2-6B构建本地离线私有化知识库一、前言二、介绍2.1、ChatGLM2-6B2.2、LangChain-Chatchat介绍三、模型支持3.1、
LLM
徊忆羽菲
·
2023-09-12 12:56
软件
langchain
AI文本创作在百度App发文的实践
作者|内容生态端团队导读大语言模型(
LLM
)指包含数百亿(或更多)参数的语言模型,这些模型通常在大规模数据集上进行训练,以提高其性能和泛化能力。
·
2023-09-12 10:56
人工智能百度
Falcon 180B 目前最强大的开源模型
TechnologyInnovationInstitute最近发布了Falcon180B大型语言模型(
LLM
),它击败了Llama-270b,与谷歌Bard的基础模型PaLM-2Large不相上下。
·
2023-09-12 10:25
Lost in the Middle: How Language Models Use Long Contexts
本文是
LLM
系列文章,针对《LostintheMiddle:HowLanguageModelsUseLongContexts》的翻译。
UnknownBody
·
2023-09-12 08:36
LLM
语言模型
人工智能
自然语言处理
开放域问答论文阅读-Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augme
最近,大型语言模型(
LLM
)(例如ChatGPT)在利用世界知识解决各种任务(包括知识密集型任务)方面表现出了令人印象深刻的能力。
无脑敲代码,bug漫天飞
·
2023-09-12 07:24
知识图谱
论文阅读
语言模型
人工智能
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
在图像-文本对上调整大语言模型(
LLM
)的指令已经实现了前所未有的视觉-语言多模态能力。然而,他们的视觉语言对齐仅建立在图像级别上,缺乏区域级别对齐限制了他们在细粒度多模态理解方面的进步。
Spielberg_1
·
2023-09-12 06:23
论文
语言模型
人工智能
自然语言处理
AIGC:【
LLM
(七)】——Baichuan2:真开源可商用的中文大模型
文章目录一.模型介绍二.模型部署2.1CPU部署2.2GPU部署三.模型推理3.1Chat模型推理3.2Base模型推理四.模型量化4.1量化方法4.2在线量化4.3离线量化4.4量化效果五.模型微调5.1依赖安装5.2单机训练5.3多机训练5.4轻量化微调一.模型介绍Baichuan2是百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练。其在多个权威的中文、英文和多语
J_Xiong0117
·
2023-09-12 06:46
LLMs
自然语言处理
AIGC
开源
AI大模型(
LLM
)、聊天机器人整理(持续更新)by pickmind
原文:https://blog.pickmind.xyz/article/3c87123f-d283-4a05-8e43-4ee8550cf22f目录:文章目录国内获批大模型国内大模型深渊图Open-sourceLargeLanguageModelsLeaderboard(国外)lmsys发布的大模型排行榜(国外)**OpenLLMLeaderboard(国外)******AlpacaEvalLe
itsc
·
2023-09-12 05:35
人工智能
机器人
LLM
AI
使用 FastGPT 构建高质量 AI 知识库
尤其在GPT-3.5接口全面开放后,大量的
LLM
应用如雨后春笋般涌现。然而,由于GPT的可控性、随机性和合规性等问题,很多应用场景都没
·
2023-09-11 23:36
云计算
大模型外挂知识库优化-大模型辅助向量召回
来自:NLP工作站进NLP群—>加入NLP交流群写在前面大模型时代,通常采用向量召回的方式从文档库里召回和用户问题相关的文档片段,输入到
LLM
中来增强模型回答质量。
zenRRan
·
2023-09-11 20:17
OPRO:利用
LLM
作为优化器,解决一系列用自然语言描述的任务
深度学习自然语言处理原创作者:Winnie前言Google的最新一项研究提出了OPRO优化方法(OptimizationbyPROmpting),它利用
LLM
作为优化器,解决一系列用自然语言描述的任务,
zenRRan
·
2023-09-11 20:17
万字长文: 检索增强
LLM
来自:AI思维单车ChatGPT的出现,让我们看到了大语言模型(LargeLanguageModel,
LLM
)在语言和代码理解、人类指令遵循、基本推理等多方面的能力,但幻觉问题Hallucinations
zenRRan
·
2023-09-11 20:47
人工智能
【面试题】2023知乎暑期实习算法实习生(
LLM
方向)面经
来源:投稿作者:LSC编辑:学姐1.自我介绍2.介绍操作系统的进程和线程,以及它们的区别3.C++深拷贝和浅拷贝的区别4.Python的列表和元组的区别5.Python的列表和元组是否可以做字典的键6.图像分类的流程7.图像分类的评价指标有哪些?Auc怎么计算?8.交叉熵损失函数的计算公式和计算过程9.编程题有一个无序的整数数组,从数组中可以任意选择两个不重复的数字,以这两个数字所在的位置,可以建
深度之眼
·
2023-09-11 20:59
粉丝的投稿
人工智能干货
深度学习干货
LLM
大模型
面试
Code Llama: Open Foundation Models for Code
本文是
LLM
系列文章,针对《CodeLlama:OpenFoundationModelsforCode》的翻译。
UnknownBody
·
2023-09-11 20:13
LLM
llama
人工智能
深度学习
Augmented Large Language Models with Parametric Knowledge Guiding
本文是
LLM
系列文章,针对《AugmentedLargeLanguageModelswithParametricKnowledgeGuiding》的翻译。
UnknownBody
·
2023-09-11 20:13
LLM
语言模型
人工智能
自然语言处理
How Language Model Hallucinations Can Snowball
本文是
LLM
系列文章,针对《HowLanguageModelHallucinationsCanSnowball》的翻译。语言模型幻觉是如何产生雪球的摘要1引言2为什么我们期待幻觉像滚雪球一样越滚越大?
UnknownBody
·
2023-09-11 19:42
LLM
语言模型
人工智能
自然语言处理
Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework
本文是
LLM
系列文章,针对《Verify-and-Edit:AKnowledge-EnhancedChain-of-ThoughtFramework》的翻译。
UnknownBody
·
2023-09-11 19:11
LLM
知识图谱
语言模型
人工智能
Flowise AI:用于构建
LLM
流的拖放UI
LangChain是一个框架/python库,可帮助您利用
LLM
构建自己的自定义NLP应用程序。Flowise使用LangChain作为其代理执行器,C
·
2023-09-11 18:55
llm
Chinese-LLaMA-Alpaca-2模型的测评
⚔️模型竞技场:http://
llm
-arena.ymcui.com系统对战胜率(无平局)↓Elo评分Chinese-
柴神
·
2023-09-11 18:36
GPT
ChatGLM
AI心理学
llama
使用
LLM
在移动设备上实现对话交互
推荐:使用NSDT场景编辑器助你快速搭建可编辑的3D应用场景移动设备上的智能助手具有非常先进的基于语言的交互,用于执行简单的日常任务,例如设置计时器或打开手电筒。尽管取得了进展,但这些助手在支持移动用户界面(UI)中的对话交互方面仍然面临限制,其中执行了许多用户任务。例如,他们无法回答用户关于屏幕上显示的特定信息的问题。代理需要对图形用户界面(GUI)来实现此类功能。先前的研究已经调查了几个重要的
·
2023-09-11 18:24
llm
上一页
83
84
85
86
87
88
89
90
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他