E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
2023年排行前五的大规模语言模型(
LLM
)
2023年排行前五的大规模语言模型(
LLM
)截至2023年,人工智能正在风靡全球。它已经成为热门的讨论话题,吸引了数百万人的关注,不仅限于技术专家和研究人员,还包括来自不同背景的个人。
翼达口香糖
·
2023-08-18 11:03
语言模型
人工智能
自然语言处理
选择大型语言模型自定义技术
自定义
LLM
使企业能够在特定的行业或组织环境中更高效,更准确地生成和理解文本。
ygtu2018
·
2023-08-18 11:03
语言模型
人工智能
大数据
建筑工地的水泥分配和料场选址问题(Cplex求解线性规划模型+粒子群搜索算法)【Java实现】
个料场向第j个工地运送的水泥吨数,其中1≪i≪m;1≪j≪n其中xij的取值范围是[0,dj],即供给工地的吨数要小于等于工地的需求量x_{ij}:第i个料场向第j个工地运送的水泥吨数,其中1\lli\
llm
Hello Dam
·
2023-08-18 08:19
智能优化算法
java
开发语言
Cplex
粒子群算法
PSO
LangChain手记 Agent 智能体
整理并翻译自DeepLearning.AI×LangChain的官方课程:Agent(源代码可见)“人们有时会将
LLM
看作是知识库,因为它被训练所以记住了来自互联网或其他地方的海量信息,因而当你向它提问时
从流域到海域
·
2023-08-18 04:27
大语言模型
langchain
人工智能
LangChain手记 Evalutation评估
整理并翻译自DeepLearning.AI×LangChain的官方课程:Evaluation(源代码可见)基于
LLM
的应用如何做评估是一个难点,本节介绍了一些思路和工具。
从流域到海域
·
2023-08-18 04:26
大语言模型
langchain
人工智能
自然语言处理从入门到应用——LangChain:索引(Indexes)-[基础知识]
分类目录:《自然语言处理从入门到应用》总目录索引(Indexes)是指为了使
LLM
与文档更好地进行交互而对其进行结构化的方式。
von Neumann
·
2023-08-18 03:53
自然语言处理从入门到应用
人工智能
深度学习
自然语言处理
langchain
Indexes
LLM
应用参考架构:ArchGuard Co-mate 实践示例
随着,对于
LLM
应用于架构领域探索的进一步深入,以及ArchGuardCo-mate开发进入深入区,我们发现越来越多的通用模式。
Phodal
·
2023-08-17 23:29
架构
LLM
回答更加准确的秘密:为检索增强生成(RAG)添加引用源
RAG,也就是检索增强生成(Retrieval-augmentedgeneration),可以弥补现有
LLM
应用能力的技术。当前,
LLM
的最大问题就是缺乏最新的知识和特定领域的知识。
Zilliz Planet
·
2023-08-17 19:10
程序人生
LLM
回答更加准确的秘密:为检索增强生成(RAG)添加引用源
RAG,也就是检索增强生成(Retrieval-augmentedgeneration),可以弥补现有
LLM
应用能力的技术。当前,
LLM
的最大问题就是缺乏最新的知识和特定领域的知识。
·
2023-08-17 18:26
人工智能
LoRAHub:Efficient Cross-Task Generalization Dynamic LORA via dynamic LoRA Composition
EfficientCross-TaskGeneralizationDynamicLORAviadynamicLoRACompositionIntroductionMethod试验结果参考Introduction在微调模型后,
LLM
HanZee
·
2023-08-17 06:25
深度学习
人工智能
机器学习
语言模型
搭建个人专属的API中转站,解决本地OpenAI接口调用困扰
今天仅仅只是站在开发者学习交流的角度来介绍一下,我们在日常开发基于
LLM
的AI应用时遇到的各种瓶颈,毕竟开发出一个优质的应用,舒适的环境和体验还是比较重要的。话不多说,进入正题。
技术狂潮AI
·
2023-08-17 05:35
AI编程实战
人工智能
Falcon 7B与LangChain:构建具备对话记忆的智能聊天机器人
通过检测
LLM
开始"胡言乱语"的时候,并停止生成,我们可以避免生成无意义或混乱的回复。这样可以提高聊天机器人的可读性和可理解性。其次,我们将讨论清理输出的方法。有时候,LL
技术狂潮AI
·
2023-08-17 05:35
AI应用实战
LLM应用实战
langchain
机器人
什么是
LLM
大语言模型?
什么是
LLM
大语言模型?大语言模型(英文:LargeLanguageModel,缩写
LLM
),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。
氢气氧气氮气
·
2023-08-17 04:32
科普性文章
语言模型
人工智能
自然语言处理
Progressive-Hint Prompting Improves Reasoning in Large Language Models
本文是
LLM
系列的文章,针对《Progressive-HintPromptingImprovesReasoninginLargeLanguageModels》的翻译。
UnknownBody
·
2023-08-17 04:59
LLM
Prompt
Learning
语言模型
自然语言处理
[AI医学]
llm
-medical-data:用于大模型微调训练的医疗数据集
关键词:医疗数据集,大模型微调训练开源项目:
llm
-medical-data用于大模型微调训练的医疗数据集项目地址:https://github.com/donote/
llm
-medical-data该项目主要参考了几篇关于医学领域大模型的论文或项目中的医疗大模型微调项目
晨阳2023
·
2023-08-17 00:37
人工智能
NPCon:AI模型技术与应用峰会北京站 (参会感受)
这次会议邀请了很多技术大咖,他们围绕:六大论点大模型涌现,如何部署训练架构与算力芯片
LLM
应用技术栈与Agent全景解析视觉GPU推理服务部署架构优化实践AI大模型算力系统分析InsCodeAI时代的研发新范式与开发者能力演进
学习新鲜事物
·
2023-08-16 21:22
人工智能
张俊林:由ChatGPT反思大语言模型(
LLM
)的技术精要
惊喜是因为没想到大型语言模型(
LLM
,LargeLanguageModel)效果能好成这样;惊醒是顿悟到我们对
LLM
的认知及发展理念,距离世界最先进的想法,差得有点远。
WitsMakeMen
·
2023-08-16 19:00
大模型
LLM
关于
LLM
和图数据库、知识图谱的那些事
本文整理自NebulaGraph布道师wey在「夜谈
LLM
」主题分享上的演讲,主要包括以下内容:背景LLMRAGGraph知识抽取Text2CypherGraphRAG未来规划技术背景
LLM
是什么这里简单
·
2023-08-16 16:09
nebula知识图谱图数据库
LangChain手记 Question Answer 问答系统
DeepLearning.AI×LangChain的官方课程:QuestionAnswer(源代码可见)本节介绍使用LangChian构建文档上的问答系统,可以实现给定一个PDF文档,询问关于文档上出现过的某个信息点,
LLM
从流域到海域
·
2023-08-16 15:49
大语言模型
langchain
大语言模型
LLM
的一些点
LLM
发展史GPT模型是一种自然语言处理模型,使用Transformer来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。
远洋号
·
2023-08-16 14:29
语言模型
人工智能
自然语言处理
LLM
中的微调演变
目录微调演变InstructGPT的训练微调演变首先是任务驱动了微调的发展,GPT1和BERT遵循经典的预训练+微调范式,到GPT3时期,预训练任务表现为句子接龙,给定前文持续预测下一个word,当模型参数规模和训练数据增大后,GPT3面对fewshot甚至是zeroshot任务的表现都超越了原本的SOTA方法。下面是几个关于zeroshot,fewshot,经典微调的例子(以机器翻译问题为例):
tzc_fly
·
2023-08-16 13:01
生成式AI
人工智能
语言模型
gpt
2023+HuggingGPT: Solving AI Tasks with ChatGPT and itsFriends in Hugging Face
摘要:语言是
llm
(例如ChatGPT)连接众多AI模型(例如hugsFace)的接口,用于解决复杂的AI任务。在这个概念中,llms作为一个控制器,管理和组织专家模型的合作。
神符编辑
·
2023-08-16 12:47
AI
agent
论文
LLM
人工智能
把LangChain跑起来的3个方法 | 京东云技术团队
使用LangChain开发
LLM
应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习
LLM
模型的应用,对Langchain进行快速上手?
·
2023-08-16 12:11
人工智能
LLM
模型:奖励模型的训练、PPO 强化学习的训练、RLHF
人工智能
LLM
模型:奖励模型的训练、PPO强化学习的训练、RLHF1.奖励模型的训练1.1大语言模型中奖励模型的概念在大语言模型完成SFT监督微调后,下一阶段是构建一个奖励模型来对问答对作出得分评价。
·
2023-08-16 10:07
独家 | 开始使用LangChain:帮助你构建
LLM
驱动应用的新手教程
尽管你可能没有足够的资金和计算资源在你的地下室从头开始训练一个
LLM
,但你仍然可以使用预先训练的LLMs来构建一些很酷的东西,例如
数据派THU
·
2023-08-16 10:12
langchain
【LangChain】Memory
概要大多数
LLM
应用都有对话界面。对话的一个重要组成部分是能够引用对话中先前介绍的信息。至少,对话系统应该能够直接访问过去消息的某些窗口。
山鬼谣me
·
2023-08-16 10:38
LangChain
AI
langchain
memory
了解 Langchain️是个啥?:第 1 部分
如果我们想在OpenAI或拥抱脸的帮助下创建一个
LLM
应用程序,那么以前,我们想手动完成。出于同样的目的,我们有两个最著名的库,Haystack和LangChain,它们
无水先生
·
2023-08-16 10:08
LLM
人工智能
LangChain入门:构建
LLM
驱动的应用程序的初学者指南
LangChain&DemoGPT一、介绍你有没有想过如何使用大型语言模型(
LLM
)构建强大的应用程序?或者,也许您正在寻找一种简化的方式来开发这些应用程序?那么你来对地方了!
无水先生
·
2023-08-16 10:08
LLM
前端
javascript
开发语言
云原生 AI 工程化实践之 FasterTransformer 加速
LLM
推理
作者:颜廷帅(瀚廷)01背景OpenAI在3月15日发布了备受瞩目的GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。然而,当我们享受着大语言模型带来的普惠AI能力时,它也给开发者们带来了前所未
阿里云云原生
·
2023-08-16 09:12
云原生
人工智能
阿里云
容器
SEED-Bench: Benchmarking Multimodal LLMs with Generative Comprehension
本文是
LLM
相关的文章,针对《SEED-Bench:BenchmarkingMultimodalLLMswithGenerativeComprehension》的翻译。
UnknownBody
·
2023-08-16 04:18
LLM
人工智能
自然语言处理
语言模型
RETROFORMER: RETROSPECTIVE LARGE LANGUAGE AGENTS WITH POLICY GRADIENT OPTIMIZATION
本文是
LLM
系列文章,针对《RETROFORMER:RETROSPECTIVELARGELANGUAGEAGENTSWITHPOLICYGRADIENTOPTIMIZATION》的翻译。
UnknownBody
·
2023-08-16 04:18
LLM
综述文章
人工智能
算法
深度学习
Automatically Correcting Large Language Models
自动更正大型语言模型:综述各种自我更正策略的前景摘要1引言2自动反馈校正
LLM
的分类2.12.22.32.42.52.62.73训练时间校正4生成时间校正5
UnknownBody
·
2023-08-16 04:17
LLM
综述文章
语言模型
人工智能
自然语言处理
ChatGPT小型平替之ChatGLM-6B本地化部署、接入本地知识库体验 | 京东云技术团队
本文期望通过本地化部署一个基于
LLM
模型的应用,能让大家对构建一个完整的应用有一个基本认知。
·
2023-08-16 00:37
大模型(大型语言模型,
LLM
)
大型语言模型,也称为“大规模语言模型”,是指旨在处理和理解人类语言的人工智能(AI)模型。这些模型是更广泛的自然语言处理(NLP)领域的一部分,能够执行各种与语言相关的任务,例如文本生成、翻译、情感分析、语言理解、问答等。最突出、最知名的大语言模型是OpenAI的GPT(GenerativePre-trainedTransformer)系列。GPT-3是“GenerativePre-trained
云大卫
·
2023-08-16 00:44
大语言模型
语言模型
LLM
大语言模型-MOSS解读
LLM
大语言模型-MOSS解读
田小成plus
·
2023-08-16 00:44
LLM大模型
深度学习
语言模型
人工智能
自然语言处理
MOSS
ChatGPT
大语言模型
LLM
的一些点
LLM
发展史GPT模型是一种自然语言处理模型,使用Transformer来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。
超人汪小建(seaboat)
·
2023-08-16 00:14
LLM
大模型
语言模型
人工智能
自然语言处理
大模型
LLM
[NLP]
LLM
训练时GPU显存耗用量估计
以
LLM
中最常见的Adam+fp16混合精度训练为例,分析其显存占用有以下四个部分:GPT-2含有1.5B个参数,如果用fp16格式,只需要1.5G*2Byte=3GB显存,但是模型状态实际上需要耗费1.5B
奇思闻影的舒克与贝克
·
2023-08-15 20:19
自然语言处理
人工智能
云原生 AI 工程化实践之 FasterTransformer 加速
LLM
推理
01背景OpenAI在3月15日发布了备受瞩目的GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。然而,当我们享受着大语言模型带来的普惠AI能力时,它也给开发者们带来了前所未有的挑战。随着模型不
·
2023-08-15 19:50
云原生ack云计算阿里云
云原生 AI 工程化实践之 FasterTransformer 加速
LLM
推理
作者:颜廷帅(瀚廷)01背景OpenAI在3月15日发布了备受瞩目的GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。然而,当我们享受着大语言模型带来的普惠AI能力时,它也给开发者们带来了前所未
·
2023-08-15 19:36
阿里云云原生人工智能
云原生 AI 工程化实践之 FasterTransformer 加速
LLM
推理
作者:颜廷帅(瀚廷)01背景OpenAI在3月15日发布了备受瞩目的GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋般出现,为我们带来了协同办公、客服对话、语言翻译、内容生成等方面前所未有的畅快体验。然而,当我们享受着大语言模型带来的普惠AI能力时,它也给开发者们带来了前所未
·
2023-08-15 18:35
阿里云云原生人工智能
落地大模型应知必会(3): 如何构建多任务的
LLM
应用
编者按:今年以来,大语言模型(
LLM
)已被广泛应用于各种自然语言处理任务,也越来越多地被用于构建复杂的语言应用。但是构建多任务的
LLM
应用仍面临一定的挑战,需要解决任务组合和调控等问题。
·
2023-08-15 16:31
4个简化IT服务台任务的ChatGPT功能
什么是ChatGPT和
LLM
?ChatGPT是由OpenAI开发的一种机器学习模型,它使用基于生成式预训练转换器(GPT)架构的大型语言模型(
LLM
)。ChatGPT经过来自互联网的大量数据
·
2023-08-15 16:42
运维人工智能
聊聊大语言模型(
LLM
)的 10 个实际应用
大语言模型(LargeLanguageModel,简称
LLM
)是一种利用深度学习技术,根据大量的文本数据,学习语言的规律和知识,从而能够生成自然和流畅的文本的模型。大
·
2023-08-15 16:55
算法数据挖掘自然语言处理
LLM
的Tokenizer
大型语言模型的tokenizer是通过在大规模文本数据上进行训练和学习得到的。下面是一般的tokenizer训练过程:数据收集:收集大量的文本数据来作为训练数据。这些数据可以来自各种来源,如互联网、书籍、新闻文章等。重要的是要确保数据的多样性和代表性,以便模型可以学习到广泛的语言结构和用法。数据预处理:对收集到的文本数据进行预处理。这包括去除特殊字符、标点符号、HTML标签、URL等,以及进行标准
Zain Lau
·
2023-08-15 14:24
人工智能
机器学习
深度学习
麦肯锡发布《2023科技趋势展望报告》,生成式AI、下一代软件开发成为趋势,软件测试如何贴合趋势?
OpenAI、谷歌、微软、Meta等都在大力投资大型语言模型技术
LLM
的研发,推动模型的不断创新和改进。与以往的人工智能不同,生成式AI的核心技术——基础模型,可
龙测科技
·
2023-08-15 13:16
科技
AIGC热潮涌动 HashData如何降低大模型应用门槛?
当前,以ChatGPT为代表的大语言模型(
LLM
)正在掀起新一轮的AI浪潮,数字产业生态也迎来前所未有的变局。随着大模型应用的兴起,如何低成本地实现大模型的构建和应用,成为企业关注的重点。
HashData酷克数据
·
2023-08-15 12:00
AIGC
云原生
数据仓库
LangChain手记 Chains
整理并翻译自DeepLearning.AI×LangChain的官方课程:Chains(源代码可见)Chains直译链,表达的意思更像是对话链,对话链的背后是思维链LLMChain(
LLM
链)首先介绍了一个最简单的例子
从流域到海域
·
2023-08-15 08:09
langchain
人工智能
EasyLLM:简化语言模型处理,实现 OpenAI 和 Hugging Face 客户端的无缝切换
前言在这短短不到一年的时间里,国内外涌现的大型语言模型(
LLM
)可谓是百花齐放,不管是开源还是闭源都出现了一些非常优秀的模型,然而在利用
LLM
进行应用开发的时候,会发现每个模型从部署、到训练、微调、API
技术狂潮AI
·
2023-08-15 08:31
LLM应用实战
AI编程实战
语言模型
microsoft
windows
通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属
LLM
应用
我们可以通过使用AmazonSageMakerJumpStart快速部署Llama2模型,并且结合开源UI工具Gradio打造专属
LLM
应用。
亚马逊云开发者
·
2023-08-15 03:58
llama
LLM
- Transformer && LLaMA2 结构分析与 LoRA 详解
目录一.引言二.图说
LLM
1.Transformer结构◆Input、OutputEmbedding◆PositionEmbedding◆Multi-Head-Attention◆ADD&Norm◆FeedForward
BIT_666
·
2023-08-14 20:38
LLM
深度学习
人工智能
LLM
Transformers
上一页
90
91
92
93
94
95
96
97
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他