E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
gpt-3
AI大模型知识图谱和学习路线!
一、大模型全套的学习路线学习大型人工智能模型,如
GPT-3
、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。
hhaiming_
·
2025-03-03 22:35
人工智能
知识图谱
学习
自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用
OpenAI旗下的GPT系列模型(如
GPT-3
、GPT-3.5、GPT-4等)在生成文本方面拥有强大的表现。它们不仅能进行语言生成,也可用于诸多NLP任务,包括文本摘要和情感分析。
山海青风
·
2025-03-02 05:29
人工智能
gpt
自然语言处理
python
【大模型】大模型分类
以下是大模型的常见分类方式:1.按应用领域分类自然语言处理(NLP)模型如
GPT-3
、BERT、T5等,主要用于文本生成、翻译、问答等任务。
IT古董
·
2025-03-01 16:29
人工智能
人工智能
大模型
使用 Weaviate 执行 RAG (Retriever-Augmented Generation)
技术背景介绍RAG技术结合了检索式模型(例如Weaviate)和生成式模型(例如OpenAI的
GPT-3
),能够在大量数据中快速找到相关信
bavDHAUO
·
2025-02-28 04:28
python
在 Ubuntu 22.04 上搭建 Dify 应用的完整指南
Dify是一款开源的AI应用开发平台,支持快速构建基于大语言模型(如
GPT-3
、ChatGLM等)的应用。本教程将详细演示如何在Ubuntu22.04系统上部署Dify。
jdfklaakjsdf
·
2025-02-27 23:16
AIGC
ubuntu
linux
运维
微调 LLM (RLHF + DPO)
一、
GPT-3
与InstructGPT2020年,OpenAI发布了
GPT-3
,这是一种大型语言模型(LLM),只需查看几个示例即可执行任意自然语言处理(NLP)任务。
·
2025-02-27 21:56
人工智能
RAG技术全面解析:从原理到实践中的20个关键问题
与传统生成模型的对比维度传统生成模型(如
GPT-3
)
大F的智能小课
·
2025-02-26 12:47
大模型理论和实战
人工智能
深度学习
算法
语言模型
GPT-2源码实现及
GPT-3
、GPT-3.5、GPT-4及GPT-5内幕解析(二)
GPT-2源码实现及
GPT-3
、GPT-3.5、GPT-4及GPT-5内幕解析(二)Gavin大咖微信:NLP_Matrix_Space5.2GPT-2源码实现逐行解析本节讲解GPT-2源码,gpt2.
段智华
·
2025-02-25 09:35
深入理解
ChatGPT
ChatGPT国内
OpenAI
GPT-3
GPT-4
用人类反馈微调大模型,InstructGPT 让
GPT-3
脱胎换骨
用人类反馈微调大模型,InstructGPT让
GPT-3
脱胎换骨本文展示了一种通过利用人类反馈进行微调,使大语言模型在广泛任务中契合用户意图的方法。
·
2025-02-24 23:50
人工智能
DeepSeek混合精度训练核心技术解析与实践指南
,在保证模型精度的前提下实现:40-60%显存占用降低(ResNet50案例:从7.8GB降至4.2GB)1.5-3倍训练速度提升(BERT-Large案例:从8h缩短至5h)突破大模型训练显存瓶颈(
GPT
燃灯工作室
·
2025-02-24 15:33
Deepseek
数据挖掘
语音识别
计算机视觉
目标检测
机器学习
人工智能
【大模型】数据集构造方式
它基于Self-Instruct方法,即使用更强大的模型(如OpenAI的
GPT-3
)来自动生成高质量的指令数据,从而让小型模型也能理解和执行指令任务。
油泼辣子多加
·
2025-02-18 22:02
深度学习
人工智能
chatgpt
AI 大模型创业:如何利用市场优势?
大模型是指在特定领域中应用广泛、参数量巨大的神经网络模型,如BERT、
GPT-3
、DALL-E等。
SuperAGI2025
·
2025-02-16 12:37
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大语言模型原理基础与前沿 通过稀疏MoE扩展视觉语言模型
大语言模型(LargeLanguageModels,LLMs)如
GPT-3
、BERT等,已经在自然语言处理(NLP)任务中取得了显著的成果。
AI天才研究院
·
2025-02-14 12:52
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如Llama2、
GPT
热爱分享的博士僧
·
2025-02-11 18:36
架构
大模型Dense、MoE 与 Hybrid-MoE 架构的比较
GPT-3
、BERT、LLAMAMoE将模型划分为多个“
灵机️
·
2025-02-06 14:00
人工智能
深度学习
架构
人工智能
彻底颠覆!DeepSeek-R1横空出世,直接碾压OpenAI!
它的GPT系列产品,从
GPT-3
到GPT-4Turbo,每一次更新都能引起全球的关注,无论是内容创作、智能客服还是科学研究,OpenAI的技术都发挥着重要作用。
盼达思文体科创
·
2025-02-05 15:45
经验分享
Mixture of Experts(MoE)学习笔记
1学习动机第一次了解到MoE(Mixtureofexperts),是在GPT-4模型架构泄漏事件,听说GPT-4的架构是8个
GPT-3
级别大小的模型以MoE架构(8*220B)组合成一个万亿参数级别的模型
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
基于深度学习的大规模模型训练
任务复杂性:处理复杂任务(如
GPT-3
、BE
SEU-WYL
·
2025-02-01 07:56
深度学习dnn
深度学习
人工智能
dnn
《解码AI大模型涌现能力:从量变到质变的智能跃迁》
以
GPT-3
为例,它的训练数据涵盖了海量的
·
2025-01-31 00:42
人工智能深度学习
chatGPT底层原理是什么,为什么chatGPT效果这么好?三万字长文深度剖析-下
最终它是一个巨大的神经网络——目前是一个所谓的
GPT-3
网络版
会写代码的孙悟空
·
2025-01-27 17:34
大模型从入门到放弃
chatgpt
算法
人工智能
深度学习
机器学习
大语言模型原理与工程实践:预训练数据构建
诸如
GPT-3
、BERT等模型在各种任务中表现出色,从文本生成到情感分析,再到机器翻译,几乎无所不能。这些模型的成功很大程度上依赖于预训练数据的质量和规模。
AI大模型应用之禅
·
2025-01-23 06:38
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
文心一言 vs gpt-4 全面横向比较
GPT-3.5是OpenAI公司的上一代大模型,比
GPT-3
更智能一些。而GPT-4作为其升级版,大家预计它会有更大的模型参数量,更强的学习和推理能力,可能会在各种语言任务上实现更大突破。
周盛欢
·
2025-01-18 18:54
文心一言
全新 Hopper 架构的Transformer 引擎有什么特点?
Transformer模型是当今广泛使用的语言模型(例如asBERT和
GPT-3
)的支柱。
扫地的小何尚
·
2025-01-18 17:50
人工智能
通过 Azure OpenAI 服务使用 GPT-35-Turbo and GPT-4(win版)
通过AzureOpenAI,开发者和企业可以访问OpenAI的各种模型,如
GPT-3
、Codex和DALL-E等,并将其集成到自己的应用程序和服务中。
小霖同学onism
·
2024-09-14 05:29
Multi-agent
azure
gpt-3
flask
详述Python环境下配置AI大模型Qwen-72B的步骤
请注意:由于Qwen-72B这一模型目前并未公开存在,所以以下内容仅为假设性描述,实际上你需要替换为你想要配置的真实存在的大模型,例如
GPT-3
、BERT等。
Play_Sai
·
2024-09-12 05:57
#
Python开发
python
AI大模型
人工智能
洞悉LangChain:LangChain工程化设计,从API到智能Agent的全面探索
这些大型语言模型,如
GPT-3
汀、人工智能
·
2024-09-11 19:16
AI
Agent
LLM技术汇总
langchain
人工智能
自然语言处理
大模型
Agent
LangGraph
AI
Agent
100天精通Python丨黑科技篇 —— 21、大语言模型_100天精通python快速入门到黑科技
ChatGPT是OpenAI推出的一种基于
GPT-3
/4的聊天机器人。
前端收割机
·
2024-09-11 14:13
程序员
python
科技
语言模型
一口气了解大模型相关通识,基础笔记!
一、大模型生态有哪些语言类大模型:
GPT-3
、GPT-3.5、GPT-4系列模型。
AI小白熊
·
2024-09-10 08:15
笔记
数据库
架构
面试
职场和发展
transformer
ai
Chat Gpt我们自己造出的“外星人”
最近都在谈论ChatGpt,正好我在书店看书时,再次读到《人类简史》,看到他的序言是这么写的:这段文字看起来,语句通顺、逻辑合理对吧,这就是
GPT-3
写的,他和ChatGpt有共同的底层技术,只是运用侧重不一样
蔡昱
·
2024-09-09 01:02
【LLM大模型】24年最新大语言模型新书!这本LLM大模型黑书你一定要学(附PDF)
今天给大家推荐一本丹尼斯·罗斯曼(DenisRothman)编写的关于大语言模型(LLM)权威教程基于
GPT-3
、ChatGPT、GPT-4等Transformer架构的自然语言处理>!
会AIGC的小孩
·
2024-09-07 01:01
语言模型
pdf
人工智能
大数据
大模型
自然语言处理
ui
DALL-E 2: 重新定义图像生成的人工智能
一、DALL-E2简介DALL-E2是OpenAI开发的一种基于
GPT-3
架构的生成模型
-龙川-
·
2024-09-05 05:35
推荐
介绍
学习笔记
dall·e
2
GPT 模型简史:从 GPT-1 到 GPT-4
文章目录GPT-1GPT-2GPT-3从
GPT-3
到InstructGPTGPT-3.5、Codex和ChatGPTGPT-4GPT-1 2018年年中,就在Transformer架构诞生⼀年后,
三月七꧁ ꧂
·
2024-09-03 19:04
大模型开发
gpt
人工智能
自然语言处理
语言模型
transformer
gpt-3
prompt
GPT-3
:一个新应用生态系统诞生了
「某个应用程序用2个基于
GPT-3
的机器人相互辩论。这是YouTube用户BakzT.Future剖析的14个
GPT-3
应用程序之一。」
派派AI学院
·
2024-09-02 09:34
【小白教学】一文教你如何使用文心一言、ChatGPT指令
近年来,随着人工智能技术的迅速发展,大语言模型如
GPT-3
、BERT等逐渐成为AI研究和应用的热点。而在中国,百度推出的文心一言(ERNIEBot)也逐渐崭露头角,成为众多开发者关注的焦点。
斯克AI
·
2024-09-01 14:04
文心一言
chatgpt
prompt
大模型是如何炼成的:揭秘深度学习训练的秘密与优化技巧
从
GPT-3
到BERT,这些大型预训练模型在各种任务上展现出了惊人的能力。那么,这些大模型是如何训练出来的呢?
AI大模型_学习君
·
2024-08-30 19:25
深度学习
人工智能
大模型训练
ai大模型
LLM
大语言模型
大模型应用
全能型模型与专精型模型
例如,
GPT-3
和GPT-4等大型语言模型可以进行文本生成、翻译、对话和问答等多种功能。这类模型的优势在于:1.灵活性:全能型模型可以在多种应用场景中使用,适应性强。
青空之蓝qk
·
2024-08-29 09:10
人工智能
python
一起来聊聊大模型的token
文章目录前言一、token是什么二、常用分词方法三、
GPT-3
的分词方式1.代码示例2.
做个天秤座的程序猿
·
2024-08-23 00:46
token
大模型token
gpt
大型语言模型RAG(检索增强生成):检索技术的应用与挑战
随着大型预训练语言模型(LLMs)如
GPT-3
和BERT的出现,自然语言处理(NLP)领域取得了显著进展。然而,这些模型在处理知识密集型任务时仍存在局限性,特别是在需要最新或特定领域知识的情况下
in_tsz
·
2024-03-17 15:22
语言模型
人工智能
自然语言处理
借助ChatGPT提高编程效率指南
ChatGPT是一种基于
GPT-3
AI臻蚌
·
2024-03-13 16:40
chatgpt
chatgpt
人工智能
微软宣布 Power Fx 开源!
今年5月,微软通过与OpenAI的
GPT-3
模型的集成进一步提升了语言能力,PowerFx可以使用自然语言代替复杂的公式进行计算。
老率的IT私房菜
·
2024-02-20 21:09
Bert基础(一)--transformer概览
它不单替代了以前流行的循环神经网络(recurrentneuralnetwork,RNN)和长短期记忆(longshort-termmemory,LSTM)网络,并且以它为基础衍生出了诸如BERT、
GPT
Andy_shenzl
·
2024-02-20 14:22
Deep
Learing
&
pytorch
NLP
bert
transformer
人工智能
Prompt Engineering 提示工程教程详情
它涉及到创建和优化提示(prompts),以便从大型语言模型(如
GPT-3
)中获得高质量和目标导向的输出。在本教程中,我们将详细介绍提示工程的基本概念、实践方法和一些高级技巧。
沐知全栈开发
·
2024-02-20 11:33
prompt
人工智能
Prompt Engineering 高级提示工程技巧
它涉及到创建和优化提示(prompts),以便从大型语言模型(如
GPT-3
)中获得高质量和目标导向的输出。在本教程中,我们将详细介绍一些高级提示工程技巧,帮助您更有效地利用大型语言模型。
沐知全栈开发
·
2024-02-20 11:33
prompt
人工智能
机器学习
【翻译】
GPT-3
架构,简述于“餐巾纸”上
这是一篇技术派文章,尤其是其中的绘制于“餐巾纸”上的手绘图,从数学角度对于大语言模型的架构给你一些新的启发。原文链接:https://dugas.ch/artificial_curiosity/GPT_architecture.html作者:DanielDugas翻译/编辑:liyane使用LLMChatAPI翻译;为了方便对照,把英文原文也对应在每段中文翻译之下。现在马上跟随作者开始一次开心的旅
liyane
·
2024-02-20 10:17
AI人工智能
gpt-3
【AIGC】大语言模型
常见的LLM包括
GPT-3
、PaLM、Gala
AIGCExplore
·
2024-02-20 02:57
AIGC
AIGC
语言模型
人工智能
NLP_GPT到ChatGPT
文章目录介绍小结介绍从初代GPT到
GPT-3
,主要经历了下面几个关键时刻。GPT:2018年,OpenAl发布了这款基于Transformer架构的预训练语言模型,其参数数量为1.17亿(117M)。
you_are_my_sunshine*
·
2024-02-15 09:39
NLP
大模型
自然语言处理
gpt
chatgpt
如何使用Hugging Face:对Transformer和pipelines的介绍
一、transformer介绍众所周知,transformer模型(如
GPT-3
、LLaMa和ChatGPT)已经彻底改变了人工智能领域。
第欧根尼的酒桶
·
2024-02-15 08:10
transformer
深度学习
人工智能
大模型基础知识
主流的开源模型体系GPT(GenerativePre-trainedTransformer)系列:由OpenAI发布的一系列基于Transformer架构的语言模型,包括GPT、GPT-2、
GPT-3
等
lichunericli
·
2024-02-13 13:46
LLM
人工智能
语言模型
GPT3是否是强人工智能?
今天和大家分享一下AI方向自然语言处理(NLP)领域内一个新的语言模型:
GPT-3
。
枯木嫩芽
·
2024-02-13 00:28
ChatGPT的背后原理:大模型、注意力机制、强化学习
微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩本文主要介绍为ChatGPT提供动力的机器学习模型,将从大型语言模型的介绍开始,深入探讨使
GPT-3
得到训练的革命性的自注意机制,然后深入到从人类反馈强化学习
Python学研大本营
·
2024-02-12 23:17
chatgpt
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他