E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
chatglm2
[DeepSpeed]RuntimeError: output tensor must have the same type as input tensor
最近在跑
chatglm2
的sft的时候出现了下面的错误,我的运行方式是bf16,deepspeedzero3,因为担心fp16会有很多的nan.File"/home/suser/.conda/envs/
农民小飞侠
·
2023-10-02 10:39
deepspeed
深度学习实战54-基于
ChatGLM2
大模型构建智能自助用药问答系统与药物智能管理实战的应用
大家好,我是微学AI,今天给大家介绍一下深度学习实战54-基于
ChatGLM2
大模型构建智能自助用药问答系统与药物智能管理实战的应用。随着人工智能技术的发展,我们的生活在许多方面都得到了改善。
微学AI
·
2023-09-28 15:38
人工智能结合医疗
深度学习实战(进阶)
深度学习
人工智能
ChatGLM2-6B
QLoRa
微调
药物管理
LLaMA Efficient Tuning 主流大模型的高效工具【预训练+指令监督微调】
LLaMAEfficientTuning的简介2023年6月发布的LLaMAEfficientTuning,它是一款可高效微调【全参数/LoRA/QLoRA】主流大模型【
ChatGLM2
/LLaMA2/
张志翔的博客
·
2023-09-26 19:59
ChatGLM实战教程
人工智能
机器学习
语言模型
深度学习
ChatGLM2-6B微调实践
6Bhttps://github.com/hiyouga/ChatGLM-Efficient-Tuninghttps://github.com/hiyouga/LLaMA-Efficient-Tuning第一个是
ChatGLM2
weixin_43870390
·
2023-09-26 12:49
chatgpt
FastChat 大模型部署推理;Baichuan2-13B-Chat测试、chatglm2-6b测试
/
chatglm2
loong_XL
·
2023-09-24 09:11
深度学习
大模型部署
太强了开源的AI工具APP,AIdea -支持 AI聊天、协作、图片生成
一款集成了主流大语言模型以及绘图模型的APP,采用Flutter开发,代码完全开源,支持以下功能:支持GPT-3.5/4问答聊天支持国产模型:通义千问,文心一言、讯飞星火、商汤日日新支持开源模型:Llama2,
ChatGLM2
AI 研习所
·
2023-09-21 12:33
AIGC
人工智能
AGI
人工智能
AIGC
Flask在线部署
ChatGLM2
大模型
1、拉取镜像dockerpullswr.cn-central-221.ovaijisuan.com/mindformers/mindformers_dev_mindspore_2_0:mindformers_0.6.0dev_20230616_py39_372、新建docker.sh-p8000:8000是宿主机映射到镜像8000端口如果添加–ipc=host--net=host会和-p冲突#--
Zain Lau
·
2023-09-15 12:19
flask
python
后端
CodeGeeX2: 更强大的多语言代码生成模型
不同于一代CodeGeeX(完全在国产华为昇腾芯片平台训练),CodeGeeX2是基于
ChatGLM2
架构加入代码预训练实现,得益于
ChatGLM2
的更优性能,CodeGeeX2在多项指标上取得性能提升
池佳齐
·
2023-09-03 01:39
人工智能
chatglm2
外挂知识库问答的简单实现
一、背景大语言模型应用未来一定是开发热点,现在一个比较成功的应用是外挂知识库。相比chatgpt这个知识库比较庞大,效果比较好的接口。外挂知识库+大模型的方式可以在不损失太多效果的条件下获得数据安全。二、原理现在比较流行的一个方案是langchain+chatglm,这已经算是一个成品了,也可以考虑自己上手捏一下泥巴,langchain学习成本有点高,可以直接利用prompt来完成问问题会简单很多
相国
·
2023-08-29 10:29
chatglm
大语言模型
大模型应用开发
文本向量化
Windows环境部署安装Chatglm2-6B-int4
几个步骤:1.安装pytorch-gpu,这个可以看下前一个博客:win10安装pytorchGPU_相国的博客-CSDN博客2.下载
chatglm2
的源码
相国
·
2023-08-29 10:59
机器学习
windows
大语言模型
chatglm
使用阿里云微调
chatglm2
完整的代码可以参考:https://files.cnblogs.com/files/lijiale/chatglm2-6b.zip?t=1691571940&download=true#%%[markdown]##微调前#%%model_path="/mnt/workspace/ChatGLM2-6B/chatglm2-6b"fromtransformersimportAutoTokenizer,
movie__movie
·
2023-08-25 00:28
大模型
语言模型
chatglm2
GPT-4,Llama2,
ChatGLM2
,PaLM2共聚一堂 | LLM Day @KDD 2023
点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入!以下内容来源于GLM大模型在过去半年中,以ChatGPT为代表的大规模语言模型(LLMs)彻底改变世界,人类与世界的交互逐渐进入到了一个新的阶段。然而,伴随着资本狂热之后的冷静,LLMs当前进展到了哪一步,以及接下来急迫需要解决哪些问题,这亟需学术界人士去细致分析。为此,在即将召开的ACMKDD2023会议上,由清华大学唐杰教授、东昱晓助理教
AITIME论道
·
2023-08-10 08:21
ChatGLM2-12B 效果怎么样?官方公布
以下内容来源于GLM大模型
ChatGLM2
系列模型发布月余,大家对ChatGLM2-6B的效果已经有较多认知。我们现在公布ChatGLM2-12B在部分中英文典型数据集上的评测效果,供大家参考。
AITIME论道
·
2023-08-10 08:20
代码模型 CodeGeeX2-6B 开源,最低6GB显存,性能优于StarCoder
CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,基于
ChatGLM2
架构注入代码实现。得益于Cha
AITIME论道
·
2023-08-10 08:50
【AI实战】ChatGLM2-6B 微调:AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘
【AI实战】ChatGLM2-6B微调:AttributeError:'ChatGLMModel'objecthasnoattribute'prefix_encoder'ChatGLM2-6B介绍
ChatGLM2
szZack
·
2023-08-06 22:45
大语言模型
ChatGLM2-6B
prefix_encoder
ChatGLMModel
仅需6GB显存,拥有专属AI代码助手
CodeGeeX2是多语言代码生成模型CodeGeeX的第二代模型,不同于一代CodeGeeX,CodeGeeX2是基于
ChatGLM2
架构加入代码预训练实现。
AI 研习所
·
2023-08-05 03:04
AIGC
大模型
AGI
ai
【NLP】训练
chatglm2
的评价指标BLEU,ROUGE
当进行一定程度的微调后,要评价模型输出的语句的准确性。由于衡量的对象是一个个的自然语言文本,所以通常会选择自然语言处理领域的相关评价指标。这些指标原先都是用来度量机器翻译结果质量的,并且被证明可以很好的反映待评测语句的准确性,主要包含4种:BLEU,METEOR,ROUGE,CIDEr。本文只介绍BLEU,ROUGE两个指标,其他待补充。1、BLEUBLEU(BilingualEvaluation
aglo
·
2023-08-03 11:41
自然语言处理
人工智能
用Kaggle免费GPU微调
ChatGLM2
前方干货预警:这篇文章可能是你目前能够找到的可以无痛跑通LLM微调并基本理解整个流程的门槛最低的入门范例。门槛低到什么程度,本范例假设你是一个三无用户。1,无NLP经验:你没有扎实的NLP理论知识,只有一些基本的炼丹经验。没关系,我们会在恰当的时候告诉你必要的原理。2,无GPU:你没有任何一块可以使用的GPU。没关系,我们直接在Kaggle环境上使用免费的P100GPU,并给没有kaggle使用经
算法美食屋
·
2023-08-02 20:43
人工智能
深度学习
自然语言处理
机器学习
AI技术快讯:清华开源
ChatGLM2
双语对话语言模型
ChatGLM2-6B是一个开源项目,提供了ChatGLM2-6B模型的代码和资源。根据提供的搜索结果,以下是对该项目的介绍:论文:https://arxiv.org/pdf/2103.10360.pdfChatGLM2-6B是一个开源的双语对话语言模型,是ChatGLM-6B模型的第二代版本。它保留了初代模型的对话流畅和部署门槛较低的特点,并引入了一些新的特性和改进。ChatGLM2-6B具有以
源代码杀手
·
2023-07-31 23:00
AI技术快讯
人工智能
语言模型
自然语言处理
Chatglm2
使用及微调教程
1、下载
chatglm2
代码GitHub-THUDM/ChatGLM2-6B:ChatGLM2-6B:AnOpenBilingualChatLLM|开源双语对话语言模型github代码见上面所示2、下载
benben044
·
2023-07-24 22:00
AIGC
神经网络
人工智能
给
ChatGLM2
注入知识;阅文集团发布首个网文大模型“阅文妙笔”
AI新闻阅文集团发布首个网文大模型“阅文妙笔”摘要:在阅文创作大会上,阅文集团发布了国内首个网文大模型“阅文妙笔”。该模型以AIGC为创作生态和IP生态赋能,将为作家带来创作模式的创新和新的价值。侯晓楠表示,AI不会取代创作者,而是成为创作者的“金手指”。阅文集团还调整了管理层,并明确了三个重点方向:发展作家和内容生态,建立版权保护统一战线,提升商业化能力。同时,阅文集团回应网络盗版事件,并表示将
go2coding
·
2023-07-23 07:39
AI日报
人工智能
搞不定高考的ChatGPT,原来只有小学4年级水平
同时,国产大模型如Baichuan、MOSS、
ChatGLM2
等表现较差。让
夕小瑶
·
2023-07-21 02:37
高考
chatgpt
手把手带你实现ChatGLM2-6B的P-Tuning微调
objecthasnoattribute'is_deepspeed_enabltorch.distributed.elastic.multiprocessing.errors.ChildFailedError:可能是版本太高,可以参考
chatglm2
stay_foolish12
·
2023-07-19 21:32
深度学习
大模型
Mac(M1Pro)下运行
ChatGLM2
最近很多人都尝试在M1/M2芯片下跑chatglm/
chatglm2
,结果都不太理想,或者是说要32G内存才可以运行。本文使用cpu基于chatglm-cpp运行
chatglm2
的int4版本。
wxl781227
·
2023-07-14 19:34
开源大模型微调
macos
人工智能
langchain调用
chatGLM2
纪实
一、科学上网要注意:域名全代和全局代理(网卡),都要打开。这样condainstall特别快。二、安装langchain1、condainstalllangchain2、condainstallopenai注意:使用pipinstall和condainstall是不同的二、简单运行一下fromlangchain.llmsimportOpenAIfromlangchain.llmsimportOpe
gaoenyang760525
·
2023-07-14 01:50
langchain
ChatGLM-6B第二代模型开源,拿下LLM模型中文能力评估榜单第一名
在主要评估LLM模型中文能力的C-Eval榜单中,截至6月25日
ChatGLM2
模型以71.1的分数位居Rank0,ChatGLM2-6B模型以51.7的分数位居Ran
·
2023-07-13 15:54
上一页
1
2
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他