E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
train
LLaMA Factory 深度调参
https://github.com/zysNLP/quickllm初始指令:llamafactory-cli
train
\--stagesft\--do_
train
True\--model_name_or_path
NLP小讲堂
·
2025-05-15 23:47
机器学习
人工智能
Generative Pre-
train
ed Transformer
GenerativePre-
train
edTransformer(GPT)referstoaclassofdeeplearningmodelsdevelopedbyOpenAI,specificallydesignedfornaturallanguageprocessingtasks.GPTmodelsarebasedonthetransformerarchitectureandarepre-tr
科学禅道
·
2025-05-15 21:59
大模型专栏
深度学习模型专栏
transformer
深度学习
人工智能
GPT( Generative Pre-
train
ed Transformer )模型:基于Transformer
GPT是由openAI开发的一款基于Transformer架构的预训练语言模型,拥有强大的生成能力和多任务处理能力,推动了自然语言处理(NLP)的快速发展。一GPT发展历程1.1GPT-1(2018年)是首个基于Transformer架构的模型,使用掩码自注意力机制,但是仅仅关注了参数左侧数据,没有关注右侧数据,是之前文章学习过的单项Transformer,用这个也是为了模拟人类的自左向右生成语言
sbc-study
·
2025-05-15 20:54
gpt
transformer
深度学习
GPT 经验
在GPT(GenerativePre-
train
edT
AI Echoes
·
2025-05-15 20:54
gpt
GPT-3 的技术变革与技术挑战应对
GPT-3的技术变革与技术挑战应对关键词:GPT-3,自然语言处理,深度学习,transformer架构,零样本学习,技术挑战,伦理问题摘要:本文深入探讨了GPT-3(GenerativePre-
train
edTransformer3
AI天才研究院
·
2025-05-15 20:21
LLM大模型落地实战指南
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
BaiChuan13B-GPTQ量化详解
文件或者tf文件,即模型权重文件,所以和网上大部分代码不同的地方在于,需要提前保存对应模型的权重文件,如果是BaiChuan13B,那么在进行模型量化前,对其进行保存代码如下:defsave_bin(pre
train
ed_model_dir
三千院本院
·
2025-05-15 17:03
大模型
深度学习
人工智能
pytorch
机器学习基础概念详解:从入门到应用
一、数据集的划分:训练集、验证集与测试集1.训练集(
Train
ingSet)用途:用于模型训练,通过调整模型参数学习数据规律特点:通常占数据总量的60-70%示例:用历史房价数据训练模型预测未来价格2.
烂蜻蜓
·
2025-05-14 22:49
机器学习
人工智能
python
深度学习
wget下载文件-如果文件通过谷歌浏览器下载容易中断且还要重头再来
wget-c-t0--user=xxx--password=xxxhttp://www.xxx.xx/
Train
.tar这个数据集下载需要账户密码验证,然后在输入命令的时候加一个--user=xxx和-
知识在于分享
·
2025-05-14 18:25
工具类
使用numpy读取数据集
#使用NumPy的loadtxt函数读取CSV文件
train
_data=np.loadtxt("experiment_02_
train
ing_set.csv",delimiter=',',skiprows
编程小白煎堆
·
2025-05-14 18:25
numpy
目标检测任务常用脚本1——将YOLO格式的数据集转换成VOC格式的数据集
输入输出目录结构✅输入目录结构(YOLO格式)├──
train
/│├──images/││├──img_000001.bmp││└──..
张书名
·
2025-05-14 16:16
目标检测任务常用脚本
目标检测
YOLO
人工智能
数字图像处理与深度学习-实验3(python)
二、实验内容和步骤1.图像加噪声函数列举如下,选择调用相关函数,编写Python程序完成下列图像处理要求:(1)
train
1.jpg图像加入高斯噪声,然后分别采用3╳3滤波核和7╳7滤波核进行均值滤波,
happy果2023
·
2025-05-14 14:56
数字图像处理与深度学习
计算机视觉
图像处理
人工智能
python
CoAP协议详解:物联网通信的轻量级解决方案
什么是CoAP协议CoAP(Cons
train
edApplicationProtocol)是一种专门为物联网(IoT)设计的应用层协议。它的目标是为受限设备和网络提供轻量级的通信解决方案。
极客小张
·
2025-05-14 14:55
网络协议
信息与通信
硬件工程
mcu
iot
单片机
嵌入式硬件
Qwen3 调用 FastMCP —— 查询天气案例,了解 MCP 和大模型的结合方法
AutoTokenizermodel_name="Qwen/Qwen3-1.7B"#loadthetokenizerandthemodeltokenizer=AutoTokenizer.from_pre
train
ed
·
2025-05-14 12:53
【前沿 热点 顶会】CVPR 2025和目标分类、检测、分割、重识别有关的论文
SegEarth-OV:Towards
Train
ing-FreeOpen-VocabularySegmentationforRemoteSensingImages遥感图像在农业、水资源、军事、救灾等领域发挥着不可替代的作用
平安顺遂事事如意
·
2025-05-14 06:07
顶刊顶会论文合集
分类
数据挖掘
人工智能
CVPR
检测
分割
重识别
第二十三天打卡
看看能不能制作出适合所有机器学习的通用pipeline数据预处理→特征选择→降维→模型训练importpandasaspdimportnumpyasnpfromsklearn.model_selectionimport
train
_test_split
不爱吃山楂罐头
·
2025-05-13 21:07
python打卡
python
sp_helpcons
train
t 和 sp_help
sp_helpcons
train
t返回一个列表,其内容包括所有约束类型、约束类型的用户定义或系统提供的名称、定义约束类型时用到的列,以及定义约束的表达式(仅适用于DEFAULT和CHECK约束)。
存在信号
·
2025-05-13 19:55
javascript
gpt各个版本有什么区别
GPT(GenerativePre-
train
ingTransformer)是一种自然语言生成模型,由OpenAI开发。它在自然语言处理任务中表现出色,例如文本生成、翻译和问答。
Waiyuet Fung
·
2025-05-13 18:47
python报错ModuleNotFoundError: No module named ‘utils.
train
_util‘; ‘utils‘ is not a package
1、添加__init__.py文件首先考虑是utils目录没有被python识别成一个包,解决方案:在utils目录下添加__init__.py文件,让系统识别到这个包即可2、添加__init__.py文件后依旧报这个错原因:__init__.py文件为空,python依旧无法识别解决方法:在__init__.py文件中添加一行注释即可,让__init__.py文件不为空,确保系统可以正确识别。例
在努力啦Chxxxxxloe
·
2025-05-13 11:00
python
前端
开发语言
Timefold 仓库拣货优化-约束流与优化目标详解
本文将带你深入理解Timefold的约束流(Cons
train
tStream)机制,掌握如何用声明式代码表达业务规则和优化目标。什么是Cons
train
tStream?
·
2025-05-13 10:03
算法
kaggle泰坦尼克号人员生还预测
自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码kaggle泰坦尼克号人员生还预测importpandasaspd
train
_data=pd.read_csv('
train
.csv
zx43
·
2025-05-13 05:54
python训练营打卡内容
python
机器学习
人工智能
笔记
Python打卡训练营day10
数据集的划分机器学习模型建模的三行代码机器学习模型分类问题的评估尝试对心脏病数据集采用机器学习模型建模和评估导入相关库,导入数据,划分数据集fromsklearn.model_selectionimport
train
_test_splitfromsklearn.metricsimportclassification_reportimportpandasaspddf
sak77
·
2025-05-12 20:27
python打卡训练营
python
机器学习
模型训练
yolov8使用
导出onnxyoloexportmodel=D:/zou/wjzz/workDoc/screwsDetech/runs/detect/
train
/weights/best.ptformat=onnxopset
不学习怎么给老板打工?
·
2025-05-12 20:26
深度学习
【Transformer】解密Transformer核心模块可训练参数
在Transformer模型中,所有可训练(
train
able)的模块构成了其核心架构,每个模块都有其特定的功能和意义,并且都包含可通过反向传播进行优化的参数。
小波才露尖尖角
·
2025-05-12 19:16
transformer
深度学习
人工智能
第二十一天打卡
importpandasaspdfromsklearn.imputeimportSimpleImputerfromsklearn.preprocessingimportLabelEncoder#加载数据
train
_df
nbbsn
·
2025-05-12 07:52
机器学习
人工智能
算法
protell99se DRC检查提示Short Circuit Cons
train
t问题
在画完PCB后进行DRC检查的时候总是报ShortCircuitCons
train
t错误,仔细检查PCB感觉也没有那个地方短路。
xiebingsuccess
·
2025-05-12 04:03
网易博客搬迁之研发人生
ImportError: cannot import name ‘PROTOCOL_TLS‘ from ‘urllib3.util.ssl_‘
解决办法:重装gensim不行的话,根据报错信息检查下所用的包是否在同一个路径下,我是pytorch_pre
train
ed_bert这个包报的错,原来装在了C盘,现在的gensim装在了D盘,我把之前C
一个老丁头
·
2025-05-11 21:52
python
llamafactory-cli cuda 显存动不动不够的一个解决办法
deepspeed--num_gpus2\/mcm/LLaMA-Factory/src/
train
.py--deepspeed\/mcm/LLaMA-Factory/examples/deepspeed
取啥都被占用
·
2025-05-11 18:35
软件应用
llamafactory
finetuning
deepseek
快速读文章-Adversarial
Train
ing Towards Robust Multimedia Recommender System
摘要:随着网络上多媒体内容的普及,迫切需要开发能够有效利用多媒体数据中丰富信号的推荐解决方案。由于深度神经网络在表征学习中的成功,多媒体推荐的最新进展主要集中在探索深度学习方法以提高推荐精度上。然而,迄今为止,很少有人研究多媒体表示的健壮性及其对多媒体推荐性能的影响。本文对多媒体推荐系统的鲁棒性进行了研究。通过使用最先进的推荐框架和深度图像特征,我们证明了整个系统的鲁棒性不强,因此,对输入图像进行
无意识积累中
·
2025-05-11 13:34
推荐系统
深度学习
计算机视觉
人工智能
【论文阅读】Adversarial
Train
ing Towards Robust Multimedia Recommender System
Adversarial
Train
ingTowardsRobustMultimediaRecommenderSystem题目翻译:面向鲁棒多媒体推荐系统的对抗训练论文链接:点这里标签:多媒体推荐、对抗训练
hongjianMa
·
2025-05-11 13:01
#
多模态-论文阅读
论文阅读
推荐系统
VBPR
对抗
深度学习
多模态
李沐-动手学深度学习(多层感知机)
Traceback(mostrecentcalllast):File"D:\zmm\pycharmproject\pythonProject\study1\gzj1.py",line28,ind2l.
train
_ch3
梦姐的编程日志
·
2025-05-11 07:20
深度学习
人工智能
pycharm
【报错】AttributeError: ‘float‘ object has no attribute ‘backward‘
/models'File"D:\360MoveData\Users\HONOR\whu\segment.py",line269,in
train
_modelresult['loss'].backw
睡不着还睡不醒
·
2025-05-11 05:06
读研日记
机器学习
深度学习
人工智能
tensorboard in pytorch
#PyTorchmodeland
train
ingnecessitiesimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFimporttorch.optimasoptim
D11PMINDER
·
2025-05-11 01:13
deeplearning
计算机视觉
人工智能
深度学习
机器学习-数据集划分和特征工程
一.数据集划分API函数:sklearn.model_selection.
train
_test_split(*arrays,**options)参数:-arrays:多个数组,可以是列表,numpy数组
Clocky7
·
2025-05-10 20:10
机器学习
深度学习
人工智能
Android中 androidx.cons
train
tlayout.widget.Cons
train
tLayout的使用
在Android开发中,androidx.cons
train
tlayout.widget.Cons
train
tLayout是一个功能强大的布局容器,通过约束关系(Cons
train
ts)定位子视图,可高效实现复杂
xyzroundo
·
2025-05-10 18:27
android
android
androidx
UI
kotlin
java
机器学习---sklearn常用模型
一、线性回归模型(LinearRegression)importpandasaspdfromsklearn.model_selectionimport
train
_test_splitfro
我姓曹,谢谢
·
2025-05-10 15:40
机器学习
sklearn
人工智能
让代码在vscode关闭后在远程服务器后台运行
打开终端:使用命令nohuppython
train
.py>my_log.out2>&1&这样就可以让训练代码在后台运行使用命令tail-fmy_log.out来查看输出日志使用命令jobs-p
Cc浩
·
2025-05-10 11:08
vscode
服务器
ide
一种在使用Kaggle并遇上会话中断时强行保存数据的方法
转为链接形式,从而在kaggle会话终止时也可以下载到该excel文件importbase64importpandasaspd#读取Excel文件并编码为Base64#“/kaggle/working/
train
ing_metrics.xlsx
zeroporn
·
2025-05-10 09:57
深度学习-从小白到架构
python
云计算
深度学习
scikit-learn
conda
pandas
Tortoise-TTS 开源项目安装与使用指南
Tortoise-TTS开源项目安装与使用指南tortoise-ttsAmulti-voiceTTSsystem
train
edwithanemphasisonquality项目地址:https://gitcode.com
芮川琨Jack
·
2025-05-10 09:54
Android开发-常用布局
本文将介绍几种最常用的Android布局方式,包括LinearLayout、RelativeLayout、Cons
train
tLayout以及GridLayout,并探讨它们的特点与应用场景。
難釋懷
·
2025-05-09 01:22
android
gitee
OpenAI Codex——通过自然语言输入理解编程需求,并生成相应的代码
它基于GPT(GenerativePre-
train
edTransformer)技术的改进版本,能够理解多种编程语言并生成有用的代码段。
爱研究的小牛
·
2025-05-08 18:08
AIGC—代码生成
AIGC
深度学习
人工智能
go 编译报错:build cons
train
ts exclude all Go files
报错信息:packagecommand-line-argumentsimportsgithub.com/amikos-tech/chroma-goimportsgithub.com/amikos-tech/chroma-go/pkg/embeddings/default_efimportsgithub.com/amikos-tech/chroma-go/pkg/tokenizers/libtoke
爆破小能手
·
2025-05-08 08:37
golang
开发语言
后端
60天Python训练 day13
随机过采样fromimblearn.over_samplingimportRandomOverSamplerros=RandomOverSampler(random_state=42)#创建随机过采样对象X_
train
_ros
only_only_you
·
2025-05-08 03:06
python
深度学习
开发语言
大模型之大模型压缩(量化、剪枝、蒸馏、低秩分解),推理(vllm)
目录前言一、模型量化(quantization)1.量化概念2.模型量化优点3.什么情况下应该/不应该使用模型量化4.落地挑战5.量化方法5.1量化训练(QuantAware
Train
ing,QAT)原理
大模型八哥
·
2025-05-08 01:22
剪枝
算法
机器学习
人工智能
agi
ai
大模型
机器学习实战:6种数据集划分方法详解与代码实现
一、数据集划分基础函数1.核心函数:
train
_test_splitfromsklearn.model_selectionimport
train
_test_split#基本用法X_
train
,X_test
慕婉0307
·
2025-05-07 23:12
机器学习
机器学习
人工智能
深度学习
数据集划分
从零学习大模型(一)-----GPT3(上)
GPT-3(GenerativePre-
train
edTransformer3)是一种大型自回归语言模型,由OpenAI团队训练和发布。
懒惰才能让科技进步
·
2025-05-07 23:11
大语言模型
gpt-3
人工智能
深度学习
语言模型
chatgpt
python
Python贝叶斯算法进行文本主客观分析(采用文本双词模型)
importdivisionimportrefromnumpyimportones,arrayfromnumpy.lib.scimathimportlogfromnltkimport*defloadDataSet():obj=open("obj_
train
_data.txt
lsdnh521
·
2025-05-07 22:37
机器学习/大数据
【Transformer-GRU回归预测】Transformer-GRU多变量回归预测
导入所需库fromsklearn.model_selectionimport
train
_test_splitfromsklearn.preprocessingimportStandardScalerfromsklearn.ensembleimportAdaBoostClassifierfromsklearn.metricsimportaccuracy_scorefromsklearn.pipeli
默默科研仔
·
2025-05-07 06:56
回归预测
transformer
gru
回归
详解trl中的GRPO
Train
er和GRPOConfig
HuggingFace的TRL(TransformerReinforcementLearning)库通过GRPO
Train
er和GRPOConfig提供了该算法的开箱即用实现。
几道之旅
·
2025-05-07 06:56
人工智能
智能体及数字员工
#
强化学习篇
人工智能
强化学习
deepseek-glm4-grpo训练
CUDA_VISIBLE_DEVICES=1nohuppythontest.py--model_name_or_path/home/LLaMA-Factory/saves/glm4-9b-lora-alpaca_reference_
train
20250115
贾亚飞
·
2025-05-07 06:55
训练
人工智能
deepseek-glm4-grpo训练
CUDA_VISIBLE_DEVICES=1nohuppythontest.py--model_name_or_path/home/LLaMA-Factory/saves/glm4-9b-lora-alpaca_reference_
train
20250115
贾亚飞
·
2025-05-07 06:55
训练
自然语言处理
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他