train 第6页

LLaMA Factory 深度调参

https://github.com/zysNLP/quickllm初始指令：llamafactory-clitrain\--stagesft\--do_trainTrue\--model_name_or_path

NLP小讲堂·2025-05-15 23:47

Generative Pre-trained Transformer

GenerativePre-trainedTransformer(GPT)referstoaclassofdeeplearningmodelsdevelopedbyOpenAI,specificallydesignedfornaturallanguageprocessingtasks.GPTmodelsarebasedonthetransformerarchitectureandarepre-tr

科学禅道·2025-05-15 21:59

GPT（ Generative Pre-trained Transformer ）模型：基于Transformer

GPT是由openAI开发的一款基于Transformer架构的预训练语言模型，拥有强大的生成能力和多任务处理能力，推动了自然语言处理（NLP）的快速发展。一GPT发展历程1.1GPT-1（2018年）是首个基于Transformer架构的模型，使用掩码自注意力机制，但是仅仅关注了参数左侧数据，没有关注右侧数据，是之前文章学习过的单项Transformer，用这个也是为了模拟人类的自左向右生成语言

sbc-study·2025-05-15 20:54

GPT 经验

在GPT（GenerativePre-trainedT

AI Echoes·2025-05-15 20:54

GPT-3 的技术变革与技术挑战应对

GPT-3的技术变革与技术挑战应对关键词：GPT-3,自然语言处理,深度学习,transformer架构,零样本学习,技术挑战,伦理问题摘要：本文深入探讨了GPT-3（GenerativePre-trainedTransformer3

AI天才研究院·2025-05-15 20:21

BaiChuan13B-GPTQ量化详解

文件或者tf文件，即模型权重文件，所以和网上大部分代码不同的地方在于，需要提前保存对应模型的权重文件，如果是BaiChuan13B，那么在进行模型量化前，对其进行保存代码如下：defsave_bin(pretrained_model_dir

三千院本院·2025-05-15 17:03

机器学习基础概念详解：从入门到应用

一、数据集的划分：训练集、验证集与测试集1.训练集（TrainingSet）用途：用于模型训练，通过调整模型参数学习数据规律特点：通常占数据总量的60-70%示例：用历史房价数据训练模型预测未来价格2.

烂蜻蜓·2025-05-14 22:49

wget下载文件-如果文件通过谷歌浏览器下载容易中断且还要重头再来

wget-c-t0--user=xxx--password=xxxhttp://www.xxx.xx/Train.tar这个数据集下载需要账户密码验证，然后在输入命令的时候加一个--user=xxx和-

知识在于分享·2025-05-14 18:25

使用numpy读取数据集

#使用NumPy的loadtxt函数读取CSV文件train_data=np.loadtxt("experiment_02_training_set.csv",delimiter=',',skiprows

编程小白煎堆·2025-05-14 18:25

目标检测任务常用脚本1——将YOLO格式的数据集转换成VOC格式的数据集

输入输出目录结构✅输入目录结构（YOLO格式）├──train/│├──images/││├──img_000001.bmp││└──..

张书名·2025-05-14 16:16

数字图像处理与深度学习-实验3（python）

二、实验内容和步骤1.图像加噪声函数列举如下，选择调用相关函数，编写Python程序完成下列图像处理要求：（1）train1.jpg图像加入高斯噪声,然后分别采用3╳3滤波核和7╳7滤波核进行均值滤波，

happy果2023·2025-05-14 14:56

CoAP协议详解：物联网通信的轻量级解决方案

什么是CoAP协议CoAP（ConstrainedApplicationProtocol）是一种专门为物联网（IoT）设计的应用层协议。它的目标是为受限设备和网络提供轻量级的通信解决方案。

极客小张·2025-05-14 14:55

Qwen3 调用 FastMCP —— 查询天气案例，了解 MCP 和大模型的结合方法

AutoTokenizermodel_name="Qwen/Qwen3-1.7B"#loadthetokenizerandthemodeltokenizer=AutoTokenizer.from_pretrained

·2025-05-14 12:53

【前沿热点顶会】CVPR 2025和目标分类、检测、分割、重识别有关的论文

SegEarth-OV:TowardsTraining-FreeOpen-VocabularySegmentationforRemoteSensingImages遥感图像在农业、水资源、军事、救灾等领域发挥着不可替代的作用

平安顺遂事事如意·2025-05-14 06:07

第二十三天打卡

看看能不能制作出适合所有机器学习的通用pipeline数据预处理→特征选择→降维→模型训练importpandasaspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_split

不爱吃山楂罐头·2025-05-13 21:07

sp_helpconstraint 和 sp_help

sp_helpconstraint返回一个列表，其内容包括所有约束类型、约束类型的用户定义或系统提供的名称、定义约束类型时用到的列，以及定义约束的表达式（仅适用于DEFAULT和CHECK约束）。

存在信号·2025-05-13 19:55

gpt各个版本有什么区别

GPT(GenerativePre-trainingTransformer)是一种自然语言生成模型，由OpenAI开发。它在自然语言处理任务中表现出色，例如文本生成、翻译和问答。

Waiyuet Fung·2025-05-13 18:47

python报错ModuleNotFoundError: No module named ‘utils.train_util‘； ‘utils‘ is not a package

1、添加__init__.py文件首先考虑是utils目录没有被python识别成一个包，解决方案：在utils目录下添加__init__.py文件，让系统识别到这个包即可2、添加__init__.py文件后依旧报这个错原因：__init__.py文件为空，python依旧无法识别解决方法：在__init__.py文件中添加一行注释即可，让__init__.py文件不为空，确保系统可以正确识别。例

在努力啦Chxxxxxloe·2025-05-13 11:00

Timefold 仓库拣货优化-约束流与优化目标详解

本文将带你深入理解Timefold的约束流（ConstraintStream）机制，掌握如何用声明式代码表达业务规则和优化目标。什么是ConstraintStream？

·2025-05-13 10:03

kaggle泰坦尼克号人员生还预测

自行学习参考如何使用kaggle平台，写下使用注意点，并对下述比赛提交代码kaggle泰坦尼克号人员生还预测importpandasaspdtrain_data=pd.read_csv('train.csv

zx43·2025-05-13 05:54

Python打卡训练营day10

数据集的划分机器学习模型建模的三行代码机器学习模型分类问题的评估尝试对心脏病数据集采用机器学习模型建模和评估导入相关库，导入数据，划分数据集fromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportclassification_reportimportpandasaspddf

sak77·2025-05-12 20:27

yolov8使用

导出onnxyoloexportmodel=D:/zou/wjzz/workDoc/screwsDetech/runs/detect/train/weights/best.ptformat=onnxopset

不学习怎么给老板打工？·2025-05-12 20:26

【Transformer】解密Transformer核心模块可训练参数

在Transformer模型中，所有可训练（trainable）的模块构成了其核心架构，每个模块都有其特定的功能和意义，并且都包含可通过反向传播进行优化的参数。

小波才露尖尖角·2025-05-12 19:16

第二十一天打卡

importpandasaspdfromsklearn.imputeimportSimpleImputerfromsklearn.preprocessingimportLabelEncoder#加载数据train_df

nbbsn·2025-05-12 07:52

protell99se DRC检查提示Short Circuit Constraint问题

在画完PCB后进行DRC检查的时候总是报ShortCircuitConstraint错误，仔细检查PCB感觉也没有那个地方短路。

xiebingsuccess·2025-05-12 04:03

ImportError: cannot import name ‘PROTOCOL_TLS‘ from ‘urllib3.util.ssl_‘

解决办法：重装gensim不行的话，根据报错信息检查下所用的包是否在同一个路径下，我是pytorch_pretrained_bert这个包报的错，原来装在了C盘，现在的gensim装在了D盘，我把之前C

一个老丁头·2025-05-11 21:52

llamafactory-cli cuda 显存动不动不够的一个解决办法

deepspeed--num_gpus2\/mcm/LLaMA-Factory/src/train.py--deepspeed\/mcm/LLaMA-Factory/examples/deepspeed

取啥都被占用·2025-05-11 18:35

快速读文章-Adversarial Training Towards Robust Multimedia Recommender System

摘要:随着网络上多媒体内容的普及，迫切需要开发能够有效利用多媒体数据中丰富信号的推荐解决方案。由于深度神经网络在表征学习中的成功，多媒体推荐的最新进展主要集中在探索深度学习方法以提高推荐精度上。然而，迄今为止，很少有人研究多媒体表示的健壮性及其对多媒体推荐性能的影响。本文对多媒体推荐系统的鲁棒性进行了研究。通过使用最先进的推荐框架和深度图像特征，我们证明了整个系统的鲁棒性不强，因此，对输入图像进行

无意识积累中·2025-05-11 13:34

【论文阅读】Adversarial Training Towards Robust Multimedia Recommender System

AdversarialTrainingTowardsRobustMultimediaRecommenderSystem题目翻译：面向鲁棒多媒体推荐系统的对抗训练论文链接：点这里标签：多媒体推荐、对抗训练

hongjianMa·2025-05-11 13:01

李沐-动手学深度学习（多层感知机）

Traceback(mostrecentcalllast):File"D:\zmm\pycharmproject\pythonProject\study1\gzj1.py",line28,ind2l.train_ch3

梦姐的编程日志·2025-05-11 07:20

【报错】AttributeError: ‘float‘ object has no attribute ‘backward‘

/models'File"D:\360MoveData\Users\HONOR\whu\segment.py",line269,intrain_modelresult['loss'].backw

睡不着还睡不醒·2025-05-11 05:06

tensorboard in pytorch

#PyTorchmodelandtrainingnecessitiesimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFimporttorch.optimasoptim

D11PMINDER·2025-05-11 01:13

机器学习-数据集划分和特征工程

一.数据集划分API函数：sklearn.model_selection.train_test_split(*arrays，**options)参数：-arrays：多个数组，可以是列表，numpy数组

Clocky7·2025-05-10 20:10

Android中 androidx.constraintlayout.widget.ConstraintLayout的使用

在Android开发中，androidx.constraintlayout.widget.ConstraintLayout是一个功能强大的布局容器，通过约束关系（Constraints）定位子视图，可高效实现复杂

xyzroundo·2025-05-10 18:27

机器学习---sklearn常用模型

一、线性回归模型（LinearRegression）importpandasaspdfromsklearn.model_selectionimporttrain_test_splitfro

我姓曹，谢谢·2025-05-10 15:40

让代码在vscode关闭后在远程服务器后台运行

打开终端：使用命令nohuppythontrain.py>my_log.out2>&1&这样就可以让训练代码在后台运行使用命令tail-fmy_log.out来查看输出日志使用命令jobs-p

Cc浩·2025-05-10 11:08

一种在使用Kaggle并遇上会话中断时强行保存数据的方法

转为链接形式，从而在kaggle会话终止时也可以下载到该excel文件importbase64importpandasaspd#读取Excel文件并编码为Base64#“/kaggle/working/training_metrics.xlsx

zeroporn·2025-05-10 09:57

Tortoise-TTS 开源项目安装与使用指南

Tortoise-TTS开源项目安装与使用指南tortoise-ttsAmulti-voiceTTSsystemtrainedwithanemphasisonquality项目地址:https://gitcode.com

芮川琨Jack·2025-05-10 09:54

Android开发-常用布局

本文将介绍几种最常用的Android布局方式，包括LinearLayout、RelativeLayout、ConstraintLayout以及GridLayout，并探讨它们的特点与应用场景。

難釋懷·2025-05-09 01:22

OpenAI Codex——通过自然语言输入理解编程需求，并生成相应的代码

它基于GPT（GenerativePre-trainedTransformer）技术的改进版本，能够理解多种编程语言并生成有用的代码段。

爱研究的小牛·2025-05-08 18:08

go 编译报错:build constraints exclude all Go files

报错信息：packagecommand-line-argumentsimportsgithub.com/amikos-tech/chroma-goimportsgithub.com/amikos-tech/chroma-go/pkg/embeddings/default_efimportsgithub.com/amikos-tech/chroma-go/pkg/tokenizers/libtoke

爆破小能手·2025-05-08 08:37

60天Python训练 day13

随机过采样fromimblearn.over_samplingimportRandomOverSamplerros=RandomOverSampler(random_state=42)#创建随机过采样对象X_train_ros

only_only_you·2025-05-08 03:06

大模型之大模型压缩（量化、剪枝、蒸馏、低秩分解），推理（vllm）

目录前言一、模型量化（quantization）1.量化概念2.模型量化优点3.什么情况下应该/不应该使用模型量化4.落地挑战5.量化方法5.1量化训练(QuantAwareTraining,QAT)原理

大模型八哥·2025-05-08 01:22

机器学习实战：6种数据集划分方法详解与代码实现

一、数据集划分基础函数1.核心函数：train_test_splitfromsklearn.model_selectionimporttrain_test_split#基本用法X_train,X_test

慕婉0307·2025-05-07 23:12

从零学习大模型（一）-----GPT3（上）

GPT-3（GenerativePre-trainedTransformer3）是一种大型自回归语言模型，由OpenAI团队训练和发布。

懒惰才能让科技进步·2025-05-07 23:11

Python贝叶斯算法进行文本主客观分析（采用文本双词模型）

importdivisionimportrefromnumpyimportones,arrayfromnumpy.lib.scimathimportlogfromnltkimport*defloadDataSet():obj=open("obj_train_data.txt

lsdnh521·2025-05-07 22:37

【Transformer-GRU回归预测】Transformer-GRU多变量回归预测

导入所需库fromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardScalerfromsklearn.ensembleimportAdaBoostClassifierfromsklearn.metricsimportaccuracy_scorefromsklearn.pipeli

默默科研仔·2025-05-07 06:56

详解trl中的GRPOTrainer和GRPOConfig

HuggingFace的TRL(TransformerReinforcementLearning)库通过GRPOTrainer和GRPOConfig提供了该算法的开箱即用实现。

几道之旅·2025-05-07 06:56

deepseek-glm4-grpo训练

CUDA_VISIBLE_DEVICES=1nohuppythontest.py--model_name_or_path/home/LLaMA-Factory/saves/glm4-9b-lora-alpaca_reference_train20250115

贾亚飞·2025-05-07 06:55

deepseek-glm4-grpo训练

CUDA_VISIBLE_DEVICES=1nohuppythontest.py--model_name_or_path/home/LLaMA-Factory/saves/glm4-9b-lora-alpaca_reference_train20250115

贾亚飞·2025-05-07 06:55

推荐频道

train

LLaMA Factory 深度调参

Generative Pre-trained Transformer

GPT（ Generative Pre-trained Transformer ）模型：基于Transformer

GPT 经验

GPT-3 的技术变革与技术挑战应对

BaiChuan13B-GPTQ量化详解

机器学习基础概念详解：从入门到应用

wget下载文件-如果文件通过谷歌浏览器下载容易中断且还要重头再来

使用numpy读取数据集

目标检测任务常用脚本1——将YOLO格式的数据集转换成VOC格式的数据集

数字图像处理与深度学习-实验3（python）

CoAP协议详解：物联网通信的轻量级解决方案

Qwen3 调用 FastMCP —— 查询天气案例，了解 MCP 和大模型的结合方法

【前沿 热点 顶会】CVPR 2025和目标分类、检测、分割、重识别有关的论文

第二十三天打卡

sp_helpconstraint 和 sp_help

gpt各个版本有什么区别

python报错ModuleNotFoundError: No module named ‘utils.train_util‘； ‘utils‘ is not a package

Timefold 仓库拣货优化-约束流与优化目标详解

kaggle泰坦尼克号人员生还预测

Python打卡训练营day10

yolov8使用

【Transformer】解密Transformer核心模块可训练参数

第二十一天打卡

protell99se DRC检查提示Short Circuit Constraint问题

ImportError: cannot import name ‘PROTOCOL_TLS‘ from ‘urllib3.util.ssl_‘

llamafactory-cli cuda 显存动不动不够的一个解决办法

快速读文章-Adversarial Training Towards Robust Multimedia Recommender System

【论文阅读】Adversarial Training Towards Robust Multimedia Recommender System

李沐-动手学深度学习（多层感知机）

【报错】AttributeError: ‘float‘ object has no attribute ‘backward‘

tensorboard in pytorch

机器学习-数据集划分和特征工程

Android中 androidx.constraintlayout.widget.ConstraintLayout的使用

机器学习---sklearn常用模型

让代码在vscode关闭后在远程服务器后台运行

一种在使用Kaggle并遇上会话中断时强行保存数据的方法

Tortoise-TTS 开源项目安装与使用指南

Android开发-常用布局

OpenAI Codex——通过自然语言输入理解编程需求，并生成相应的代码

go 编译报错:build constraints exclude all Go files

60天Python训练 day13

大模型之大模型压缩（量化、剪枝、蒸馏、低秩分解），推理（vllm）

机器学习实战：6种数据集划分方法详解与代码实现

从零学习大模型（一）-----GPT3（上）

Python贝叶斯算法进行文本主客观分析（采用文本双词模型）

【Transformer-GRU回归预测】Transformer-GRU多变量回归预测

详解trl中的GRPOTrainer和GRPOConfig

deepseek-glm4-grpo训练

deepseek-glm4-grpo训练

【前沿热点顶会】CVPR 2025和目标分类、检测、分割、重识别有关的论文