Models 第7页

【全网首发】使用 LoRA 微调 Qwen2.5-VL-7B-Instruct：完整流程解析

本次发布的模型涵盖3B、7B和72B三种尺寸，并已在HuggingFace和ModelScope上开源，方便不同需求的开发者使用。与此同时，随着大规模视觉

HovChen_·2025-05-25 06:53

通过vllm部署qwen3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结

1.安装vllmcondacreate-nqwen3python=3.9-ycondaactivateqwen3pipinstallvllm2.下载qwen3模型文件下载完整模型库modelscopedownload

Gq.xxu·2025-05-25 01:54

nlf 2025 部署笔记

库报错：分割算法：stcn.pth相机姿态估计：jit部署测试命令python-c"importtorch;importtorchvision;torch.jit.load('/shared_disk/models

AI算法网奇·2025-05-24 16:24

使用modelsim进行Verilog仿真（包含testbench编写）

系列文章目录那啥书接上回FPGAverilog入门文章目录系列文章目录前言一、Modelsim工程新建二、Testbench脚本编写三、仿真总结前言上一次在FPGAverilog入门中说到使用quartusII

学术萌新·2025-05-24 06:14

Modelsim的入门使用和Verilog编写

Modelsim的简单工程创建和代码编写和编译仿真：【FPGA】Modelsim的使用方法_modelsim使用教程-CSDN博客Verilog语法和逻辑简单入门：Verilog语法-数字电路教程三态门符号和简称

aloneboyooo·2025-05-24 06:40

【Text2SQL 论文】CodeS：Text2SQL 领域的开源语言模型

论文：CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL⭐⭐⭐⭐arXiv:2402.16347,SIGMOD2024人大Code:

yubinCloud·2025-05-24 03:22

大模型 agent 执行sql查询

转载，来源：Howtocallfunctionswithchatmodels1.定义client使用了阿里云的qwen-max模型。

Qiming_v·2025-05-24 02:17

YOLO学习笔记｜ YOLO11对象检测，实例分割，姿态评估的TensorRT部署c++

以下是YOLOv11在TensorRT上部署的步骤指南，涵盖对象检测、实例分割和姿态评估：1.模型导出与转换1.1导出ONNX模型importtorchfrommodels.experimentalimportattempt_loadmodel

单北斗SLAMer·2025-05-23 23:55

点云SLAM·2025-05-23 18:48

Django 中的 ORM 基础语法

一、DjangoORM基础架构1.1模型类定义Django通过models.py文件定义模型类，

Python智慧行囊·2025-05-23 16:08

【科研】YOLOv8中anchor_points可视化（更新中）

anchor-point可视化YOLOv8官方源码解读predictorultralytics/ultralytics/models/yolo/obb/predict.py中源码有一个

KleinLan·2025-05-23 16:35

Liblib上面下载的各种模型，如果使用comfy,如何确定其存放的位置？

在使用ComfyUI时，确定从Liblib下载的各种模型存放位置的方法如下：•大模型（StableDiffusion）：存放在`ComfyUI\\models\\Stable-diffusion`目录下

PyAIGCMaster·2025-05-23 03:05

强化学习：第三方库【TRL - Transformer Reinforcement Learning】

OverviewTRLisacutting-edgelibrarydesignedforpost-trainingfoundationmodelsusingadvancedtechniqueslikeSupervisedFine-Tuning

u013250861·2025-05-22 14:21

SGLang和vllm比有什么优势？

一、项目背景SGLang：通常指的是“Sparse-GatedLanguagemodels”或者是特定的推理框架名称（有时项目名可能不太统一），目标是通过稀

玩人工智能的辣条哥·2025-05-22 05:21

3中AI领域的主流方向：预测模型、强化学习和世界模型

其中，预测模型（如大语言模型）、强化学习（RL）和世界模型（WorldModels）代表了三种较大影响力的研究方向。本文将从技术原理、应用场景和未来趋势三个维度，对比分析这三种方向的核心差异与互补性。

pang企鹅·2025-05-22 04:46

【论文速读】MOD，《Mixture-of-Depths: Dynamically allocating compute in transformer-based language models》

论文链接：https://arxiv.org/html/2404.02258v1最近看到有招聘要求中提到熟悉MoE、MoD。MoE前面学习过，赶紧学习一下MoD！Transformer模型在前向传播中对每个token均匀分配计算资源，这在处理不同的语言建模问题时并不高效，因为并非所有token和序列都需要相同的计算量来进行准确预测。MoD模型旨在解决这一问题，通过动态分配计算资源，以更高效地使用计

bylander·2025-05-21 09:37

五分钟带你学习LangChain 框架

LangChain可以轻松管理与LLM的交互，将多个组件链接在一起，并集成额外的资源，以下LangChain框架提供的几个主要模块，这些模块按照逐渐增加的复杂性排列如下：模型（models):LangChain

程序员二飞·2025-05-21 09:35

视觉与语言导航的现状与未来：基础模型时代综述

UNCChapelHill和澳大利亚阿德莱德大学的论文“Vision-and-LanguageNavigationTodayandTomorrow:ASurveyintheEraofFoundationModels

三谷秋水·2025-05-21 08:28

大模型（1）——基本概念

大模型的原理与技术核心三、大模型的应用领域四、市面上常用的大模型1.生成类模型（文本/代码/图像）2.理解类模型（文本/语义）3.多模态模型4.国产大模型五、总结与趋势一、大模型的定义与概念定义大模型（LargeModels

追逐☞·2025-05-21 06:47

LLaMA-Factory微调大模型Qwen2.5

1、开始ModelScope社区GPU环境训练或微调模型都是非常耗费算力的。如果电脑的配置不高，可使用一些云服务器来做这项工作。

will.hu·2025-05-20 12:57

opengl加载显示3D模型X3D类型文件

类型文件前置条件注意事项项目展示项目完整C++源代码前置条件opengl三方库freeglut,显示X3D格式的三维模型文件注意事项源代码model_file=“C:/Users/Administrator/Desktop/models

源代码大师·2025-05-20 10:43

第14次（简要版）-商品详情

模型实现1、在goods/models.py中，新增模型Guige_leixing、Guige，Guige_leixing模型代码放在shangpin模型上方，否则可能提示Guige_leixing不存在

编程自留地·2025-05-20 09:34

多模态大语言模型arxiv论文略读（八十五）

Geneverse:AcollectionofOpen-sourceMultimodalLargeLanguageModelsforGenomicandProteomicResearch➡️论文标题：Geneverse

胖头鱼爱算法·2025-05-20 08:34

一文解析13大神经网络算法模型架构

领域定制化突破3.1卷积神经网络（CNN）3.2循环神经网络（RNN）3.3图神经网络（GNN）四、生成模型：从数据到创造4.1生成对抗网络（GAN）4.2变分自编码器（VAE）4.3扩散模型（DiffusionModels

攻城狮7号·2025-05-20 08:58

Go商城项目---验证码模块的整个工作流程

LoginController(包含Captcha和DoLogin方法)models/captc

神奇萝卜头·2025-05-20 07:22

.net8 blazor auto模式很爽（五）读取sqlite并显示（2）

在BlazorApp1增加文件夹data，里面增加类dbcontusingSharedLibrary.Models;usingSystem.Collections.Generic;usingMicrosoft.EntityFrameworkCore

扎量丙不要犟·2025-05-20 06:19

【第47节软件可靠性建模】

本章目录:一、节概述二、知识详解1.影响软件可靠性的因素2.软件可靠性模型的组成3.软件可靠性模型的特性4.软件可靠性建模方法种子法（SeededFaultModel）失效率类模型（FailureRateModels

涛ing·2025-05-20 06:44

大语言模型应用指南：大语言模型的安全技术

大语言模型应用指南：大语言模型的安全技术作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着大语言模型（LargeLanguageModels

AI天才研究院·2025-05-20 02:20

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-25

sp_fyf_2024·2025-05-19 22:19

相机标定论文翻译之“A precision analysis of camera distortion models”

Aprecisionanalysisofcameradistortionmodelshttps://hal-enpc.archives-ouvertes.fr/hal-01556898Submittedon5Jul2017Abstract—Thispaperaddressesthequestionofidentifyingtherightcameradirectorinversedistortio

AndyCheng_hgcc·2025-05-19 21:14

使用kaldi的sherpa-onnx根据文字语音合成（英文）

github.com/k2-fsa/sherpa-onnx（二）下载最新模型文件下载地址：https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models

静候光阴·2025-05-19 19:00

AIGC音频生成技术全景图：一文掌握所有关键技术

从语音合成到音乐生成，从传统方法到前沿技术，我们将深入探讨WaveNet、Tacotron、DiffusionModels等核心模型，分析其数学原理和实现细节，并提供实际应用案例和开发指南。

AI大模型应用工坊·2025-05-19 07:13

大模型微调步骤整理

PyTorch的torchvision.models模块提供了很多经典的预训练模型，比如ResNet、VGG、EfficientNet等。我们可以直接使用它们作为模型的基础结构。

Trank-Lw·2025-05-19 07:41

多模态大模型综述《A Survey on Multimodal Large Language Models》

架构图在单模态的基础上，加了新的模态，encoder后，通过mlp或者其他方式与text对齐，再输入大模型。如果需要生成新的膜套，可以再通过生成器。（此处与SD不太一样），chatGPT不会生成图片，可以对图片进行理解。训练方式一般多个阶段。预训练、指令微调、对齐微调（RLHF）。预训练是通用能力。使得图像对齐到llm表征空间，数据来源于互联网上的图像对。指令微调是专业能力，提升在下游任务上的性能

yang_daxia·2025-05-18 06:44

【综述论文阅读】A Survey on Multimodal Large Language Models下

介绍来自1中科大科技学院、认知智能国家重点实验室2腾讯优图实验室的综述，建立了github项目，持续更新该综述首先对MLLM的核心方面进行全面回顾，包括(1)主流架构（第2节）；(2)训练策略和数据的完整配方（第3节）；(3)性能评估的常见实践（第4节）。然后探讨了一些关于MLLM的重要问题：(1)哪些方面可以进一步改进或扩展（第5节）？(2)如何缓解多模态幻觉问题（第6节）？（3）三个关键技术（

pureblacker·2025-05-18 06:14

A Survey on Multimodal Large Language Models论文解读

MultimodalLargeLanguageModel(MLLM)representedbyGPT-4Vhasbeenanewrisingresearchhotspot,whichusespowerfulLargeLanguageModels

call me by ur name·2025-05-18 06:43

A Survey on Multimodal Large Language Models for Autonomous Driving

本文是LLM系列文章，针对《ASurveyonMultimodalLargeLanguageModelsforAutonomousDriving》的翻译。

UnknownBody·2025-05-18 05:41

论文阅读：A Survey on Evaluation of Large Language Models

ASurveyonEvaluationofLargeLanguageModels这篇论文是由YupengChang等人撰写的关于大型语言模型（LLMs）评估的综述，题为《ASurveyonEvaluationofLargeLanguageModels

CSPhD-winston-杨帆·2025-05-18 05:10

用 Gensim 实现 Word2Vec 古诗生成

6.1环境搭建与库导入首先安装Gensim及依赖库：bashpipinstallgensimnumpypandas导入必要模块：python运行fromgensim.modelsimportWord2Vec

万能小贤哥·2025-05-18 01:15

AI 大模型应用数据中心的数据压缩架构

AI大模型应用数据中心的数据压缩架构1.背景介绍1.1问题由来在当前数字化时代，人工智能大模型（AILargeModels），如GPT-3、BERT等，广泛应用于自然语言处理（NLP）、图像识别、自动驾驶等多个领域

AI大模型应用实战·2025-05-18 01:41

论文阅读：Training language models to follow instructions with human feedback

TraininglanguagemodelstofollowinstructionswithhumanfeedbackLLMs之InstructGPT：《Traininglanguagemodelstofollowinstructionswithhumanfeedback

CSPhD-winston-杨帆·2025-05-18 00:39

Tina: Tiny Reasoning Models via LoRA

主要内容研究背景与问题：语言模型在多种任务中表现出色，但实现强大的多步推理能力仍是挑战。通过监督微调增强推理存在依赖专家演示、可能导致浅层模仿等问题；强化学习虽能让模型灵活学习，但资源消耗大。本文聚焦于如何通过高效的强化学习在语言模型中经济高效地赋予推理能力。相关工作：介绍了开源推理模型的发展，如STILL、Sky-T1等旨在复制或超越先进推理模型能力；阐述了强化学习在推理任务中的应用，包括引入辅

UnknownBody·2025-05-17 22:52

多模态大语言模型arxiv论文略读（七十八）

AID:AdaptingImage2VideoDiffusionModelsforInstruction-guidedVideoPrediction➡️论文标题：AID:AdaptingImage2VideoDiffusionModelsforInstruction-guidedVideoPrediction

胖头鱼爱算法·2025-05-17 19:58

DeepSeek HuggingFace 70B Llama 版本（DeepSeek-R1-Distill-Llama-70B）

Distill-Llama-70B）前言vllm方式在本地部署DeepSeek-R1-Distill模型SGLang方式在本地部署DeepSeek-R1-Distill模型DeepSeek-R1相关的Models

简简单单OnlineZuozuo·2025-05-17 14:22

ModelScope 模型的上传

本文介绍在ModelScope社区上传模型的两种方式:使用PythonSDK创建并上传模型使用GIT上传模型准备#在进行模型上传之前，请先完成账号注册、登陆。

QQ92058858·2025-05-17 09:45

CAMEL中prompt的使用

一、使用CoT提示创建特定任务Agentfromcamel.agentsimportTaskSpecifyAgentfromcamel.modelsimportModelFactoryfromcamel.typesimportModelPlatformType

Mtscoptor·2025-05-16 17:30

Language models are few-shot learners：语言模型是小样本学习者

摘要近期的研究表明，通过在大规模文本语料上进行预训练，再针对特定任务进行微调，可以在许多自然语言处理任务和基准测试中取得显著提升。虽然这种方法在架构上通常与任务无关，但仍然需要包含成千上万个示例的任务特定微调数据集。相比之下，人类通常只需几个示例或简单的指令就能完成新的语言任务——而当前的自然语言处理系统在这方面仍显不足。在本文中，我们展示了将语言模型规模扩大可以极大提升其在任务无关的小样本学习设

AI专题精讲·2025-05-16 12:50

可解释人工智能（Explainable AI，XAI）

以下是一些主要的XAI技术和方法：###1.模型可解释性方法####a.白盒模型（White-boxModels）白盒模型是指那些本身具有可

Hilda121·2025-05-16 08:18

ubuntu清除缓存

pippipcachepurgecondacondaclean-a-yaptaptcleanapt-getapt-getcleanmodelscopemodelscopeclear-cachehuggingfacerm-rf

Toky Zhu·2025-05-16 00:25

LLaMA Factory 深度调参

quickllm初始指令：llamafactory-clitrain\--stagesft\--do_trainTrue\--model_name_or_path/data/quickllm/qwen3_models

NLP小讲堂·2025-05-15 23:47

推荐频道

Models