vl

手把手教你搭建AI搜图系统：基于BGE-VL+Milvus的完整实现指南

电商神器：淘宝"拍立淘"让你拍照变订单•设计师救星：3秒找到可商用的高清素材图老搜索vs新搜索的区别老搜索：像查字典，必须输入正确关键词新搜索：像跟人聊天，图片/语音都能搜，还能理解表情包为什么选BGE-VL

·2025-07-29 10:41

基于Milvus和BGE-VL模型实现以图搜图

背景最近再做项目的时候，里面有个AI检索的功能，其中一个点就是要实现以图搜图，也就是用户上传一张图，要找出相似度比较高的图，比如下面这样，第一张是原图，第二张是图中的一部分，用户上传第二张图，要能检索到第一张完整的图实现思路整个实现的核心就是用向量检索，也就是在运营端上传第一张图片的时候，先把整个图片转换为向量，存储到向量数据库中，然后用户在检索的时候，把第二张图再转换为向量，与第一张图的向量进行

时间的痕迹01·2025-07-29 10:40

解决：Python通过OpenAI调用大模型API超时问题

OpenAI调用大模型API进行问答，通过pip命令安装OpenAI：pipinstallopenai-ihttps://pypi.tuna.tsinghua.edu.cn/simple以Qwen2.5-VL

-米兰的小铁匠·2025-07-29 06:09

大学生能做哪些兼职，分享十个靠谱兼职平台让你学到更多知识

你可以通过剪辑电影片段、制作宣传片、甚至是制作个人vl

氧惠好物·2025-07-28 21:55

vLLM专题（三）-快速开始

安装uv后，您可以创建一个新的Python环境，并使用以下命令安装vL

AI专题精讲·2025-07-28 09:38

【代码问题】【模型部署】部署千问时，ImportError: Cannot import available module of Qwen2_5_VLForConditionalGeneration

多半是环境的问题，最主要的是python版本要高python==3.12.9accelerate==1.8.1pipinstallqwen-vl-utils[decord]==0.0.8peft==0.14.0transformers

Catching Star·2025-07-28 06:45

《Qwen2-VL》论文精读【上】：发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当

1、论文地址Qwen2-VL:EnhancingVision-LanguageModel’sPerceptionoftheWorldatAnyResolution2、Qwen2-VL的Github仓库地址该论文发表于

OpenAppAI·2025-07-26 04:42

家庭服务具身智能机器人体系架构

，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL

·2025-07-23 15:52

应用集成体系深度解析：从数据互通到流程协同

双向/多向的交互式通信实时或近实时的响应机制与传统集成区别：数据集成静态数据迁移字段映射应用集成动态功能协同服务调用二、分层支撑体系1.基础支撑层层级功能技术实现关键指标网络集成物理连通性TCP/IP,VL

·2025-07-20 06:32

离线部署视觉模型Qwen2.5-VL方案【企业应用级】

离线多卡部署视觉模型Qwen2.5-VL企业级服务方案一、背景公司网络是有严格限制，所有涉及境外服务器的网站都无法访问，包括docker等镜像源。

LensonYuan·2025-07-20 04:50

LLamaFactory 微调Qwen-VL-3B时报错TypeError: argument of type ‘NoneType‘ is not iterable

LLamaFactory微调Qwen-VL-3B时报错如下：TypeError:argumentoftype'NoneType'isnotiterable修改方式如下所示：进入\src\llamafactory

闲云野鹤01·2025-07-12 06:12

网安学习NO.14

防火墙基础实验传统防火墙配置实验拓扑图PC：ip192.168.10.1255.255.255.0192.168.10.254ipdns114.114.114.114二层交换机vl10exinte0/0swmoacswacvl10exinre0

·2025-07-11 19:59

vLLM 优化与调优：提升模型性能的关键策略

在这种情况下，vL

强哥之神·2025-07-10 11:51

VL53L0X激光测距传感器资料汇总：您的智能测距解决方案

VL53L0X激光测距传感器资料汇总：您的智能测距解决方案去发现同类优质开源项目:https://gitcode.com/VL53L0X激光测距传感器资料汇总项目的核心功能/场景：提供VL53L0X传感器集成

伍熠逸Peg·2025-07-10 00:12

删除南方CASS10.1批量分幅图框模板里的文字（如批注：）（是CAD插件程序，插件后缀.lsp）

另存并改文件后缀名为.lsp即可在CASS当插件使用(defunc:BatchDelComments(/*error*acadAppdocsfolderfilesfilefullpathdocmspentcount)(vl-load-com

发光小阳·2025-07-05 14:18

BAAI/BGE-VL多模态模型部署、原理、代码详解（实现图像文本混合检索），包含BEG-VL多模态模型的本地部署详细步骤及代码原理解析

本文包含BGE-VL多模态模型的本地部署详细步骤及代码原理解析文章目录前言一、模型下载二、计算流程解析1.BGE-VL-base/Large2.BGE-VL-MLLM-s1/s2三、总结前言提示：这里可以添加本文要记录的大概内容

令令小宁·2025-07-04 01:09

AI日报-20250627：谷歌Gemma 3n发布，百亿参数只需2G内存！荣耀启动IPO冲刺2000亿估值！

获数千万融资，拿下全国首张机器人食品经营证4、蚂蚁CGM代码图模型震撼开源：44%修复率登顶SWE-Bench，碾压所有开源模型5、快手Keye-VL大模型震撼开源！视频理解能力秒杀人类，

大数据AI-ZRL·2025-06-29 22:39

使用vllm部署 Nanonets-OCR-s

使用vLLM部署Nanonets-OCR-s模型的完整指南Nanonets-OCR-s作为基于Qwen2.5-VL-3B的多模态OCR模型，结合vLLM的高效推理引擎可显著提升部署性能。

没刮胡子·2025-06-28 23:20

7a系列mrcc xilinx_Xilinx 7 Series FPGA!型号列表

-2C/I(3)(regionalclock)v43.3VonlyVirtex-5XC5VLX50-FF1153-2C/I(3)(regionalclock)v43.3VonlyVirtex-5XC5VL

·2025-06-26 15:27

Are Multimodal Large Language Models Pragmatically Competent Listeners in Simple Reference

具体内容如下：1.研究目的考察LLaVA-NeXT、Qwen2-VL和JanusPro等MLLMs在“导演-匹配者”式参考游戏中，对颜色和空间布局的语境化语用推理能力，验证其是否能像人类一样根据视觉上下文解析指称表达

UnknownBody·2025-06-26 13:46

VLM 系列——Qwen2 VL——论文解读

一、概述1、是什么是一系列多模态大型语言模型（MLLM），其中包括2B、7B、72B三个版本，整体采用视觉编码器（标准VIT输出后面接patchmerger）+LLM形式。比较创新的是统一视觉处理方式（3DCNN统一视频、图片）+图像缩放方式（自适应缩放）+3DLLM位置编码。能够处理包括文本、图像在内的多种数据类型，具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、age

TigerZ*·2025-06-24 01:46

用 LoRA 对 Qwen2.5-VL 模型进行SFT - qwen2_5vl_lora_sft.yaml

用LoRA对Qwen2.5-VL模型进行SFT-qwen2_5vl_lora_sft.yamlflyfishFORCE_TORCHRUN=1llamafactory-clitrainexamples/train_lora

二分掌柜的·2025-06-15 02:37

【MLLM】字节BAGEL多模态理解和生成统一模型

官方说要比Qwen2.5-VL和InternVL-2.5表现好。

山顶夕景·2025-06-08 13:46

LLaMA-Factory 微调 Qwen2-VL 进行人脸情感识别（二）

在上一篇文章中，我们详细介绍了如何使用LLaMA-Factory框架对Qwen2-VL大模型进行微调，以实现人脸情感识别的功能。

anneCoder·2025-06-07 12:30

elasticsearch基本操作笔记

a.左上角三道横->Management->DevToolsb.GET/执行c.执行结果{“name”:“xxxx”,“cluster_name”:“xxxxxxx”,“cluster_uuid”:“vl1UudAoQp-aHWAzyPoMyw

·2025-06-07 07:23

看看Gemini 2.5 Pro怎么说-小米开源MiMo-VL多模态大模型

小米公司在人工智能领域再迈出重要一步，宣布开源了其自研的多模态大模型MiMo-VL(XiaomiMulti-modalVisionLanguagemodel)。这一举措受到了业界的广泛关注。

释迦呼呼·2025-06-04 15:51

华为OD机试 - VLAN资源池 - 回溯、双指针（Python/JS/C/C++ 2025 A卷 100分）

一、题目描述VLAN是一种对局域网设备进行逻辑划分的技术，为了标识不同的VL

哪吒·2025-06-03 16:32

【深度学习新浪潮】以Dify为例的大模型平台的对比分析

可扩展性和安全性五个维度展开对比分析：一、核心功能对比平台核心功能多模型支持插件与工具链Dify低代码开发、RAG增强、Agent自律执行、企业级安全支持GPT-4/5、Claude、Llama3、Gemini及开源模型（如Qwen-VL

小米玄戒Andrew·2025-06-02 21:40

《DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding》论文阅读

本文在DeepSeek-VL以及DeepSeek-V2的基础上来写的，可以先回顾一下这两篇论文的内容：《DeepSeek-VL:TowardsReal-WorldVision-LanguageUnderstanding

来杯芊芊马卡龙·2025-06-01 08:48

23、Swift框架微调实战（3）-Qwen2.5-VL-7B LORA微调OCR数据集

一、模型介绍Qwen2.5-VL是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。

Andy_shenzl·2025-05-31 02:43

字节豆包团队开源 BAGEL - 多模态理解和生成统一模型

吴脑的键客·2025-05-27 00:18

阿里云百炼(2) : 阿里云百炼应用问答_回答图片问题_方案2_提取题目再提问

图片先上传oss,调用视觉理解vl模型解读题目然后问百炼应用效果不错1.代码importcom.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversation

Lxinccode·2025-05-25 23:42

【全网首发】使用 LoRA 微调 Qwen2.5-VL-7B-Instruct：完整流程解析

引言今天凌晨（2025年1月28日），Qwen团队正式发布Qwen2.5-VL，这是Qwen模型家族的旗舰视觉语言模型（VLM）。

HovChen_·2025-05-25 06:53

【读代码】BAGEL：统一多模态理解与生成的模型

该模型在统一架构下实现了三大核心能力：多模态理解：在MME、MMBench等9大评测基准中超越Qwen2.5-VL等主流模型文本生成图像：生成质量媲美SD3等专业生成模型智能图像编辑：支持自由格式编辑、

kakaZhui·2025-05-25 04:13

6.显示屏（LCD1602）

1.1.1概述LCD1602（LiquidCrystalDisplay）是一种工业字符型液晶，能够同时显示16×02即32字符(16列两行)引脚说明第1脚:VSS为电源地第2脚:VDD接5V正电源第3脚:VL

H212202165·2025-05-21 01:11

【多模态大模型实战】搭建通义千问Qwen 2.5-VL-7B-Instruct多模态模型，以及推理微调

模型信息Qwen2.5是Qwen大型语言模型的最新系列。对于Qwen2.5，我们发布了从0.5亿到72亿参数不等的一系列基础语言模型和指令调优语言模型。Qwen2.5在Qwen2的基础上带来了以下改进：拥有了显著更多的知识，并且在编码和数学方面的能力得到了极大提升，这得益于我们在这些领域开发的专门专家模型。在指令遵循、生成长文本（超过8000个标记）、理解结构化数据（如表格）以及生成结构化输出（特

AI智韵·2025-05-20 18:03

【实战指南】Rocky Linux 本地部署 Qwen2.5-VL-Instruct（含 GPU 加速 + 多模态推理脚本）

【实战指南】RockyLinux本地部署Qwen2.5-VL-Instruct（含GPU加速+多模态推理脚本）适用系统：RockyLinux/CentOS/RHEL适用于本地GPU+Docker部署Qwen2.5

神志不清.·2025-05-18 21:34

开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界（一）

一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。

开源技术探险家·2025-05-15 08:34

嵌入式硬件篇---TOF｜PID

文章目录前言1.硬件准备主控芯片ToF模块1.VL53L0X2.TFmini执行机构：电机舵机其他2.硬件连接(1)VL53L0X（I²C接口）(2)TFmini（串口通信）3.ToF模块初始化与数据读取

Ronin-Lotus·2025-05-12 22:43

vlsiffra: 高性能标准单元加法器、乘法器及乘加器创建指南

vlsiffraCreatefastandefficientstandardcellbasedadders,multipliersandmultiply-adders.项目地址:https://gitcode.com/gh_mirrors/vl

吴彬心Quenna·2025-05-08 05:47

Qwen2-VL出现RuntimeError: CUDA error: too many resources requested for launch CUDA kernel errors的解决方案

本文主要介绍了Qwen2-VL出现RuntimeE

爱编程的喵喵·2025-05-07 04:44

Electron Forge【实战】带图片的 AI 聊天

改用支持图片的AI模型qwen-turbo仅支持文字，要想体验图片聊天，需改用qwen-vl-plussrc/initData.ts{id:2,name:"aliyun",title:"阿里--通义千问

朝阳39·2025-05-02 23:50

千问2.5-VL-7B的推理、微调、部署_笔记2

接上篇：部署千问2.5-VL-7B_笔记1-CSDN博客这里主要记录微调过程一、模型微调这里也使用ms-swift对qwen2.5和qwen2-vl进行自我认知微调和图像OCR微调，并对微调后的模型进行推理

山山而川_R·2025-04-26 11:36

从零开始，在AutoDL云服务器上跑通Qwen2.5-VL-7B-Intruct

参考资料：Qwen2-VL视觉大模型快速Qwen2-VL-7B-Instruct部署_failedtodownloadmodelqwen2-vl-instructafterm-CSDN博客1.从零部署qwen2.5

小麻花爱代码·2025-04-22 16:55

基于3A4000及CentOS的银河麒麟V10离线源码编译安装VLC

报错没有revision.txt，这个报错其实很没有价值，就是因为缺少一个revision.txt文件，这个文件里记录的是vlc版本信息，如此而已，之所以会缺失，是因为这个它是在git拉取vl

鱼月半·2025-04-13 14:07

llama-factory微调qwen2.5-vl

前言目前大模型百花齐放，微调方法复杂多样，且教程复杂，工程端想要进行垂域模型适配困难重重，本篇博客详细介绍了qwen2.5-vl的全流程微调过程，包括环境配置、数据集制作、模型训练、模型导出、模型部署、

魔障阿Q·2025-04-13 08:25

开源的7B参数OCR视觉大模型：RolmOCR

1.背景介绍早些时候，AllenInstituteforAI发布了olmOCR，这是一个基于Qwen2-VL-7B视觉语言模型（VLM）的开源工具，用于处理PDF和其他复杂文档的OCR（光学字符识别）。

Panesle·2025-04-11 13:11

月之暗面再次开源Kimi大模型——Kimi-VL-A3B-Instruct 和 Kimi-VL-A3B-Thinking

我们介绍的Kimi-VL，是一种高效的开源专家混合物（MoE）视觉语言模型（VLM），它具有先进的多模态推理能力、长语境理解能力和强大的代理能力，而在其语言解码器（Kimi-VL-A3B）中只需激活2.8B

吴脑的键客·2025-04-10 17:41

如何在本地部署魔搭上千问Qwen2.5-VL-32B-Instruct-AWQ模型在显卡1上面运行推理，并开启api服务

环境：云服务器UbuntuNVIDIAH2096GBQwen2.5-VL-32BQwen2.5-VL-72B问题描述：如何在本地部署魔搭上千问Qwen2.5-VL-32B-Instruct-AWQ模型在显卡

玩人工智能的辣条哥·2025-04-04 19:15

DeepSeek模型体系、开源情况、适用场景及硬件需求介绍

文章目录一、模型体系与开源策略二、核心模型版本对比1.基础编码系列（V1/V2）2.数学增强系列（V2.5/V3）3.多模态系列（R1/VL系列）4.超大规模系列（V3-671B）三、典型部署架构建议四

智联视频超融合平台·2025-03-30 13:14

推荐频道

vl