E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
vl
手把手教你搭建AI搜图系统:基于BGE-
VL
+Milvus的完整实现指南
电商神器:淘宝"拍立淘"让你拍照变订单•设计师救星:3秒找到可商用的高清素材图老搜索vs新搜索的区别老搜索:像查字典,必须输入正确关键词新搜索:像跟人聊天,图片/语音都能搜,还能理解表情包为什么选BGE-
VL
·
2025-07-29 10:41
基于Milvus和BGE-
VL
模型实现以图搜图
背景最近再做项目的时候,里面有个AI检索的功能,其中一个点就是要实现以图搜图,也就是用户上传一张图,要找出相似度比较高的图,比如下面这样,第一张是原图,第二张是图中的一部分,用户上传第二张图,要能检索到第一张完整的图实现思路整个实现的核心就是用向量检索,也就是在运营端上传第一张图片的时候,先把整个图片转换为向量,存储到向量数据库中,然后用户在检索的时候,把第二张图再转换为向量,与第一张图的向量进行
时间的痕迹01
·
2025-07-29 10:40
milvus
解决:Python通过OpenAI调用大模型API超时问题
OpenAI调用大模型API进行问答,通过pip命令安装OpenAI:pipinstallopenai-ihttps://pypi.tuna.tsinghua.edu.cn/simple以Qwen2.5-
VL
-米兰的小铁匠
·
2025-07-29 06:09
python
linux
开发语言
大学生能做哪些兼职,分享十个靠谱兼职平台让你学到更多知识
你可以通过剪辑电影片段、制作宣传片、甚至是制作个人
vl
氧惠好物
·
2025-07-28 21:55
vLLM专题(三)-快速开始
安装uv后,您可以创建一个新的Python环境,并使用以下命令安装
vL
AI专题精讲
·
2025-07-28 09:38
大模型专题系列
人工智能
【代码问题】【模型部署】部署千问时,ImportError: Cannot import available module of Qwen2_5_VLForConditionalGeneration
多半是环境的问题,最主要的是python版本要高python==3.12.9accelerate==1.8.1pipinstallqwen-
vl
-utils[decord]==0.0.8peft==0.14.0transformers
Catching Star
·
2025-07-28 06:45
python
pytorch
开发语言
《Qwen2-
VL
》论文精读【上】:发表于2024年10月 Qwen2-
VL
迅速崛起 | 性能与GPT-4o和Claude3.5相当
1、论文地址Qwen2-
VL
:EnhancingVision-LanguageModel’sPerceptionoftheWorldatAnyResolution2、Qwen2-
VL
的Github仓库地址该论文发表于
OpenAppAI
·
2025-07-26 04:42
多模态大模型
Qwen2-VL
家庭服务具身智能机器人体系架构
,软件方面选择ROS系统:底盘控制move_group,机械臂操纵MoveIt,大模型方面采用VLM+LLM:(1)视觉语言模型(VLM),用来实现环境理解与指令解析,候选模型为LLaVA和Qwen-
VL
·
2025-07-23 15:52
应用集成体系深度解析:从数据互通到流程协同
双向/多向的交互式通信实时或近实时的响应机制与传统集成区别:数据集成静态数据迁移字段映射应用集成动态功能协同服务调用二、分层支撑体系1.基础支撑层层级功能技术实现关键指标网络集成物理连通性TCP/IP,
VL
·
2025-07-20 06:32
离线部署视觉模型Qwen2.5-
VL
方案【企业应用级】
离线多卡部署视觉模型Qwen2.5-
VL
企业级服务方案一、背景公司网络是有严格限制,所有涉及境外服务器的网站都无法访问,包括docker等镜像源。
LensonYuan
·
2025-07-20 04:50
机器视觉
自然语言处理
qwenvl
视觉模型
大模型部署
qwen2.5
qwen2.5环境
qwen2.5-vl镜像包
LLamaFactory 微调Qwen-
VL
-3B时报错TypeError: argument of type ‘NoneType‘ is not iterable
LLamaFactory微调Qwen-
VL
-3B时报错如下:TypeError:argumentoftype'NoneType'isnotiterable修改方式如下所示:进入\src\llamafactory
闲云野鹤01
·
2025-07-12 06:12
大模型
linux
视觉检测
transformer
网安学习NO.14
防火墙基础实验传统防火墙配置实验拓扑图PC:ip192.168.10.1255.255.255.0192.168.10.254ipdns114.114.114.114二层交换机
vl
10exinte0/0swmoacswacvl10exinre0
·
2025-07-11 19:59
vLLM 优化与调优:提升模型性能的关键策略
在这种情况下,
vL
强哥之神
·
2025-07-10 11:51
人工智能
深度学习
计算机视觉
deepseek
智能体
vllm
VL
53L0X激光测距传感器资料汇总:您的智能测距解决方案
VL
53L0X激光测距传感器资料汇总:您的智能测距解决方案去发现同类优质开源项目:https://gitcode.com/
VL
53L0X激光测距传感器资料汇总项目的核心功能/场景:提供
VL
53L0X传感器集成
伍熠逸Peg
·
2025-07-10 00:12
删除南方CASS10.1批量分幅图框模板里的文字(如批注:)(是CAD插件程序,插件后缀.lsp)
另存并改文件后缀名为.lsp即可在CASS当插件使用(defunc:BatchDelComments(/*error*acadAppdocsfolderfilesfilefullpathdocmspentcount)(
vl
-load-com
发光小阳
·
2025-07-05 14:18
南方CASS
批量分幅图框模板
CAD插件.lsp
BAAI/BGE-
VL
多模态模型部署、原理、代码详解(实现图像文本混合检索),包含BEG-
VL
多模态模型的本地部署详细步骤及代码原理解析
本文包含BGE-
VL
多模态模型的本地部署详细步骤及代码原理解析文章目录前言一、模型下载二、计算流程解析1.BGE-
VL
-base/Large2.BGE-
VL
-MLLM-s1/s2三、总结前言提示:这里可以添加本文要记录的大概内容
令令小宁
·
2025-07-04 01:09
python
语言模型
自然语言处理
nlp
人工智能
AI日报-20250627:谷歌Gemma 3n发布,百亿参数只需2G内存!荣耀启动IPO冲刺2000亿估值!
获数千万融资,拿下全国首张机器人食品经营证4、蚂蚁CGM代码图模型震撼开源:44%修复率登顶SWE-Bench,碾压所有开源模型5、快手Keye-
VL
大模型震撼开源!视频理解能力秒杀人类,
大数据AI-ZRL
·
2025-06-29 22:39
AI日报
人工智能
业界资讯
自然语言处理
使用vllm部署 Nanonets-OCR-s
使用vLLM部署Nanonets-OCR-s模型的完整指南Nanonets-OCR-s作为基于Qwen2.5-
VL
-3B的多模态OCR模型,结合vLLM的高效推理引擎可显著提升部署性能。
没刮胡子
·
2025-06-28 23:20
软件开发技术实战专栏
Linux服务器技术
人工智能AI
ocr
python
深度学习
7a系列mrcc xilinx_Xilinx 7 Series FPGA!型号列表
-2C/I(3)(regionalclock)v43.3VonlyVirtex-5XC5VLX50-FF1153-2C/I(3)(regionalclock)v43.3VonlyVirtex-5XC5
VL
·
2025-06-26 15:27
Are Multimodal Large Language Models Pragmatically Competent Listeners in Simple Reference
具体内容如下:1.研究目的考察LLaVA-NeXT、Qwen2-
VL
和JanusPro等MLLMs在“导演-匹配者”式参考游戏中,对颜色和空间布局的语境化语用推理能力,验证其是否能像人类一样根据视觉上下文解析指称表达
UnknownBody
·
2025-06-26 13:46
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
VLM 系列——Qwen2
VL
——论文解读
一、概述1、是什么是一系列多模态大型语言模型(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器(标准VIT输出后面接patchmerger)+LLM形式。比较创新的是统一视觉处理方式(3DCNN统一视频、图片)+图像缩放方式(自适应缩放)+3DLLM位置编码。能够处理包括文本、图像在内的多种数据类型,具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、age
TigerZ*
·
2025-06-24 01:46
AIGC算法
AIGC
计算机视觉
人工智能
图像处理
用 LoRA 对 Qwen2.5-
VL
模型进行SFT - qwen2_5
vl
_lora_sft.yaml
用LoRA对Qwen2.5-
VL
模型进行SFT-qwen2_5
vl
_lora_sft.yamlflyfishFORCE_TORCHRUN=1llamafactory-clitrainexamples/train_lora
二分掌柜的
·
2025-06-15 02:37
Qwen
LoRA
Qwen
qwen
【MLLM】字节BAGEL多模态理解和生成统一模型
官方说要比Qwen2.5-
VL
和InternVL-2.5表现好。
山顶夕景
·
2025-06-08 13:46
LLM大模型
#
多模态大模型
多模态
LLM
大模型
多模态生成
LLaMA-Factory 微调 Qwen2-
VL
进行人脸情感识别(二)
在上一篇文章中,我们详细介绍了如何使用LLaMA-Factory框架对Qwen2-
VL
大模型进行微调,以实现人脸情感识别的功能。
anneCoder
·
2025-06-07 12:30
关于大模型的那些事儿
llama
人工智能
深度学习
chatgpt
elasticsearch基本操作笔记
a.左上角三道横->Management->DevToolsb.GET/执行c.执行结果{“name”:“xxxx”,“cluster_name”:“xxxxxxx”,“cluster_uuid”:“
vl
1UudAoQp-aHWAzyPoMyw
·
2025-06-07 07:23
看看Gemini 2.5 Pro怎么说-小米开源MiMo-
VL
多模态大模型
小米公司在人工智能领域再迈出重要一步,宣布开源了其自研的多模态大模型MiMo-
VL
(XiaomiMulti-modalVisionLanguagemodel)。这一举措受到了业界的广泛关注。
释迦呼呼
·
2025-06-04 15:51
AI一千问
开源
人工智能
深度学习
机器学习
算法
华为OD机试 - VLAN资源池 - 回溯、双指针(Python/JS/C/C++ 2025 A卷 100分)
一、题目描述VLAN是一种对局域网设备进行逻辑划分的技术,为了标识不同的
VL
哪 吒
·
2025-06-03 16:32
华为od
python
javascript
【深度学习新浪潮】以Dify为例的大模型平台的对比分析
可扩展性和安全性五个维度展开对比分析:一、核心功能对比平台核心功能多模型支持插件与工具链Dify低代码开发、RAG增强、Agent自律执行、企业级安全支持GPT-4/5、Claude、Llama3、Gemini及开源模型(如Qwen-
VL
小米玄戒Andrew
·
2025-06-02 21:40
深度学习新浪潮
深度学习
人工智能
算法
transformer
计算机视觉
AI
Agent
AI智能体平台
《DeepSeek-
VL
2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding》论文阅读
本文在DeepSeek-
VL
以及DeepSeek-V2的基础上来写的,可以先回顾一下这两篇论文的内容:《DeepSeek-
VL
:TowardsReal-WorldVision-LanguageUnderstanding
来杯芊芊马卡龙
·
2025-06-01 08:48
语言模型
论文阅读
人工智能
DeepSeek
23、Swift框架微调实战(3)-Qwen2.5-
VL
-7B LORA微调OCR数据集
一、模型介绍Qwen2.5-
VL
是阿里通义千问团队开源的视觉语言模型,具有3B、7B和72B三种不同规模,能够识别常见物体、分析图像中的文本、图表等元素,并具备作为视觉Agent的能力。
Andy_shenzl
·
2025-05-31 02:43
大模型学习
swift
微调
LoRA
ocr
字节豆包团队开源 BAGEL - 多模态理解和生成统一模型
在标准多模态理解排行榜上,BAGEL的表现优于Qwen2.5-
VL
和InternVL-2.5等当前顶级开源VLM,其文本到图像的质量可与SD3等强大的专业生成器相媲美。
吴脑的键客
·
2025-05-27 00:18
AI作画
开源
AIGC
人工智能
AI作画
阿里云百炼(2) : 阿里云百炼应用问答_回答图片问题_方案2_提取题目再提问
图片先上传oss,调用视觉理解
vl
模型解读题目然后问百炼应用效果不错1.代码importcom.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversation
Lxinccode
·
2025-05-25 23:42
#
阿里云百炼
阿里云
数据库
云计算
拍照答题
【全网首发】使用 LoRA 微调 Qwen2.5-
VL
-7B-Instruct:完整流程解析
引言今天凌晨(2025年1月28日),Qwen团队正式发布Qwen2.5-
VL
,这是Qwen模型家族的旗舰视觉语言模型(VLM)。
HovChen_
·
2025-05-25 06:53
python
人工智能
自然语言处理
神经网络
深度学习
pytorch
语言模型
【读代码】BAGEL:统一多模态理解与生成的模型
该模型在统一架构下实现了三大核心能力:多模态理解:在MME、MMBench等9大评测基准中超越Qwen2.5-
VL
等主流模型文本生成图像:生成质量媲美SD3等专业生成模型智能图像编辑:支持自由格式编辑、
kakaZhui
·
2025-05-25 04:13
前沿多模态大模型:论文与实战
AIGC
人工智能
大模型
图像生成
6.显示屏(LCD1602)
1.1.1概述LCD1602(LiquidCrystalDisplay)是一种工业字符型液晶,能够同时显示16×02即32字符(16列两行)引脚说明第1脚:VSS为电源地第2脚:VDD接5V正电源第3脚:
VL
H212202165
·
2025-05-21 01:11
单片机
嵌入式硬件
51单片机
【多模态大模型实战】 搭建通义千问Qwen 2.5-
VL
-7B-Instruct多模态模型,以及推理微调
模型信息Qwen2.5是Qwen大型语言模型的最新系列。对于Qwen2.5,我们发布了从0.5亿到72亿参数不等的一系列基础语言模型和指令调优语言模型。Qwen2.5在Qwen2的基础上带来了以下改进:拥有了显著更多的知识,并且在编码和数学方面的能力得到了极大提升,这得益于我们在这些领域开发的专门专家模型。在指令遵循、生成长文本(超过8000个标记)、理解结构化数据(如表格)以及生成结构化输出(特
AI智韵
·
2025-05-20 18:03
大模型论文翻译与实战
人工智能
语言模型
深度学习
【实战指南】Rocky Linux 本地部署 Qwen2.5-
VL
-Instruct(含 GPU 加速 + 多模态推理脚本)
【实战指南】RockyLinux本地部署Qwen2.5-
VL
-Instruct(含GPU加速+多模态推理脚本)适用系统:RockyLinux/CentOS/RHEL适用于本地GPU+Docker部署Qwen2.5
神志不清.
·
2025-05-18 21:34
Ai大模型
ai
人工智能
云计算
开源模型应用落地-qwen模型小试-调用Qwen2-
VL
-7B-Instruct-更清晰地看世界(一)
一、前言学习Qwen2-
VL
,为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。
开源技术探险家
·
2025-05-15 08:34
开源模型-实际应用落地
#
深度学习
AIGC
AI编程
嵌入式硬件篇---TOF|PID
文章目录前言1.硬件准备主控芯片ToF模块1.
VL
53L0X2.TFmini执行机构:电机舵机其他2.硬件连接(1)
VL
53L0X(I²C接口)(2)TFmini(串口通信)3.ToF模块初始化与数据读取
Ronin-Lotus
·
2025-05-12 22:43
算法篇
嵌入式硬件篇
程序代码篇
嵌入式硬件
单片机
c
PID
TOF
vlsiffra: 高性能标准单元加法器、乘法器及乘加器创建指南
vlsiffraCreatefastandefficientstandardcellbasedadders,multipliersandmultiply-adders.项目地址:https://gitcode.com/gh_mirrors/
vl
吴彬心Quenna
·
2025-05-08 05:47
Qwen2-
VL
出现RuntimeError: CUDA error: too many resources requested for launch CUDA kernel errors的解决方案
本文主要介绍了Qwen2-
VL
出现RuntimeE
爱编程的喵喵
·
2025-05-07 04:44
Python基础课程
python
qwen2-vl
RuntimeError
CUDA
error
解决方案
Electron Forge【实战】带图片的 AI 聊天
改用支持图片的AI模型qwen-turbo仅支持文字,要想体验图片聊天,需改用qwen-
vl
-plussrc/initData.ts{id:2,name:"aliyun",title:"阿里--通义千问
朝阳39
·
2025-05-02 23:50
#
Electron
electron
人工智能
javascript
千问2.5-
VL
-7B的推理、微调、部署_笔记2
接上篇:部署千问2.5-
VL
-7B_笔记1-CSDN博客这里主要记录微调过程一、模型微调这里也使用ms-swift对qwen2.5和qwen2-
vl
进行自我认知微调和图像OCR微调,并对微调后的模型进行推理
山山而川_R
·
2025-04-26 11:36
视觉大模型_1
笔记
从零开始,在AutoDL云服务器上跑通Qwen2.5-
VL
-7B-Intruct
参考资料:Qwen2-
VL
视觉大模型快速Qwen2-
VL
-7B-Instruct部署_failedtodownloadmodelqwen2-
vl
-instructafterm-CSDN博客1.从零部署qwen2.5
小麻花爱代码
·
2025-04-22 16:55
服务器
运维
AutoDL
Qwen2.5-VL
基于3A4000及CentOS的银河麒麟V10离线源码编译安装VLC
报错没有revision.txt,这个报错其实很没有价值,就是因为缺少一个revision.txt文件,这个文件里记录的是vlc版本信息,如此而已,之所以会缺失,是因为这个它是在git拉取
vl
鱼月半
·
2025-04-13 14:07
linux
麒麟linux
龙芯开发
银河麒麟
VLC
llama-factory微调qwen2.5-
vl
前言目前大模型百花齐放,微调方法复杂多样,且教程复杂,工程端想要进行垂域模型适配困难重重,本篇博客详细介绍了qwen2.5-
vl
的全流程微调过程,包括环境配置、数据集制作、模型训练、模型导出、模型部署、
魔障阿Q
·
2025-04-13 08:25
llama
人工智能
计算机视觉
开源的7B参数OCR视觉大模型:RolmOCR
1.背景介绍早些时候,AllenInstituteforAI发布了olmOCR,这是一个基于Qwen2-
VL
-7B视觉语言模型(VLM)的开源工具,用于处理PDF和其他复杂文档的OCR(光学字符识别)。
Panesle
·
2025-04-11 13:11
前沿
ocr
人工智能
大模型
开源
月之暗面再次开源Kimi大模型——Kimi-
VL
-A3B-Instruct 和 Kimi-
VL
-A3B-Thinking
我们介绍的Kimi-
VL
,是一种高效的开源专家混合物(MoE)视觉语言模型(VLM),它具有先进的多模态推理能力、长语境理解能力和强大的代理能力,而在其语言解码器(Kimi-
VL
-A3B)中只需激活2.8B
吴脑的键客
·
2025-04-10 17:41
机器人技术
DeepSeek
开源
人工智能
如何在本地部署魔搭上千问Qwen2.5-
VL
-32B-Instruct-AWQ模型在显卡1上面运行推理,并开启api服务
环境:云服务器UbuntuNVIDIAH2096GBQwen2.5-
VL
-32BQwen2.5-
VL
-72B问题描述:如何在本地部署魔搭上千问Qwen2.5-
VL
-32B-Instruct-AWQ模型在显卡
玩人工智能的辣条哥
·
2025-04-04 19:15
实操经验专题
Qwen2.5VL32B
推理
模型部署
AI大模型
通义千问
DeepSeek模型体系、开源情况、适用场景及硬件需求介绍
文章目录一、模型体系与开源策略二、核心模型版本对比1.基础编码系列(V1/V2)2.数学增强系列(V2.5/V3)3.多模态系列(R1/
VL
系列)4.超大规模系列(V3-671B)三、典型部署架构建议四
智联视频超融合平台
·
2025-03-30 13:14
开源
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他