E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU租用
查看自己电脑上的显卡内存方法
GPU
第一部分:打开cmd输入dxdiag回车第二部分:点击上方显示部分查看可以看到我的这个显卡大小是6G
还不秃顶的计科生
·
2025-06-21 06:28
快捷操作
编程技巧
windows
什么是 QLoRA(Quantized Low-Rank Adaptation,量化低秩适配)
QLoRA结合了4-bit量化(quantization)和LoRA的低秩更新技术,使超大规模模型(如70B参数的LLaMA)能够在单
GPU
上进行高效微调,同时保持与全参数微调相近的性能。
彬彬侠
·
2025-06-21 06:23
大模型
QLoRA
量化低秩适配
PEFT
参数高效微调
transformers
bitsandbytes
python
windows10 + python -m bitsandbytes
python-mbitsandbytes-UDASetupfaileddespite
GPU
beingavailable.Pleaserunthefollowingcommandtogetmoreinformation
mawenju
·
2025-06-21 06:22
自然语言处理
bitsandbytes
chatglm2-6b
大模型
解决docker下的Linux系统调用
GPU
失败
从以下网址下载:https://mirror.cs.uchicago.edu/nvidia-docker/libnvidia-container/stable/#完全移除所有nvidia容器相关包sudoaptpurgelibnvidia-container*nvidia-container*nvidia-docker*#重新安装(确保所有包版本一致)sudodpkg-ilibnvidia-con
Alphapeople
·
2025-06-21 05:18
docker
容器
运维
Linux DRM 理解
本文从如下几个部分介绍1.DRM概念介绍2.对比HW结构分析3.code分析1.DRM概念介绍DRM是DirectRenderManager的缩写:Linux显示子系统结构框架向上提供标准API给到应用使用管理
GPU
And乔
·
2025-06-21 04:12
#
Display
linux
drm
linux drm子系统,Linux DRM那些事-内核代码
root@ubuntu:/home/run/code/rockchip-bsp/kernel/drivers/
gpu
/drm#lsamddrm_atomic.cdrm_crtc_internal.hdrm_fb_cma_helper.cdrm_internal.hdrm_modes.cdrm_rect.cexynosmgarcar-duttmarmadadrm_atomic_helper.cdrm
weixin_39523887
·
2025-06-21 04:41
linux
drm子系统
炸裂提速!PyTorch 2.2 Torch.compile优化器实战:从原理到模型训练加速300%全攻略
一、引言:深度学习训练性能的革命性飞跃1.1传统训练模式的性能瓶颈在深度学习模型训练中,传统PyTorch训练模式面临诸多挑战:计算效率低下:某计算机视觉模型在A100
GPU
上训练,单步迭代耗时达800ms
游戏人生的NPC
·
2025-06-20 14:41
PyTorch
2.2
深度学习进阶
pytorch
人工智能
python
别让
GPU
摸鱼!榨干它!
早期,人们依靠增加
GPU
数量提升模型性能。
九章云极DataCanvas
·
2025-06-20 10:13
技术干货
人工智能
gpu算力
【CUDA】认识CUDA
CUDA的作用CUDA是NVIDIA提供的一种并行计算平台和编程模型,它允许开发者通过编写程序利用
GPU
的强大算力完成复杂的科学运算任务。
Gappsong874
·
2025-06-20 10:38
网络安全
web安全
黑客
大数据
FairyGUI学习
DC就是CPU通知
GPU
进行一次渲染的命令如果DC次数较多会导致游戏卡顿我们可以通过打图集,将小图合并成大图,将本应n次的DC变成1次DC来提高性能知识点二FairyGUI和UGUI以及NGUI的DrawCall
future1412
·
2025-06-20 08:50
学习
unity
游戏
ui
Keras深度学习框架第十四讲:使用TensorFlow进行多
GPU
分布式训练
使用TensorFlow进行多
GPU
分布式训练1、绪论1.1使用TensorFlow进行多
GPU
分布式训练概念TensorFlow是一个流行的开源机器学习框架,它支持多
GPU
分布式训练,允许开发者利用多个
MUKAMO
·
2025-06-20 06:37
AI
Python应用
Keras框架
深度学习
keras
tensorflow
【Pytorch、torchvision、CUDA 各个版本对应关系以及安装指令】
CUDA旨在利用NVIDIA
GPU
(图形处理单元)的强大计算能力来加速各种科学计算、数值模拟和深度学习任务。
GPU
并行计算C
CL_Meng77
·
2025-06-19 18:08
安装教程
基础知识
pytorch
人工智能
linux
服务器
python
GPU
服务器:高性能计算的强大引擎
一、
GPU
服务器概述
GPU
服务器是一种专门为处理复杂计算任务而设计的服务器。它配备了高性能的图形处理单元(
GPU
),能够在深度学习、科学计算、视频编解码等多个领域发挥强大的作用。
海域云李潮海
·
2025-06-19 17:32
服务器
运维
云计算
Open3D--core模块函数详解
1.设备管理(Device)管理计算设备(CPU/
GPU
/CUDA)的配置与状态检查。
X-Vision
·
2025-06-19 15:18
《open3d学习笔记》
python
open3d
游戏引擎架构全景:从硬件到玩法的程序员之旅
一、基石:硬件、OS与第三方王国硬件层:PS5的定制SSD、XboxSeriesX的
GPU
、高端PC的RTX显卡——这些是引擎的物理疆域。代码在此直面硅基世界的限制(内存带宽、浮点算力、缓存延迟)。
还债大湿兄
·
2025-06-19 10:45
游戏引擎
架构
推荐文章:Faster_Mean_Shift -
GPU
加速的像素嵌入框架利器
推荐文章:Faster_Mean_Shift-
GPU
加速的像素嵌入框架利器去发现同类优质开源项目:https://gitcode.com/在生物医学图像处理和细胞追踪领域,高效且精准的算法是必不可少的工具
乌芬维Maisie
·
2025-06-19 04:34
搭建游戏云服务器的配置要求包括哪些条件?
但问题随之而来:搭建游戏服务器时应该
租用
什么样的云服务器?配置如何选才不会资源浪费或性能瓶颈?一、不同类型游戏对云服务器配置要求差异巨大游戏不是单一品类,类型不同,服务器负载模型差异显著:网页游戏(
Jtti
·
2025-06-19 03:01
游戏
服务器
运维
Ubuntu18.04基于Docker和Pycharm搭建Tensorflow-
gpu
训练环境
一、前提:安装好pycharm-professional,dockerce,nvidia-docker2,nvidia-
gpu
驱动。安装方法见各自链接。
城俊BLOG
·
2025-06-19 01:12
学习笔记
Linux
快速分辨率调整工具:一键切换与性能优化
它还帮助用户减轻
GPU
负担,提升系统响应速度,尤其适合低配置设备。用户只需双击可执行文件名“设置与降低分辨率(Ctrl+Alt+F7).exe”,即可轻松操作。然而,在使用过程中,用户应确保
温融冰
·
2025-06-19 00:07
云端算力革命:川翔云电脑如何重新定义创作自由
川翔云电脑以云端算力为支点,通过弹性算力、高效存储、多端接入三大核心优势,让顶级
GPU
资源触手可及。
渲染101专业云渲染
·
2025-06-18 21:46
电脑
云计算
houdini
blender
maya
OpenCV CUDA模块设备层-----用于CUDA 使用纹理内存的一个类模板TextureOff()
ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述cv::cudev::TextureOff是OpenCV的CUDA模块(opencv_cudev)中用于在
GPU
村北头的码农
·
2025-06-18 14:29
OpenCV
opencv
人工智能
计算机视觉
OpenCV CUDA模块图像变形------对图像进行
GPU
加速的仿射变换函数warpAffine()
操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述该函数用于对图像进行
GPU
加速的仿射变换(AffineTransformation
村北头的码农
·
2025-06-18 14:59
OpenCV
opencv
人工智能
计算机视觉
docker容器内运行依赖
GPU
的程序
我的开发环境centos7docker版本为2.10.22080ti显卡,物理机已安装cuda10和对应显卡驱动运行带
GPU
的docker给linux安装nvidia-container-toolkitdistribution
LensonYuan
·
2025-06-18 13:20
项目发布
Python工程落地
深度学习
docker
gpu
tensorflow
cuda
DeepSeek 大型 MoE 模型大规模部署压测学习
-large-scale-ep/以上是对文章《DeployingDeepSeekwithPDDisaggregationandLarge-ScaleExpertParallelismon96 H100
GPU
s
andyguo
·
2025-06-18 12:14
学习
【CUDA编程】OptionalCUDAGuard详解
OptionalCUDAGuard是PyTorch的CUDA工具库(c10/cuda)中用于安全管理
GPU
设备上下文的RAII(ResourceAcquisitionIsInitialization)类
量化投资和人工智能
·
2025-06-18 11:34
CUDA
大模型
人工智能
机器学习
CUDA
云计算
python
c++
CUDA开发工具整理
以下是结合实用性和兼容性的推荐工具组合,涵盖开发、调试、性能优化全流程:️一、核心开发工具1.NVIDIANsight系列(官方专业工具)NsightVisualStudioEdition(Windows主机)功能:CUDA内核调试:在
GPU
·
2025-06-18 11:34
JAX革命性优势解剖:
GPU
/TPU自动并行计算实战
近年来,大模型训练与科学计算对算力的需求呈现指数级增长。传统框架面临硬件绑定深、并行编码复杂、跨平台迁移成本高三大痛点。Google开源的JAX框架通过函数式编程范式、XLA编译优化与自动并行原语,正在重塑高性能计算的技术栈。一、JAX核心优势:三位一体的技术突破1.1函数式编程+即时编译(JIT)与PyTorch/TensorFlow的面向对象范式不同,JAX强制纯函数设计:#传统PyTorch
AI咸鱼保护协会
·
2025-06-18 10:58
分布式
算法
人工智能
gpu算力
计算机
CUDA核函数优化进阶:利用Shared Memory实现矩阵计算10倍加速
在NVIDIAA100上优化1024×1024矩阵乘法时,共享内存策略将计算速度从3.2TFLOPS提升至31.5TFLOPS——本文将揭示如何通过内存访问优化突破
GPU
计算瓶颈。
AI咸鱼保护协会
·
2025-06-18 10:57
人工智能
深度学习
AI
矩阵
CUDA
裸金属服务器和专属主机的区别是什么?
一、定义和概念裸金属服务器和云主机都是
租用
物理服务器的一种方式。裸金属服务器是指没有安装虚拟化技术的物理服务器,用户可以直接使用完整的物理服务器。
zqzgng
·
2025-06-18 05:00
linux
运维
服务器
AWS EC2 终极指南:如何选择预装
GPU
驱动和特定功能的最佳 AMI
选择一个合适的AMI,尤其是需要预装
GPU
驱动或特定软件栈时,能让你跳过繁琐的配置,直接进入核心工作。本文将深入解析AMI分类,并手把手教你找到最适合你需求的镜像。一、为什么AMI选择如此重要?
ivwdcwso
·
2025-06-18 02:38
运维与云原生
aws
云计算
ec2
AMI
GPU
操作系统
使用开源NVIDIA cuOpt加速决策优化
使用开源NVIDIAcuOpt加速决策优化文章目录使用开源NVIDIAcuOpt加速决策优化决策优化的现实挑战供应链优化的复杂性实时决策的挑战计算复杂性的挑战NVIDIAcuOpt:
GPU
加速的决策优化解决方案
扫地的小何尚
·
2025-06-18 02:05
开源
人工智能
GPU
语言模型
自然语言处理
microsoft
✨零基础手把手|Docker+vLLM极速部署OpenAI风格API:5分钟4卡
GPU
推理+避坑指南+完整镜像配置
一、Docker基础命令查看容器状态dockerps#查看运行中的容器dockerps-a#查看所有容器(包括已停止的)查看镜像列表dockerimages#列出本地所有镜像二、镜像与容器操作镜像打包为.tar文件dockersave-o#将镜像导出为.tar文件#示例:dockersave-omy_image.tarvllm/vllm-openai:v0.8.4打包多个镜像到一个文件docker
·
2025-06-17 18:16
torch.load
它支持从文件路径或文件对象加载数据,并可以指定设备(CPU或
GPU
)。
土豆羊626
·
2025-06-17 16:32
机器学习
pytorch
人工智能
python
SnapViewer:解决PyTorch官方内存工具卡死问题,实现高效可视化
在深度学习模型训练过程中,
GPU
内存不足(OutofMemory,OOM)错误是开发者频繁遇到的技术挑战。
·
2025-06-17 16:48
人工智能深度学习pytorch
【FineDance】训练:accelerate config 的作用
accelerateconfig的作用Accelerate是HuggingFace开发的库,用于简化多
GPU
、多机器的分布式训练。
等风来不如迎风去
·
2025-06-17 13:38
AI入门与实战
python
人工智能
动作
舞蹈
【TVM 教程】如何使用 TVM Pass Instrument
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
·
2025-06-17 12:15
【Triton 教程】triton_language.arange
它旨在提供一个基于Python的编程环境,以高效编写自定义DNN计算内核,并能够在现代
GPU
硬件上以最大吞吐量运行。
·
2025-06-17 12:44
配置VSCode+Anaconda的PyTorch
GPU
环境笔记
真就是翻遍了整个互联网才终于让PyTorch在我的电脑上支持CUDA了。叠个甲,我是纯菜鸟,说的不对你也别喷,喷了就是你对。网上的教程都太有年代感了,跟着配置就是到处报错,最后配置出来的也是老版本,用着十分膈应(我个人不喜欢老版本的东西),所以想着记录一下我踩过的坑,让大家以后少走点弯路下面直接进入正题:在此之前,你需要自行完成:安装VSCode以及相关插件(汉化,CodeRunner,Pytho
FurryMonster
·
2025-06-17 12:02
vscode
pytorch
笔记
conda
python
【TVM 教程】如何使用 TVM Pass Infra
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
HyperAI超神经
·
2025-06-17 11:57
TVM
人工智能
深度学习
机器学习
TVM
调用
调用
pass
在线教程
【TVM 教程】如何使用 TVM Pass Instrument
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
HyperAI超神经
·
2025-06-17 11:56
TVM
语言模型
人工智能
机器学习
TVM
编译框架
加速芯片
深度学习
WordToCard,一键将Markdown内容转换为精美知识卡片(使用Qwen3)
让其帮我写一篇关于如何本地部署开源Qwen的文章内容如下为Markdown格式以下是本地部署开源Qwen3大模型的详细步骤,结合了多篇教程的核心内容,帮助你快速完成部署:一、准备工作硬件要求显卡:建议使用支持CUDA的
GPU
程序员猫爪
·
2025-06-16 22:59
word
开源
前端
云计算
人工智能
深入探究 Python 领域 vllm 的核心功能_副本
深入探究Python领域vLLM的核心功能:让大模型推理像高铁一样高效关键词:vLLM、大语言模型推理、PagedAttention、连续批处理、
GPU
优化摘要:大语言模型(LLM)的推理效率一直是工业落地的
Python编程之道
·
2025-06-16 22:58
Python人工智能与大数据
Python编程之道
python
人工智能
开发语言
ai
C++驱动下的现代图形渲染架构与可编程管线实现
随着
GPU
演化,现代图形渲染转向可编程管线,开发者通过着色器控制每一个图形阶段。C++作为底层驱动语言,扮演图形引擎的核心角色:控制渲染状态、资源生命周期、图形任务调度。二、现代渲染管线结构图flo
轻口味
·
2025-06-16 21:53
C++游戏之路
c++
图形渲染
架构
车载3D HMI人机交互与
GPU
算力的平衡
然而,车载3DHMI的高交互性与视觉表现要求对计算能力提出了巨大的挑战,尤其是
GPU
算力的需求。如何平衡3DHMI的算力资源消耗
A阿司匹林
·
2025-06-16 21:51
智能座舱
性能优化
前端
算法
3d
人机交互
鸿蒙开发实战之Image Kit重构美颜相机图像处理管线
一、核心能力突破通过ImageKit实现三大技术革新:硬件加速处理4K图像处理延迟降至16ms(NPU+
GPU
协同)支持10bitHDR管线(BT.2020色域)AI增强算法实时皮肤质感分析(98%毛孔保留率
·
2025-06-16 17:27
harmonyos-next
RK3568 1U机箱,支持电口光口B码对时,适用于电力、交通等
机箱方案在电力、交通等领域具备高可靠性与多接口支持能力,核心特性如下:一、硬件核心配置处理器平台:搭载瑞芯微RK3568四核Cortex-A55处理器(主频1.8GHz-2.0GHz),集成Mali-G52
GPU
深圳信迈主板定制专家
·
2025-06-16 17:28
RK+FPGA
电力新能源
人工智能
fpga开发
arm开发
服务器
运维
PyTorch 是一个 Python 包,提供两个高级功能:具有强大
GPU
加速的张量计算(如 NumPy);基于基于磁带的 autograd 系统构建的深度神经网络;
一、软件介绍文末提供程序和源码下载PyTorch是一个Python包,提供两个高级功能:具有强大
GPU
加速的张量计算(如NumPy);基于基于磁带的autograd系统构建的深度神经网络;您可以在需要时重复使用自己喜欢的
struggle2025
·
2025-06-16 16:19
python
神经网络
开发语言
pytorch
C++
【
GPU
】使用 pytorch 检测 CUDA 安装是否成功
使用pytorch检测CUDA安装是否成功importtorchimportosos.environ["CUDA_VISIBLE_DEVICES"]="0"print(torch.cuda.device_count())print(torch.cuda.is_available())print(torch.backends.cudnn.is_available())print(torch.cuda
comedate
·
2025-06-16 15:43
Taichi
图形学
深度学习
Python实用源码
pytorch
人工智能
python
DeepSeek 遭美国攻击宕机,手把手教你本地部署,手机也支持!
低延迟与高性能本地部署减少网络传输延迟,结合硬件优化(如
GPU
加速),提升实时处理效率。成本可控性长期运营中,大规模调用场景下本地资源成本可能低于云端按需付费模式,尤其适合高频使用企业。离线
MarkGosling
·
2025-06-16 11:45
人工智能
自然语言处理
ai
微信小程序通过nodejs云函数解密获得微信步数
在前一文章我讲了如何通过php后端解密encryptedData获得过去三十一天微信运动步数,这对于已有自己服务器者来说是个不错的选择,在服务器上需要进行十分复杂的配置,但如果仅为了实现这一个功能,去
租用
服务器
wstcl
·
2025-06-16 06:40
微信小程序
小程序
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他