E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cuda(GPU
算力未来演进与多场景创新
从技术架构层面来看,异构计算通过整合CPU、
GPU
、FPGA等多元芯片实现性能跃升,边缘计算则借助分布式节点降低时延并提升响应效率,而量子计算在特定领域的指数级加速潜力已进入验证阶段。
智能计算研究中心
·
2025-03-19 11:06
其他
融合AMD与NVIDIA
GPU
集群的MLOps:异构计算环境中的分布式训练架构实践
在深度学习的背景下,NVIDIA的
CUDA
与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。
·
2025-03-19 11:59
Windows 图形显示驱动开发-WDDM 3.0功能- IOMMU DMA 重新映射(一)
概述直到WDDM3.0,Dxgkrnl仅支持通过1:1物理重新映射实现IOMMU隔离,这意味着
GPU
访问的逻辑页被转换为相同的物理页码。
程序员王马
·
2025-03-19 07:58
windows图形显示驱动开发
驱动开发
Linux中部署DeepSeek R1
DeepSeek-R1本地部署硬件需求表模型规模
GPU
需求CPU需求内存需求存储需求备注1.5B-GTX16504GB(可选)四核i5/Ryzen3000+16GBDDR450GBSSD需4-bit量化
Java探索者 °
·
2025-03-19 07:26
linux
服务器
语言模型
NVIDIA-B200 OFED安装失败解决步骤,实际生产环境故障一例
环境信息系统ubuntu22.04硬件nvidiaB200nvidia-driverubuntu2204-570.124.06
cuda
cuda
-toolkit-12-8报错信息.
清风 001
·
2025-03-19 05:34
AI大模型底层建设
linux
运维
服务器
Ubuntu20.04 RTX4060 AI环境搭建
1.安装步骤0)准备工作使用如下命令创建我们的工作目录:mkdir~/nvidia再使用如下命令进入到上面的目录(接下来的步骤,如无特殊说明,均在该目录下进行):cd~/nvidia1)安装
CUDA
下载并安装
stxinu
·
2025-03-19 05:03
人工智能
人工智能
深入
GPU
渲染流水管线:从顶点到像素的微观世界
现代图形硬件的架构解密与优化实践一、渲染流水线全景解析1.经典渲染管线阶段划分应用阶段几何阶段光栅化阶段像素处理阶段输出合并阶段2.现代
GPU
架构演进SIMT架构特性:NVIDIASM(StreamingMultiprocessor
晴空了无痕
·
2025-03-19 01:00
图形学
GPU渲染管线
程序员必看!DeepSeek全栈开发实战指南:从代码生成到性能优化
这两项技术突破对程序员群体意义重大:通信效率飞跃:DeepEP通过NVLink优化实现
GPU
间158GB/s传输速度,后端开发者训练大模型时可节省60%集群资源推理性能突破:R1模型在H
AI创享派
·
2025-03-18 20:59
后端
自建 DeepSeek 时代已来,联网搜索如何高效实现
基于7B/13B参数量的模型在常规
GPU
服务器上即可获得商业级响应效果,配合Higress开源AI网关的增强能力,开发者可快速构建具备实时联网搜索能力的智能问答系统。
·
2025-03-18 18:38
云原生
yolov4
V4贡献:亲民政策,单
GPU
就能训练的非常好,接下来很多小模块都是这个出发点两大核心方法,从数据层面和网络设计层面来进行改善消融实验,感觉能做的都让他给做了,这工作量不轻全部实验都是单
GPU
完成,不用太担心设备了
zzh-
·
2025-03-18 16:28
笔记
【pytorch(
cuda
)】基于DQN算法的无人机三维城市空间航线规划(Python代码实现)
欢迎来到本博客❤️❤️博主优势:博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。⛳️座右铭:行百里者,半于九十。本文目录如下:目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络训练5.航线规划四、研究挑战与展望2运行结果3参考文献4Python代码实现⛳️赠与读者做科研,涉及到一个深在的
wlz249
·
2025-03-18 16:28
python
pytorch
算法
【保姆级视频教程(一)】YOLOv12环境配置:从零到一,手把手保姆级教程!| 小白也能轻松玩转目标检测!
文章目录1.FlashAttentionWindows端WHL包下载1.1简介1.2下载链接1.3国内镜像站1.4安装方法2.NVIDIA
GPU
计算能力概述2.1简介2.2计算能力版本与
GPU
型号对照表
一只云卷云舒
·
2025-03-18 16:56
YOLOv12保姆级通关教程
YOLO
YOLOv12
flash
attention
GPU
计算能力
算力
使用 WebP 优化
GPU
纹理占用
WebP格式相比JPEG/PNG文件更小,可以减少
GPU
纹理内存占用,提高WebGL/Three.js/3D渲染的性能。为什么WebP能减少
GPU
内存占用?
泫凝
·
2025-03-18 14:45
javascript
前端
LLaMA-Factory 微调训练
LLaMA-Factory微调训练该框架功能,标注-微调-导出-合并-部署,一整条流程都有,而且训练时消耗的
gpu
算力也会小一些一,安装(推荐在linux中训练,win可以用wsl+docker)gitclonehttps
zsh_abc
·
2025-03-18 14:40
llama
docker
深度学习
人工智能
python
linux
指纹浏览器:隐私保护利器与技术实践指南——从身份隐匿到多账号管理的核心解析
▶核心技术解析Canvas指纹:不同设备的抗锯齿算法差异生成唯一哈希值,成为主流追踪手段WebGL指纹:提取
GPU
驱动版本等硬件信息,构建设备画像环境参数交叉验证:时区、屏幕分辨率、
Hotlogin
·
2025-03-18 13:07
前端
llama-factory微调
大模型微调实操--llama-factoryllama-factory环境安装前置准备英伟达显卡驱动更新地址下载NVIDIA官方驱动|NVIDIA
cuda
下载安装地址
CUDA
Toolkit12.2Downloads
AI Echoes
·
2025-03-18 13:05
深度学习
人工智能
机器学习
deepseek
GPU
算力租用平台推荐
当考虑
GPU
算力租用平台时,以下是一些值得推荐的选项,它们各自具有不同的特点和优势:Dcloud:网址:cloud.guaimu.com/u/
gpu
特点:Dcloud是国内知名度较高的云服务器厂商之一,
金枪鱼net
·
2025-03-18 12:31
gpu算力
PyTorch 生态概览:为什么选择动态计算图框架?
其核心优势体现在:动态灵活性:代码即模型,支持即时调试Python原生支持:无缝衔接Python生态高效的
GPU
加速:通过
CUDA
实现透明的硬件加速活跃的社区生态:GitHub贡献者超1.8万人,日均更新
小诸葛IT课堂
·
2025-03-18 07:12
pytorch
人工智能
python
Windows 图形显示驱动开发-WDDM 3.0功能- D3D12 视频编码(一)
关于Direct3D12视频编码在Windows11(WDDM3.0)之前,DirectX12提供了应用程序和驱动程序级接口(API和DDI),以支持多个视频应用程序的
GPU
加速,包括视频解码、视频处理和运动估计
程序员王马
·
2025-03-18 07:38
windows图形显示驱动开发
驱动开发
windows
ubuntu20.04挂起/休眠后无法唤醒,只能强制重启
设备信息OS:Ubuntu20.04.2LTSx86_64Kernel:5.8.0-63-genericShell:zsh5.8DE:GNOMECPU:Inteli5-6300HQ(4)@3.200GHz
GPU
koigh
·
2025-03-18 04:11
ubuntu
nvidia
ubuntu20.04
GPU
基准测试
目前仅在一种机型尝试环境系统版本(cat/etc/issue)ubuntu20.04
gpu
数量及型号(lspci|grepNV|grepVGA)02:00.0VGAcompatiblecontroller
爱吃土豆的猫ttt
·
2025-03-18 04:11
gpu
unitree
Unitreeubuntu18.04首先要安装好ubuntu18.04系统,然后开始安装显卡驱动和
cuda
以及cudnn,这里要注意版本对应,我是3090的显卡,安装的显卡版本是520,然后
cuda
的版本是
Matrixart
·
2025-03-18 00:41
ubuntu
LVI-SAM、VINS-Mono、LIO-SAM算法的阅读参考和m2dgr数据集上的复现(留作学习使用)
一键安装-CSDN博客opencv官网下载4.2.0参考:https://opencv.org/releases/page/3/nvidia驱动安装:ubuntu18.04安装显卡驱动-开始战斗-博客园
cuda
再坚持一下!!!
·
2025-03-18 00:10
学习
torch.unsqueeze:灵活调整张量维度的利器
在深度学习框架PyTorch中,张量(Tensor)是最基本的数据结构,它类似于NumPy中的数组,但可以在
GPU
上运行。在日常的深度学习编程中,我们经常需要调整张量的维度以适应不同的操作和层。
冰蓝蓝
·
2025-03-17 23:07
transformer
transformer
深度学习
如何使用MATLAB进行高效的
GPU
加速深度学习模型训练?
要使用MATLAB进行高效的
GPU
加速深度学习模型训练,可以遵循以下步骤和策略:选择合适的
GPU
硬件:首先,确保您的计算机配备有支持
CUDA
的NVIDIA
GPU
,并且其计算能力至少为3.0或以上。
百态老人
·
2025-03-17 22:56
matlab
深度学习
开发语言
matlab怎么将代码在
gpu
上运行,使用
GPU
加速MATLAB代码?
使用
GPU
加速MATLAB代码?
如果有片海
·
2025-03-17 22:26
Windows 图形显示驱动开发-WDDM 3.0功能- D3D12 增强型屏障(二)
任何依赖于先前
GPU
工作的
GPU
工作都必须在访问相关数据之前同步。增强型屏障接口使用显式SyncBefore和SyncAfter值作为逻辑位字段掩码。
程序员王马
·
2025-03-17 22:24
windows图形显示驱动开发
驱动开发
windows
【技术解密】本地部署 DeepSeek-V3:完整指南
1.运行环境需求1.1硬件要求✅NVIDIA
GPU
(支持
海棠AI实验室
·
2025-03-17 22:54
“智元启示录“
-
AI发展的深度思考与未来展望
人工智能
深度学习
DeepSeek
推荐文章:
GPU
基于顶点着色器的高效动画系统 for Unity.Entities
推荐文章:
GPU
基于顶点着色器的高效动画系统forUnity.Entities去发现同类优质开源项目:https://gitcode.com/1、项目介绍该项目是一个专为Unity.Entities设计的轻量级但极快的
劳治亮
·
2025-03-17 22:53
[Unity]
GPU
动画实现(四)——生成动画数据
目前使用的方法有一个很大缺陷在于基于顶点生成的动画占用的空间很大,一个理想的情况是基于骨骼数据,本文权当抛砖引玉,后续有时间考虑尝试一下基于骨骼数据生成动画。本文内容大量参考自白菊花瓣丶的视频,感谢!生成动画数据需要用到ComputeShader来提高运行的效率,首先在Resources下创建这样一个computeshader,在这里我将其命名为"AnimVertices"。#pragmakern
Zhidai_
·
2025-03-17 22:23
Unity
unity
动画
游戏引擎
[Unity]
GPU
动画实现(一)——介绍
当谈到戴森球计划的时候,我师兄说里面的动画都是一个叫
GPU
动画的东西来实现的,几乎一切图形功能名字扯到
GPU
的时候,通常都是高性能的体现,让我不禁好奇
GPU
动画是什么东西。
Zhidai_
·
2025-03-17 22:22
Unity
unity
动画
游戏引擎
游戏开发
Matlab
GPU
加速技术
1.
GPU
加速简介(1)为什么使用
GPU
加速?CPU擅长处理逻辑复杂的串行任务,而
GPU
拥有数千个流处理器,专为并行计算设计。
算法工程师y
·
2025-03-17 21:50
matlab
开发语言
【大模型实战篇】使用GPTQ量化QwQ-32B微调后的推理模型
低精度运算(如INT8)在
GPU
等硬件上计算效率更高,推理速度可提升2~4倍。我们的任务是,将QwQ-32B微调后的推理模型,也就是bf16的精度,通过量化,压缩到int4。
源泉的小广场
·
2025-03-17 21:19
大模型
大模型量化
推理模型量化
量化
qwq32b
gptq量化
大模型推理
性能调优
pytorch 天花板级别的知识点 你可以不会用 但是不能不知道
实现:使用torch.
cuda
.amp模块。示例:fromtorch.
cuda
.ampimportautocast,GradSc
小赖同学啊
·
2025-03-17 21:17
人工智能
pytorch
人工智能
python
PyTorch中,将`DataLoader`加载的数据高效传输到
GPU
一、数据加载到
GPU
的核心步骤数据预处理与张量转换若原始数据为NumPy数组或Python列表,需先转换为PyTorch张量:X_tensor=torch.from_numpy(X).float()#转换为浮点张量
大霸王龙
·
2025-03-17 20:42
pytorch
人工智能
python
智能体平台架构深度剖析:从底层到应用的全链路解析
其中,
GPU
和服务器构成了强大的计算硬件支撑,确保平台能够应对复杂的计算任务。而数据与OSS(对象存储服务)则如同智能体的“
·
2025-03-17 20:18
人工智能
21-梯度累积原理与实现
一、基本概念在深度学习训练的时候,数据的batchsize大小受到
GPU
内存限制,batchsize大小会影响模型最终的准确性和训练过程的性能。
机器人图像处理
·
2025-03-17 19:34
深度学习算法与模型
人工智能
深度学习
YOLO
Cesium:开源的三维地球可视化引擎
特点:a.高性能:Cesium利用
GPU
加速和流式处理技术,能够处理大规模的地理数据,并实时渲染出逼真的三维地球场景。b.开放性:Cesium是一个开源项目
ZD1
·
2025-03-17 16:13
信息可视化
vllm部署说明和注意事项
1、vllm所在docker镜像可去vllm官网提供的镜像地址拉取地址:UsingDocker—vLLMVllm镜像运行需要不同的
cuda
版本依赖,如上vllm/vllm-openai:v0.7.2需要
ai一小生
·
2025-03-17 14:59
python
人工智能
持续部署
当大模型训练遇上“双向飙车”:DeepSeek开源周 DualPipe解析指南
前言在大模型训练中,传统流水线并行因单向数据流和通信延迟的限制,导致
GPU
利用率不足60%,成为算力瓶颈。
来自于狂人
·
2025-03-17 13:51
人工智能
gpu算力
算法
系统架构
AI 大模型应用数据中心建设:高性能计算与存储架构
AI大模型、数据中心、高性能计算、存储架构、分布式训练、
GPU
加速、数据管理1.背景介绍近年来,人工智能(AI)技术取得了飞速发展,特别是深度学习模型的突破性进展,催生了一系列基于大规模数据训练的强大AI
AI智能涌现深度研究
·
2025-03-17 12:10
AI大模型应用入门实战与进阶
java
python
javascript
kotlin
golang
架构
人工智能
CUDA
内核调优工具ncu的详细使用教程
NVIDIANsightCompute(ncu)是一款用于
CUDA
内核性能分析的工具,帮助开发者优化
CUDA
程序。以下是详细的使用教程和示例说明。
东北豆子哥
·
2025-03-17 09:52
CUDA
数值计算/数值优化
linux
高性能计算
麒麟银河桌面版,成功安装
cuda
12.6,mysql
一、要卸载并禁用nouveau驱动程序,可以按照以下步骤进行:1.确认nouveau驱动的当前状态:首先,你可以使用以下命令查看nouveau驱动是否正在运行:lsmod|grepnouveau如果有输出,说明nouveau驱动正在加载。2.临时禁用nouveau驱动:可以使用modprobe命令来临时禁用nouveau驱动(重启后会恢复加载):sudomodprobe-rnouveau3.永久禁
hitsz_syl
·
2025-03-17 07:37
mysql
银河麒麟
cuda
mysql创建新表,同步数据
importosimportargparseimportglobimportcv2importnumpyasnpimportonnxruntimeimporttqdmimportpymysqlimporttimeimportjsonfromdatetimeimportdatetimeos.environ[“
CUDA
_VISIBLE_DEVICES
hitsz_syl
·
2025-03-17 07:37
mysql
数据库
金融时间序列分析(Yahoo Finance API实战)
这里写目录标题金融时间序列分析(YahooFinanceAPI实战)1.引言2.项目背景与意义3.数据集介绍4.
GPU
加速在数据处理中的应用5.交互式GUI设计与加速处理6.系统整体架构7.数学公式与指标计算
闲人编程
·
2025-03-17 06:24
Python数据分析实战精要
金融
yfinance
时间序列
波动率
数据归一化
数据分析
Dash
PyTorch从入门到精通:探索深度学习新境界
本文将带领您从张量操作基础开始,逐步探索
GPU
加速、动态图机制、框架生态集成等高级主题,最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
lmtealily
·
2025-03-17 04:36
深度学习
pytorch
人工智能
如何测试模型的推理速度
同时,在进行
GPU
测试时,为减少冷启动的状态影响,可以先进行预热。
想要躺平的一枚
·
2025-03-17 02:59
AI图像算法
计算机视觉
NVIDIA下载老版本驱动/
CUDA
/Video Codec SDK的链接,以及一些解码参数说明
NVIDIA下载老版本驱动/
CUDA
/VideoCodecSDK的链接从别的网站抄过来的
CUDA
:https://developer.nvidia.com/
cuda
-toolkit-archive老驱动
landihao
·
2025-03-17 00:43
linux
PyTorch 环境搭建全攻略:
CUDA
/cuDNN 配置与多版本管理技巧
一、环境搭建前的准备工作1.硬件兼容性检测#检查NVIDIA
GPU
型号nvidia-smi#验证
CUDA
支持的ComputeCapabilitylspci|grep-invidia#查看
CUDA
版本兼容性矩阵
小诸葛IT课堂
·
2025-03-17 00:38
pytorch
人工智能
python
Adobe Premiere Pro2023配置要求
GPU
:2GB的
GPU
内存。存储:8GB可用硬盘空间用于安装,安装期间所需的额外可用空间,不能安装在可移动闪存存储器上,还
小魚資源大雜燴
·
2025-03-16 22:28
adobe
windows
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他