E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理
使用SQL-Ollama与自然语言交互SQL数据库的指南
SQL-Ollama是一个专门设计的模板,利用Zephyr-7b模型,通过Ollama在本地运行
推理
,使这一过程变得简单而高效。##核心原理解析SQL-Ollama通过将自然语言转换为
antja_
·
2025-06-30 13:42
数据库
sql
本地运行大型语言模型(LLM)的实践指南
隐私上,数据不需要发送到第三方,避免了商业服务条款的限制;成本方面,无需支付
推理
费用,尤其是对于那些需要大量计算的应用,如长时间的模拟和总结。
yunwu12777
·
2025-06-30 11:58
语言模型
人工智能
自然语言处理
记录一个异常检测库
https://github.com/openvinotoolkit/anomalib/tree/main关于一个异常检测库,包括最先进的算法和功能,如实验管理,超参数优化和边缘
推理
。
STO检测王
·
2025-06-30 09:46
深度学习
YOLOv13:开启目标检测新时代,手把手教你实操
目录一、YOLOv13初印象1.1YOLO系列发展脉络1.2YOLOv13独特之处二、前期准备工作2.1环境搭建2.2依赖安装三、深入使用指南3.1模型验证3.2模型训练3.3模型
推理
四、应用案例与拓展
奔跑吧邓邓子
·
2025-06-30 06:33
必备核心技能
YOLO
目标检测
目标跟踪
人工智能
实操
从入门到实战:YOLOv13 安装与使用全攻略
1.2YOLOv13核心技术亮点1.3性能优势展现二、前期准备2.1系统环境要求2.2软件依赖安装三、安装流程3.1获取源码3.2环境搭建3.3安装验证四、使用指南4.1模型验证4.2模型训练4.3模型
推理
奔跑吧邓邓子
·
2025-06-30 06:33
必备核心技能
YOLO
目标跟踪
人工智能
安装
使用
全攻略
当语言模型”思考”时,它真的在
推理
吗?
这些看似严谨的
推理
过程,到底是一场精妙的模仿秀,还是真正智能的曙光?1.被误解的”思考者”走进任何科技论坛,你都能看到人们对GPT-4解题过程的惊叹:”看这一步一步的推导,它简直像人类一样在思考!”
qq_502428990
·
2025-06-30 04:45
语言模型
人工智能
自然语言处理
MiniMax - M1:开源大模型的革命性突破
MiniMax-M1作为全球首个开源大规模混合架构的
推理
模型,一经发布便引起了广泛关注。它在长上下文处理、
推理
效率和成本控制等方面展现出了卓越的性能,为人工智能的发展带来了新的思路和方向。
·
2025-06-30 01:01
海思Hi3519DV500方案1200万无人机吊舱套板
ISP图像处理能力,支持2FWDR、多级降噪、六轴防抖、全景拼接、多光谱融合等多种传统图像增强和处理算法,支持通过AI算法对输入图像进行实时降躁等处理,为用户提供了卓越的图像处理能力,集成了高效的神经网络
推理
引
weixin_Todd_Wong2010
·
2025-06-30 00:23
嵌入式硬件
AI
前端
边缘计算
图像处理
搜索领域知识图谱的知识
推理
算法研究
搜索领域知识图谱的知识
推理
算法研究关键词:知识图谱、知识
推理
、搜索算法、图神经网络、路径
推理
、规则
推理
、表示学习摘要:本文深入探讨搜索领域中知识图谱的知识
推理
算法。
搜索引擎技术
·
2025-06-29 21:06
知识图谱
算法
人工智能
ai
因果
推理
与因果学习原理与代码实战案例讲解
因果
推理
与因果学习原理与代码实战案例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:因果关系发现、因果推断、因果学习、机器学习、统计方法1.背景介绍
AI天才研究院
·
2025-06-29 21:32
AI大模型企业级应用开发实战
Agentic
AI
实战
AI人工智能与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Trae CN
三模型并行
推理
,最终由规则引擎校验API兼容性(如微信SDK版本匹配)。性能实测数据场景响应时间代码通
WangLinXX
·
2025-06-29 21:00
AI
ai
141G显存H20单机DeepSeek-R1满血FP8版性能测试
H20141G单机8卡,CUDA12.4,vLLMv0.8.3,flashinferv0.2.2#服务化命令#基于知乎大神的推荐出装与前期H800双机生产环境测试,在H20上开启EP、MLA等核心优化参数,实现
推理
吞吐性能最优吞吐量破
·
2025-06-29 19:18
Alluxio在数据索引和模型分发中的核心价值与应用
这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息,进行模型训练和
推理
。这一过程需要强大的数据分发能力,尤其是在多个服务器同时拉取同一份数据时,更是考验基础设施的性能。
Alluxio
·
2025-06-29 15:21
人工智能
深度学习
机器学习
选择Alluxio来解决AI模型训练场景数据访问的五大理由
在AI模型训练尤其是大模型领域,存储系统的性能和稳定性直接决定了模型训练、
推理
、部署任务的效率和成本。
Alluxio
·
2025-06-29 15:51
人工智能
AI
分布式
大数据
语言模型
智能体综述和参考资料整理
目录总体介绍核心组件记忆系统工具系统计划与
推理
开发框架Single-AgentMulti-Agent智能体平台技术实现通信协议角色系统对话记忆MCP协议参考链接总体介绍智能体(AIAgents)是人工智能领域的重要发展方向
木鱼时刻
·
2025-06-29 13:03
大模型
人工智能
Windows系统部署YOLOv5 v6.1版本的训练与
推理
环境保姆级教程
文章目录一·概述二·依赖环境(`prerequisites`)2.1硬件环境2.2软件环境三·环境安装3.1创建并激活虚拟环境3.2安装`Pytorch`与`torchvision`3.3校验`Pytorch`安装3.4下载`YOLOv5``v6.1`源码3.5安装`YOLOv5`依赖3.6下载预训练模型3.7安装其他依赖3.8测试环境安装3.9测试训练流程四·参考链接一·概述本文档主要记录使用工
lujx_1024
·
2025-06-29 12:57
windows
YOLO
大模型的“Tomcat”:一文读懂AI
推理
引擎(Inference Engine)
实战干货:编程严选网1
推理
引擎是啥?从熟悉的“服务器”说起,想象你用Java写好了一个业务应用,如订单处理服务,打成一个JAR或WAR包。这包能直接
·
2025-06-29 10:04
人工智能
Python编程:使用 YOLO 目标检测
与传统的两阶段目标检测方法(如R-CNN系列)不同,YOLO将目标检测任务视为一个单一的回归问题,直接在图像上进行一次
推理
即可预测边界框和类别概率。
倔强老吕
·
2025-06-29 09:37
python
开发语言
【通过pip安装 Open-WebUI 快速使用入门】
它支持各种LLM运行器,如Ollama和OpenAI兼容的API,内置RAG
推理
引擎,使其成为强大的AI部署解决方案。
慕慕涵雪月光白
·
2025-06-29 08:59
llama
代理模式
✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案 (保姆级教程)
——每一位搞TTS的开发者内心独白本文聚焦使用CosyVoice2-0.5B进行TTS
推理
过程中,常见的torchaudio.save()崩溃问题——Segmentationfa
杨靳言先
·
2025-06-29 07:17
语音识别
语音生成
python
人工智能
Bagel: 开源协作式AI数据管理平台的使用指南
Bagel:开源协作式AI数据管理平台的使用指南引言在人工智能和机器学习领域,高质量的数据集对于模型训练和
推理
至关重要。
llzwxh888
·
2025-06-29 07:46
人工智能
python
AI原生应用性能优化:混合
推理
的7个最佳实践
AI原生应用性能优化:混合
推理
的7个最佳实践关键词:AI原生应用、性能优化、混合
推理
、最佳实践、
推理
效率摘要:本文主要探讨了AI原生应用性能优化中混合
推理
的相关内容。
AI天才研究院
·
2025-06-28 23:51
计算
AI大模型企业级应用开发实战
AI人工智能与大数据
AI-native
性能优化
ai
使用vllm部署 Nanonets-OCR-s
使用vLLM部署Nanonets-OCR-s模型的完整指南Nanonets-OCR-s作为基于Qwen2.5-VL-3B的多模态OCR模型,结合vLLM的高效
推理
引擎可显著提升部署性能。
没刮胡子
·
2025-06-28 23:20
软件开发技术实战专栏
Linux服务器技术
人工智能AI
ocr
python
深度学习
探秘阿里云Tair KVCache:大模型
推理
的加速引擎
随着模型规模的不断扩大和
推理
需求的日益增长,大模型
推理
过程中的显存瓶颈问题逐渐凸显,成为制约其发展和应用的关键因素。
云资源服务商
·
2025-06-28 20:56
阿里云
云计算
人工智能
高通 QCS8550 大模型性能深度解析:从算力基准到场景实测的全维度 Benchmark
前言在人工智能技术狂飙突进的时代,大模型正以前所未有的速度重塑各行业生态,从智能客服到多模态交互,从边缘
推理
到端侧部署,其应用场景不断拓展。而这一切革新的背后,离不开底层硬件的强力支撑。
伊利丹~怒风
·
2025-06-28 17:40
Qualcomm
人工智能
AI编程
python
arm
自然语言处理
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战:架构设计、
推理
优化与在线部署闭环
个人简介作者简介:全栈研发,具备端到端系统落地能力,专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”,相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵,就是在观测熵的流动个人主页:观熵个人邮箱:
[email protected]
座右铭:愿科技之光,不止照亮智能,也照亮人心!专栏导航观熵系列专栏导航:AI前沿探索:从大模型进化、多模态交互、AIGC内容生成,到
观熵
·
2025-06-28 16:27
国产大模型部署实战全流程指南
重构
人工智能
Agent
智能体
落地方案
企业级知识库私有化部署:腾讯混元+云容器服务TKE实战
本文以某证券机构智能投研系统为原型,演示如何基于腾讯混元大模型与TKE容器服务实现:千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟
推理
服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据
大熊计算机
·
2025-06-28 14:45
#
腾讯云
语言模型
潜入思维的海洋:SoftCoT++如何让语言模型更聪明
在人工智能的浩瀚星空下,大型语言模型(LLMs)如同一颗颗璀璨的恒星,照亮了从文本生成到复杂
推理
的广阔领域。
步子哥
·
2025-06-28 13:40
智能涌现
语言模型
人工智能
自然语言处理
DeepSeek-V3混合精度
推理
(FP8/BF16)原理与实战全解析
目录摘要混合精度
推理
的背景与意义DeepSeek-V3混合精度架构设计FP8与BF16核心原理详解混合精度
推理
核心实现实践案例:FP8权重转BF16与
推理
部署常见问题与注意事项最佳实践与扩展建议总结参考资料附录
CarlowZJ
·
2025-06-28 06:25
DEEPSEEK-V3
C++day02(基本数据类型)
玩过身份
推理
桌游吗?这类桌游中的角色有不同的身份。比如狼人杀中有狼人、平民、预言家、女巫等等不同身份的身份卡。编程语言的数据也有不同的类型,比如整数类型、字符类型、浮点数类
有点。
·
2025-06-28 06:23
#C++少儿
c++
小模型和大模型的区别在哪里?
训练与运行速度:由于参数数量的差异,小模型的训练和
推理
速度通常比大模型快。这
我非常不满意
·
2025-06-28 03:06
人工智能
深度学习
机器学习
【PyTorch】保存和加载模型
目录■state_dict■用于
推理
的保存和加载模型保存/加载state_dict保存/加载整个模型以TorchScript格式导出/加载模型■保存和加载用于推断和/或恢复训练的一般检查点(Checkpoint
Jackilina_Stone
·
2025-06-28 01:54
#
Deep
Learning
pytorch
python
人工智能
深度学习
模型
PyTorch教程:LSTM语言模型的动态量化技术解析
语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中,模型大小和
推理
速度是两个至关重要的考量因素
怀灏其Prudent
·
2025-06-28 01:52
蔡高厅老师 - 高等数学-阅读笔记 - 01 - 前言、函数【视频第01、02、03、】
多元函数数,微分学、积分学、矢量代数、空间解析几何无穷级数、微分方程,多元函数微分学和积分学目的:高等数学3基:1高等数学的基本知识2高度数学的基本理论3高等数学的基本计算方法提高数学素养培养:抽象思维、逻辑
推理
Franklin
·
2025-06-28 01:20
数学
线性代数
大模型量化
大模型量化是一种优化技术,旨在减少深度学习模型的内存占用和提高
推理
速度,同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。
需要重新演唱
·
2025-06-28 00:13
大模型
量化
onnx-web + yolov8n 在视频流里做
推理
顺着我上一篇文章使用onnxruntime-web运行yolov8-nano
推理
继续说,有朋友在问能不能接入视频流动,实时去识别物品。
CHEN_RUI_2200
·
2025-06-27 23:11
人工智能
YOLO
【大模型学习 | 量化】pytorch量化基础知识(1)
performingcomputationsandstoringtensorsatlowerbitwidthsthanfloatingpointprecision.支持INT8量化,可以降低4倍的模型大小以及显存需求,加速2-4倍的
推理
速度通俗理解
九年义务漏网鲨鱼
·
2025-06-27 23:37
算法
学习
pytorch
人工智能
配置不当的MCP服务器使AI代理系统面临入侵风险
随着代理型AI(AgenticAI)的兴起,MCP服务器正迅速成为增强AI模型
推理
上下文的关键工具。但安全研究人员警告,大量公开共享的MCP服务器存在不安全配置,攻击
FreeBuf-
·
2025-06-27 22:59
服务器
人工智能
运维
昇腾AI生态组件全解析:与英伟达生态的深度对比
一、昇腾核心组件与英伟达对标分析1.
推理
引擎:MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
·
2025-06-27 20:13
暴雨携AMD ,实现大规模 AI 和 Agentic 工作负载性能突破
与上一代相比,大规模AI训练和
推理
工作负载的性价比将提高超过两倍。
BAOYUCompany
·
2025-06-27 17:30
服务器
LLM
推理
入门实践:基于 Hugging Face Transformers 和 vLLM
文章目录1.HuggingFace模型下载2.HuggingFaceTransformers库模型
推理
3.关于prompt的组成:system、user、assistant4.vLLM模型
推理
vLLM的多卡
推理
踩坑
ctrl A_ctrl C_ctrl V
·
2025-06-27 17:57
#
大模型llm
python
自然语言处理
人工智能
vLLM(Virtual Large Language Model) 框架:一个开源的高性能
推理
和服务的框架
vLLM(VirtualLargeLanguageModel)是一个开源的高性能
推理
和服务的框架,专为大语言模型(LLM)设计,旨在优化
推理
速度、内存效率和吞吐量。
彬彬侠
·
2025-06-27 17:54
大模型
vLLM
高性能推理
PagedAttention
python
大模型
DeepSeek 部署中的常见问题及解决方案:从环境配置到性能优化的全流程指南
从环境依赖、资源限制,到
推理
性能和服务稳定性,开发者往往会遇到一系列“踩坑点”。本文将系统梳理DeepSeek模型在部署过程中的典型问题与实践经
慌ZHANG
·
2025-06-27 16:49
人工智能
人工智能
【软件系统架构】系列四:嵌入式软件-M2M 与 NPU 技术对比及协同设计方案
功能能力对比五、应用场景对比六、综合对比总结表七、协同场景建议八、M2M+NPU协同系统设计方案1.系统架构图(简化逻辑)2.模块划分与功能说明三、通信时序图(关键路径)四、数据协议定义(JSON)上报事件(
推理
结果
·
2025-06-27 15:47
MI300X vs H100:DeepSeek 部署在哪个 GPU 上性价比最高?
随着大模型部署和
推理
变得越来越普及,开发者和企业对GPU的选择也越来越挑剔。
卓普云
·
2025-06-27 15:15
技术科普
AIGC
人工智能
Deepseek
H100
MI300x
MiniMax-M1 如何用 MoE 架构实现大模型
推理
的极致效率。
效率的胜利:MiniMaxM1如何用架构智慧挑战AI的“蛮力时代”楔子:一场必要的豪赌在人工智能的“暴力美学”时代,巨头们用无尽的参数和算力堆砌着通往未来的巴别塔。然而,在上海,一家名为MiniMax的初创公司,却选择了一条截然不同的朝圣路。2023年夏,一个看似疯狂的决定震动了观察圈:MiniMax将80%的资源,悉数押注于底层模型架构的一场革命。这并非一次寻常的技术迭代,而是在资源悬殊的牌局上
技术程序猿华锋
·
2025-06-27 13:03
AIGC资讯
开源
架构
OpenAI O3 大模型深度解析:功能、API Key 获取、Python 代码开发教程 (附代码)
引言:OpenAIo3大模型:新一代
推理
引擎的崛起人工智能领域正经历着前所未有的飞速发展,其中大型语言模型(LLM)的能力边界不断被拓宽。
技术程序猿华锋
·
2025-06-27 13:02
AIGC资讯
python
开发语言
ChatGPT
ai
开源新王MiniMax -M1 vLLM本地部署教程:百万级上下文支持成大模型领域新标杆!
一、模型介绍MiniMax-M1是由中国AI公司MiniMax于2025年6月17日推出的全球首个开源大规模混合架构
推理
模型,凭借其百万级上下文支持、超高效计算性能和突破性成本表现,成为大模型领域的新标杆
算家计算
·
2025-06-27 07:17
模型构建
开源
人工智能
MiniMax-M1
模型部署教程
算家云
LnagChain思维链提示技术解析:原理、架构与源码实现(13)
LANGCHAIN思维链提示技术解析:原理、架构与源码实现一、LangChain思维链提示概述1.1思维链提示的基本概念思维链提示(ChainofThought,CoT)是一种通过引导大型语言模型(LLM)生成中间
推理
步骤来提高复杂问题解决能力的技术
Android 小码蜂
·
2025-06-27 07:14
LangChain框架入门
架构
人工智能
langchain
从零开始理解零样本学习:AI人工智能必学技术
零样本学习(Zero-ShotLearning,ZSL)就像AI的“
推理
翻译官”,能让机器通过“文字描述”理解“没见过的图片”。本文将用“认新单词”的生活故事,一步步拆解零
AI学长带你学AI
·
2025-06-27 06:11
学习
人工智能
ai
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他