E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态
邮科OEM摄像头异常行为预警的技术跃迁
一、技术底座:
多模态
感知与边缘计算协同该产品构建“双模态感知-边缘计算-AI决策”架构。
邮科摄像头定制
·
2025-06-18 14:28
人工智能
Latent World Model 架构实战:具身智能中的隐空间建模与状态压缩
LatentWorldModel架构实战:具身智能中的隐空间建模与状态压缩关键词具身智能、LatentWorldModel、状态建模、变分自编码器、感知压缩、动态预测、
多模态
对齐、认知建模、世界模型、状态表示学习摘要在具身智能系统中
观熵
·
2025-06-18 07:40
具身智能(Embodied
AI)
架构
人工智能
具身智能
AI智能体Coze知识库:从使用到实战详解
其核心功能包括知识库管理、对话逻辑编排、
多模态
交互支持等,适用于客服、教育、内容生成、自动化流程等多个场景。1.1Coze的核心优势低代码/无代码开发:可视化编排,无需复杂编程即可构建AI智能体。
非著名架构师
·
2025-06-18 06:32
大模型
知识文档
人工智能
coze智能体
coze实战
AI人工智能语音识别的
多模态
融合应用
AI人工智能语音识别的
多模态
融合应用关键词:语音识别、
多模态
融合、深度学习、神经网络、特征提取、端到端学习、注意力机制摘要:本文深入探讨了AI语音识别中的
多模态
融合技术,从基础原理到实际应用进行了全面剖析
AI天才研究院
·
2025-06-18 02:07
ChatGPT
AI大模型应用入门实战与进阶
人工智能
语音识别
ai
Google AI (Gemini)接入指南
作为一个
多模态
模型,Gemini能够跨多种模态无缝对话并提供最佳响应。它是Google迄今为止打造的最大、最强大的模型,能够理解
子洋丶
·
2025-06-18 01:31
人工智能
多模态
大模型:技术原理与实战 语音
多模态
技术
多模态
大模型:技术原理与实战语音
多模态
技术关键词:
多模态
大模型,语音识别,自然语言处理,深度学习,神经网络,融合技术1.背景介绍1.1问题的由来随着人工智能技术的飞速发展,
多模态
大模型逐渐成为研究热点。
AI智能应用
·
2025-06-18 00:58
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
提示词Prompts(2)
摘要:本文介绍了langchain.prompts中基础的提示词模板的高级用法,包括利用PipelinePrompt组合Prompt使用,
多模态
场景、动态占位符的使用等进行了介绍。
thinking-fish
·
2025-06-17 22:41
LangChain工程化实践
langchain
python
提示词
提示词模板
MiniMax发布MiniMax-M1推理模型,支持100万Token上下文,降低成本。
MiniMax是一家成立于2021年12月的中国人工智能科技公司,专注于
多模态
大模型研发,其核心团队由前商汤科技高管闫俊杰领衔。
我的学校你进不来
·
2025-06-17 20:29
大数据
人工智能
语言模型
后端
前端
端侧可用的 GPT-4V 级单图、多图、视频
多模态
大模型
端侧可用的GPT-4V级单图、多图、视频
多模态
大模型中文|EnglishMiniCPM-V2.6|MiniCPM-Llama3-V2.5|MiniCPM-Llama3-V2.5技术报告M
强化学习曾小健
·
2025-06-17 11:00
多模态MLLM大模型面试指南
音视频
深度学习
多模态
融合_3D目标检测
多模态
融合综述
0前言本篇文章主要想对目前处于探索阶段的3D目标检测中
多模态
融合的方法做一个简单的综述,主要内容为对目前几篇几篇研究工作的总结和对这个研究方面的一些思考。
MAGIC 95
·
2025-06-17 10:54
深度学习多模态融合
深度学习
多模态
融合_综述:3D目标检测
多模态
融合算法
点击上方“计算机视觉life”,选择“星标”快速获得最新干货作者丨蒋天园,来源丨计算机视觉工坊,编辑丨极市平台导读本文是一篇关于3D目标检测中
多模态
融合方法的综述,总结了
多模态
融合的难点和现有研究中的一些方法
张云雷宝宝
·
2025-06-17 10:54
深度学习多模态融合
Agentic AI 深度解析:从零构建自主智能体系统的完整指南
引言:AI的第三次飞跃——AgenticIntelligence随着人工智能的发展步入以大语言模型(LLMs)和
多模态
系统为核心的新阶段,业界已经不再满足于单点任务处理。
legendddh
·
2025-06-17 03:59
人工智能
【GitHub开源项目实战】Nexus-Gen
多模态
统一模型架构深度解析:All-to-All 表示学习与图像生成融合路径
开源实战分析|Nexus-Gen
多模态
统一模型架构深度解析:All-to-All表示学习与图像生成融合路径关键词Nexus-Gen、
多模态
生成、All-to-All、图像生成、扩散模型、MLLM、图像编辑
观熵
·
2025-06-17 01:16
GitHub开源项目实战
架构
学习
github
开源
人工智能
【2025保姆级教程】DeepSeek全场景使用指南:从避坑到高阶玩法
四大核心优势1.技术性价比革命✅混合专家架构(MoE):仅激活370亿参数即可实现GPT-4级别性能,推理成本降低80%✅中文优化:文言文翻译准确率92.3%,远超国际开源模型✅
多模态
支持:支持PDF/
Lucas55555555
·
2025-06-17 01:15
人工智能
#DeepSeek
#AI教程
#大模型应用
AIGC
活动邀请 | SECon 全球软件工程技术大会深圳站将于6月20—21日举办!
从零散知识到流水线、DeepSeek技术前瞻与应用实践、AI时代数据架构的演进、从Agent到Multi-Agent的智能跃迁、高可用架构、垂直深耕:小模型、大智慧、数据分析场景中AI应用、AI+研发的智能化升级、
多模态
生
·
2025-06-16 18:59
github
多模态
..
一、
多模态
是干啥的?大白话:让AI像人一样,同时理解「文字+语音+图像+视频」等多种信息。类比相亲场景:单模态AI:只看照片(图像模态):评价「颜值6分」。只听语音(音频模态):评价「声音好听」。
MYH516
·
2025-06-16 15:14
人工智能
语音识别
大模型推理优化
**在人工智能的基础模型下,各种推理任务涵盖了多个领域,包括常识推理、数学推理、逻辑推理、因果推理、视觉推理、听觉推理、
多模态
推理和代理推理等等。
slient_love
·
2025-06-16 14:06
AI
人工智能
解锁Grok-3的极致潜能:高阶应用与创新实践
引言Grok-3,作为xAI公司推出的第三代人工智能模型,以其强大的推理能力和
多模态
处理能力在全球AI领域掀起了热潮。
淮橘√
·
2025-06-16 14:06
人工智能
机器学习
打造可控可信的智能体调度核心:MCP 中控协议架构实战与服务端实现
个人简介作者简介:全栈研发,具备端到端系统落地能力,专注大模型的压缩部署、
多模态
理解与Agent架构设计。热爱“结构”与“秩序”,相信复杂系统背后总有简洁可控的可能。我叫观熵。
观熵
·
2025-06-16 13:00
Agentic
AI架构实战全流程
架构
人工智能
智能体
Agent
MCP
DeepSeek赋能智慧教育数字化建设方案:DeepSeek在教学场景的应用、智慧教育平台建设方案、教师智能教研支持体系、学生个性化学习支持、实施路径与未来展望
多模态
交互引擎
公众号:优享智库
·
2025-06-16 07:46
DEEPSEEK
AI人工智能
智慧教育
智慧校园
智慧高校
教育大脑
校园大脑
人工智能
大数据
从单模态到
多模态
:空间智能新趋势
从单模态到
多模态
:空间智能新趋势关键词:
多模态
学习、空间智能、跨模态融合、深度学习、计算机视觉、自然语言处理、知识表示摘要:本文深入探讨了从单模态到
多模态
的空间智能演进过程。
AI天才研究院
·
2025-06-16 05:05
ai
专注于医疗领域的
多模态
开源大型语言模型:Lingshu-32B
Lingshu:medicaldomainmultimodallargelanguagemodels一、研究背景与概述Lingshu是一款专注于医疗领域的
多模态
大型语言模型,它在医学视觉问答(VQA)任务和报告生成方面达到了前所未有的性能高度
Open-source-AI
·
2025-06-15 23:55
前沿
语言模型
人工智能
自然语言处理
算法
开源
S4-Driver: Scalable Self-Supervised Driving Multimodal Large Language Model with Spatio-Temporal
文章主要内容总结本文提出了一种基于
多模态
大语言模型(MLLM)的可扩展自监督自动驾驶运动规划框架S4-Driver,旨在解决端到端自动驾驶中依赖人工标注和3D空间推理能力不足的问题。
UnknownBody
·
2025-06-15 15:37
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
Claude 与AR_VR技术的融合应用
Claude与AR/VR技术的融合应用关键词:ClaudeAI、增强现实(AR)、虚拟现实(VR)、人机交互、智能助手、空间计算、
多模态
交互摘要:本文探讨了人工智能助手Claude与AR/VR技术的融合应用场景和技术实现
AIGC应用创新大全
·
2025-06-15 14:59
ar
vr
ai
ChatGPT引领的AI面试攻略系列:AI全栈工程师篇
系列文章目录AI全栈工程师(本文)文章目录系列文章目录一、前言二、面试题1.基础理论与数据处理2.机器学习3.深度学习4.大模型与迁移学习5.计算机视觉6.自然语言处理(NLP)7.
多模态
学习8.AI生成内容
梦想的理由
·
2025-06-15 11:40
深度学习
chatgpt
人工智能
面试
Llama 4 群:原生
多模态
AI 创新新时代的开始
Llama4Scout拥有170亿个活跃参数,包含16位专家模型,是同类产品中全球最佳的
多模态
模型,其性能比所有前代Llama模型都更强大,并且仅需单块NVIDIAH100GPU即可运行。
爱分享的小明
·
2025-06-15 11:04
llama
人工智能
一文读懂特征对齐:
多模态
世界的“月老红线”
文章目录1、引言2、啥是
多模态
数据3、为啥要特征对齐4、特征对齐是咋干活的5、特征对齐的应用场景6、
多模态
领域里特征对齐的方法6.1基于神经网络架构设计6.2基于注意力机制6.3基于损失函数设计6.4基于生成对抗网络
.别止步春天.
·
2025-06-15 10:32
人工智能
计算机视觉
深度学习
2025年4月AI科技领域周报(4.07-4.13):大模型生态加速扩张 通用AI进入场景深耕期
目录一、本周热点回顾1.百度发布全球首个工业级知识增强大模型「文心工业大模型3.0」2.OpenAI发布GPT-5
多模态
开发工具包「GPT-VisionPro」3.特斯拉FSD芯片3.0量产自动驾驶进入
Poseidon、
·
2025-06-15 03:15
人工智能
基于全球顶尖研究机构(智源研究院、斯坦福HAI、微软研究院、Gartner、DeepL等)2025年最新预测报告,结合产业落地矛盾与突破路径,系统分析未来十年AI技术颠覆性演进方向及社会变革
Gartner、DeepL等)2025年最新预测报告,结合产业落地矛盾与突破路径,系统分析未来十年AI技术颠覆性演进方向及社会变革影响:一、基础层重构:从“暴力Scaling”到“智能涌现”的范式迁移1.1原生
多模态
统一架构技术突破
AI编程员
·
2025-06-14 22:06
AI效率&我的思考文章汇总
人工智能
AI编程
系统架构
深度学习
学习
中国版“AI奶奶”反诈实战:DeepSeek-LLM优化+
多模态
链路设计 》
中国版“AI奶奶”反诈实战:DeepSeek-LLM优化+
多模态
链路设计附Prompt模板/部署Checklist|诈骗拦截率提升90%(含Python代码)研究目标实例效果对比:对比分析英国O2公司的
·
2025-06-14 19:20
VLM, Vision-Language Model
VLM现代
多模态
模型一般采用以下三种架构策略模型类型架构组成执行流程简述VLM+LLM(分离)图像→VLM编码文本→LLM解码图像由视觉模型编码后交给语言模型处理,例如CLIP+GPT。较早期方式。
L-李俊漩
·
2025-06-14 11:53
CS5062-ML
语言模型
人工智能
自然语言处理
Multi-Agent 任务协同架构实战:构建智能体角色分工与调度机制
个人简介作者简介:全栈研发,具备端到端系统落地能力,专注大模型的压缩部署、
多模态
理解与Agent架构设计。热爱“结构”与“秩序”,相信复杂系统背后总有简洁可控的可能。我叫观熵。
观熵
·
2025-06-14 05:51
Agentic
AI架构实战全流程
Foundation
Agent
架构
人工智能
智能体
Agent
2026年因果推理模块集成规划方案:技术路径、实施策略与行业赋能
一、技术架构设计:神经符号混合与因果引擎融合1.核心架构分层(参考)视觉/文本/时序
多模态
感知层因果特征提取器神经-符号接口动态因果图谱
百态老人
·
2025-06-14 01:24
数据库
算法
DeepSeek 赋能智慧养老:构建老龄化社会的 AI 守护体系
目录一、引言二、DeepSeek技术特点概述2.1强大的语义理解与生成能力2.2
多模态
融合能力2.3高效的算力支持与优化三、智能养老服务现状剖析3.1养老服务模式与需求3.2智能养老服务的发展与挑战四、
奔跑吧邓邓子
·
2025-06-13 23:10
DeepSeek
实战
DeepSeek
智慧养老
应用
多模态
:Phi-3.5-vision-instruct【4.2B参数】【微软】
2024年时间线:2月,微软“送温暖”法国初创公司Mistral,这是微软投资的第二家大模型公司;3月,微软“活剥”Inflection,开创巨头“垄断新思路”;微软“嫡长子”轻量级模型Phi-3出世,性能堪比GPT-3.5Turbo;4月,微软宣布向G42投资15亿美元,后者会通过Azure运行其AI应用和服务。8月,微软发布Phi-3.5系列——Phi-3.5-mini-instruct(38
u013250861
·
2025-06-13 18:37
VLM/多模态
phi
多模态
大语言模型arxiv论文略读(117)
Training-freeZero-shotComposedImageRetrievalviaWeightedModalityFusionandSimilarity➡️论文标题:Training-freeZero-shotComposedImageRetrievalviaWeightedModalityFusionandSimilarity➡️论文作者:Ren-DiWu,Yu-YenLin,Hue
胖头鱼爱算法
·
2025-06-13 15:42
#
mllm_arxiv
语言模型
深度学习
计算机视觉
论文笔记
论文阅读
多模态
大语言模型arxiv论文略读(118)
VoiceWukong:BenchmarkingDeepfakeVoiceDetection➡️论文标题:VoiceWukong:BenchmarkingDeepfakeVoiceDetection➡️论文作者:ZiweiYan,YanjieZhao,HaoyuWang➡️研究机构:华中科技大学➡️问题背景:随着文本转语音(TTS)和语音转换(VC)技术的快速发展,检测深度伪造语音(Deepfak
胖头鱼爱算法
·
2025-06-13 15:10
#
mllm_arxiv
语言模型
人工智能
自然语言处理
论文笔记
论文阅读
多模态
大语言模型arxiv论文略读(119)
ODE:Open-SetEvaluationofHallucinationsinMultimodalLargeLanguageModels➡️论文标题:ODE:Open-SetEvaluationofHallucinationsinMultimodalLargeLanguageModels➡️论文作者:YahanTu,RuiHu,JitaoSang➡️研究机构:北京交通大学(BeijingJiao
胖头鱼爱算法
·
2025-06-13 15:10
#
mllm_arxiv
语言模型
人工智能
自然语言处理
论文笔记
论文阅读
多模态
大模型研究综述
想要掌握如何将大模型的力量发挥到极致吗?叶梓老师带您深入了解LlamaFactory——一款革命性的大模型微调工具。1小时实战课程,您将学习到如何轻松上手并有效利用LlamaFactory来微调您的模型,以发挥其最大潜力。CSDN教学平台录播地址:https://edu.csdn.net/course/detail/39987视频号(直播分享):sphuYAMr0pGTk27抖音号:4418584
人工智能培训咨询叶梓
·
2025-06-13 11:44
大模型实战
AI大模型
人工智能前沿
人工智能
大模型
智能体
多模态
深度学习
人工智能培训
人工智能讲师
最全大模型术语表,从入门到入土,从此告别小白!
DeepSeek:深度求索推出的中文大模型、腾讯元宝:腾讯社交生态集成助手、豆包:字节跳动轻量化AI助手AI图像Midjourney:艺术创作标杆工具、StableDiffusion:开源文生图框架、通义万相:阿里
多模态
图像生成
sky丶Mamba
·
2025-06-13 10:13
LLM
LLM
AIGC的产品设计演进:从工具到协作者
引言:1.背景与行业现状AIGC的革命性突破技术驱动:从2017年Transformer架构的诞生,到2024年Sora实现动态视频生成,AIGC已突破单一模态(文本/图像),迈向
多模态
融合(音视频、3D
心灵彼岸-诗和远方
·
2025-06-13 07:12
AI全栈攻略
人工智能
AIGC
copilot
Spring AI 实战:第九章、Spring AI MCP之万站直通
大模型时代:我们正站在浪潮之巅第一章、SpringAI入门之DeepSeek调用第二章、SpringAI提示词之玩转AI占卜的艺术第三章、SpringAI结构化输出之告别杂乱无章第四章、SpringAI
多模态
之看图说话
liaokailin
·
2025-06-13 06:07
Spring
AI
实战
人工智能
spring
java
AIGC技术栈全解析:从底层原理到应用开发
AIGC技术栈全解析:从底层原理到应用开发关键词:AIGC技术栈、生成式AI、深度学习模型、
多模态
开发、应用架构设计摘要:本文系统解析AIGC(人工智能生成内容)技术栈的完整体系,从底层硬件基础设施到上层应用开发全链路展开
AI原生应用开发
·
2025-06-13 04:56
AI
原生应用开发
AIGC
ai
AIGC 与 Whisper:推动语音技术进步
AIGC与Whisper:推动语音技术进步关键词:AIGC(生成式人工智能)、Whisper、语音识别、
多模态
交互、大语言模型、语音合成、多任务学习摘要:本文深度解析生成式人工智能(AIGC)与OpenAI
AI天才研究院
·
2025-06-12 23:44
ChatGPT
计算
AI大模型应用入门实战与进阶
AIGC
whisper
ai
AI人工智能领域
多模态
大模型的跨模态融合技术
AI人工智能领域
多模态
大模型的跨模态融合技术关键词:AI人工智能、
多模态
大模型、跨模态融合技术、特征表示、信息交互摘要:本文聚焦于AI人工智能领域
多模态
大模型的跨模态融合技术,全面且深入地探讨了该技术的背景
AI智能探索者
·
2025-06-12 20:51
人工智能
ai
使用RAG-Chroma-Multi-Modal构建
多模态
幻灯片视觉助手
通过
多模态
大型语言模型(LLM),我们现在能够创建一个视觉助手来解析和回答关于图像的问题,而RAG-Chroma-Multi-Modal正是这样一个工具。
tt_jishu
·
2025-06-12 14:41
人工智能
linux
自然语言处理
github
服务器
langchain
【慧游鲁博】【12】小程序端 · 智能导览对接后端文物图片识别功能
完整的处理流程调用后端接口并获取响应处理响应数据构建并添加AI回复消息错误处理机制隐藏加载状态与后端接口的对应关系本次更新将前端chooseImage方法与后端的文物图片识别接口对接,进一步完善了小程序端智能导览模块的
多模态
交互功能
二倍本贝
·
2025-06-12 13:37
小程序
uni-app
vue
软件工程
【慧游鲁博】团队记录5
文章目录进度总览完成细节Part11.图片上传与预加载功能2.前端功能扩展与密码修改页面3.DeepSeek模型微调与Kaggle实验4.前端组件化重构5.用户认证与信息管理完成细节Part21.
多模态
交互
哇哦哇哦~~
·
2025-06-12 13:35
创新实训团队记录
软件工程
团队开发
如何直接将
多模态
数据传递给模型
在当前AI应用中,
多模态
数据处理的需求日益增加。
多模态
数据指的是包含多种类型(如文本、图像、音频等)的输入数据。在这篇文章中,我们将展示如何直接将
多模态
输入传递给模型。
Wurenyu957
·
2025-06-12 12:58
microsoft
鹰盾视频的AI行为检测是怎样的风控?
鹰盾视频构建的AI行为检测风控体系,通过深度融合
多模态
分析、强化学习、联邦学习等前沿技术,打造了从数据感知、智能研判到动态响应的全链条风控闭环。
加油搞钱加油搞钱
·
2025-06-12 01:17
人工智能
音视频
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他