E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多模态
【LLM】两篇
多模态
LLM综述MultiModal Large Language Models
note(一)现有的MM-LLM的趋势:(1)从专门强调MM理解对特定模态的生成的进展,并进一步演变为任何到任何模态的转换(例如,MiniGPT-4→MiniGPT-5→NExT-GPT);(2)从MMPT提升到SFT,然后到RLHF,训练管道进行连续细化,努力更好地与人类意图对齐并提高模型的会话交互能力(例如,BLIP-2→InstructBLIP→DRESS);(3)实施多样化模态扩展(例如,
心上之秋
·
2025-06-24 07:49
语言模型
人工智能
自然语言处理
VLM 系列——Qwen2 VL——论文解读
一、概述1、是什么是一系列
多模态
大型语言模型(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器(标准VIT输出后面接patchmerger)+LLM形式。
TigerZ*
·
2025-06-24 01:46
AIGC算法
AIGC
计算机视觉
人工智能
图像处理
文心快码发布AI IDE,智能体自动写代码,设计稿一键转代码,打造开发者个性化IDE
百度副总裁陈洋现场发布了文心快码独立AI原生开发环境工具——ComateAIIDE,是行业首个
多模态
、多智能体协同的AIIDE,首创设计稿一键转代码,开箱即用,为国内企业和开发者打造高效、智能、安全可靠的
猫头虎
·
2025-06-23 23:02
猫头虎精品博客专栏
人工智能
ide
AI编程
idea
百度
文心快码
AI
IDE
大语言模型应用指南:
多模态
大语言模型
大语言模型应用指南:
多模态
大语言模型作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:
多模态
大语言模型(MMLM),多媒体数据处理,自然语言理解,图像文本生成
AI天才研究院
·
2025-06-23 19:07
AI人工智能与大数据
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Milvus 向量数据库详解与实践指南
它支持近似最近邻搜索(ANN),适用于图像检索、自然语言处理(NLP)、推荐系统、语义搜索、智能问答、
多模态
数据处理等AI应用场景。
JJJ@666
·
2025-06-23 18:28
基础知识(人工智能AI)
milvus
向量数据库
图像检索
推荐系统
文心一言(ERNIE Bot):百度打造的知识增强大语言模型
1.产品概述文心一言(ERNIEBot)是百度自主研发的知识增强大语言模型,于2023年3月16日正式发布,对标OpenAI的ChatGPT,具备文本生成、
多模态
交互、逻辑推理、中文理解等能力。
明似水
·
2025-06-23 18:25
AI
文心一言
百度
语言模型
【AI论文】MultiFinBen:一个用于金融大语言模型评估的多语言、
多模态
且具备难度感知能力的基准测试集
我们推出了MultiFinBen,这是首个针对全球金融领域定制的多语言、
多模态
基准测试集,用于在特定领域任务上跨模态(文本、视觉、音频)和语言环境(单语言、双语、多语言)对大型语言模型进行评估。
东临碣石82
·
2025-06-23 16:46
人工智能
金融
语言模型
大模型驱动核工业智能化的技术架构与核心突破
从数据闭环到自主决策,解码核能系统的AI技术演进路径Deepoc大模型通过构建多维度技术体系,在知识结构化处理、逻辑推理优化及
多模态
验证机制等方向取得关键技术突破,有效提升生成内容与行业知识库的匹配度。
Deepoch
·
2025-06-23 16:15
人工智能
创业创新
语言模型
【读代码】深入解析Ragas:RAG应用效果评估最好的工具
项目采用模块化架构设计,核心功能包括:#典型架构模块├──metrics#50+评估指标实现├──testset#测试集生成系统├──embeddings#
多模态
嵌入支持├──integrations#
kakaZhui
·
2025-06-23 12:45
大模型实践之知识库RAG
LLM
Agent
人工智能
AIGC
RAG
Ragas
【RAG优化】深度解析开源项目MinerU:从PDF解析到
多模态
理解的工业级解决方案
项目始于大模型预训练数据清洗需求,现已成为支持
多模态
文档理解的工业级解决方案。
kakaZhui
·
2025-06-23 11:43
pdf
大模型
LLM
RAG
文档解析
二、【LLaMA-Factory实战】数据工程全流程:从格式规范到高质量数据集构建
二、数据工程核心架构图原始数据数据格式规范Alpaca格式
多模态
格式自定义格式规范数据清洗增强相似度去重噪声过滤合成数据生成优质数据注册验证数据集注册格式校验质量评估训练
陈奕昆
·
2025-06-23 11:40
大模型微调教程
llama
python
前端
人工智能
大模型微调
LLaMA-Factory
多模态
训练:从文本到图像的综合应用
摘要本文深入探讨了LLaMA-Factory框架中的
多模态
训练技术。从基础的文本-图像对齐到复杂的
多模态
理解,全面介绍了如何利用LLaMA-Factory进行
多模态
模型的训练和优化。
CarlowZJ
·
2025-06-23 11:40
AI应用落地+大模型微调
llama
人工智能
LLaMA-Factory
【LLaMA-Factory 实战系列】一、数据准备篇 - 从文本到
多模态
的完整流程
【LLaMA-Factory实战系列】一、数据准备篇-从文本到
多模态
的完整流程1.引言2.LLaMA-Factory数据格式概述2.1Alpaca格式2.2ShareGPT格式3.文本数据准备3.1Alpaca
Zhijun.li@Studio
·
2025-06-23 11:08
llama
人工智能
llama-factory
多模态
大模型
视觉大语言模型
AI日报-20250617:MiniMax-M1震撼发布!Kimi-Dev-72B代码模型开源!MetaLlama3.1突破!
1、松下OmniFlow
多模态
大模型震撼发布:文本、图像、音频自由切换新时代!
大数据AI-ZRL
·
2025-06-23 08:51
AI日报
人工智能
业界资讯
[AI] 解密人工智能:深度分析与未来趋势的全景探索
人工智能的最新发展趋势2.1超大规模预训练模型的突破2.2自监督学习的崛起2.3边缘AI与算力优化3.人工智能的跨领域应用3.1医疗AI3.2金融AI3.3工业AI4.人工智能的未来展望4.1更强大的
多模态
模型
代码行者123
·
2025-06-23 01:28
人工智能
搜索引擎蜘蛛的智能抓取策略:技术解构与动态博弈的深层逻辑
###一、
多模态
解析引擎的量子化演进现代蜘蛛的解析引擎已突破传统HTML解析的局限,形成
多模态
感知架构:**1.时空感知型解析器**-**视觉权重建模**:通过卷积神经网络(CNN)分析页面视觉热区,将首屏内容权重提升
我爱学习558
·
2025-06-22 14:53
搜索引擎蜘蛛2
搜索引擎
python
javascript
Poe平台的全新突破!探索即梦3.0与Seedance1.0Lite的无限可能
此次更新刷新了我们对于
多模态
内容创作的认知,为创作者提供了从静态图像到动态
人工智能我来了
·
2025-06-22 13:12
人工智能
AI
人工智能
计算机视觉
深度学习
探索AI人工智能领域DALL·E 2的核心功能
探索AI人工智能领域DALL·E2的核心功能关键词:AI人工智能、DALL·E2、图像生成、核心功能、
多模态
交互摘要:本文深入探索了AI人工智能领域中DALL·E2的核心功能。
AI大模型应用之禅
·
2025-06-22 11:59
人工智能
DALL·E
2
ai
一文读懂CompassRank榜单的评测指标【
多模态
学习实战手册】
大家好,我是大F,深耕AI算法十余年,互联网大厂技术岗。分享AI算法干货、技术心得。欢迎关注《大模型理论和实战》、《DeepSeek技术解析和实战》,一起探索技术的无限可能!1.前言榜单链接:CompassRankCompassRank是一个中立且全面的性能榜单,作为大模型评测体系OpenCompass2.0中各类榜单的承载平台。它覆盖多领域、多任务下的模型性能,并定期更新,以提供动态的行业洞察。
大F的智能小课
·
2025-06-22 04:16
大模型理论和实战
人工智能
字节Bagel
多模态
大模型解读
github:https://github.com/bytedance-seed/BAGELpaper:https://arxiv.org/pdf/2505.14683本文是一篇关于
多模态
预训练模型BAGEL
小李飞刀李寻欢
·
2025-06-22 01:29
OpenSource
大模型
paper
github
代码
解读
即梦3.0文生图:AI绘画领域的革命性突破与行业格局重塑
这款被誉为“中文设计领域原子级突破”的模型,不仅以2K原生分辨率、3秒极速生成和94%的中文字符可用率刷新行业标准,更通过
多模态
语义对齐技术彻底解决了困扰AI绘图多年的“中文诅咒”——字体错乱、排版崩坏等问题
MidJourney中文版
·
2025-06-22 01:59
AI作画
人工智能
Llama 4模型卡片及提示词模板
该模型针对
多模态
理解、多语言任务、编码、工具调用及智能体系统进行了优化,知识截止日期为2024年8月。提示模板Youareanexpertco
大模型与Agent智能体
·
2025-06-21 23:44
A2A
MCP
Llama
4
基于大模型的尿毒症预测及综合治疗方案技术方案
目录一、算法实现伪代码1.尿毒症风险预测模型(基于
多模态
融合Transformer)2.动态治疗方案生成算法二、系统模块流程图1.尿毒症智能预测系统流程2.治疗方案生成子系统流程三、系统集成方案1.系统架构设计
LCG元
·
2025-06-21 13:40
大模型医疗研究-技术方向
技术方案
机器学习
深度学习
人工智能
【大模型开发】Hugging Face的Transformers库详解介绍与案例
深入解析HuggingFaceTransformers及开源大模型微调实践HuggingFaceTransformers已成为自然语言处理(NLP)乃至
多模态
(跨语言、图像、音频等)应用中最为流行、功能最完备的开源框架之一
云博士的AI课堂
·
2025-06-21 11:01
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
transformer
huggingface
大模型技术
大模型开发
deepseek
机器学习
深度学习
学习笔记丨数字信号处理(DSP)的应用——图像处理篇
在图像处理中的关键应用及技术细节:目录图像增强(ImageEnhancement)图像压缩(ImageCompression)特征提取(FeatureExtraction)实时图像处理(Real-TimeProcessing)
多模态
图像融合
棱镜研途
·
2025-06-21 02:02
学习笔记
信号处理
图像处理
人工智能
深度学习cnn下水管道缺陷自动识别技术综述
技术架构体系
多模态
数据采集层传感设备矩阵工业内窥镜:管径≥50mm内
QQ_1309399183
·
2025-06-20 21:28
计算机视觉实战项目集锦
深度学习
cnn
人工智能
神经网络
机器学习
实战项目
管道缺陷检测
使用Xinference与LangChain实现强大的模型推理
Xinference是一款强大的推理库,它能够无缝地为LLMs、语音识别模型以及
多模态
模型提供服务。
yunwu12777
·
2025-06-20 16:53
langchain
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、音频、识别和处理解决方案
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布:该公司将再次参加2025年国际消费电子展(CES2025),并将在本届CES上展出一系列由人工智能(AI)驱动的全新空间音效、语音捕获与降噪、音视频
多模态
电子科技圈
·
2025-06-20 15:47
XMOS
人工智能
音视频
嵌入式硬件
科技
物联网
mcu
iot
激光雷达与视频融合(DeepFusion)的
多模态
高精度目标定位
激光雷达与视频融合(DeepFusion)的
多模态
高精度目标定位激光雷达与视频融合的
多模态
高精度目标定位技术结合了激光雷达的高精度三维测距能力和视频传感器的丰富纹理信息,能够在复杂环境中实现更精准的目标检测
moonsims
·
2025-06-20 14:40
人工智能
领略生成式AI在AI人工智能中的风采
领略生成式AI在AI人工智能中的风采关键词:生成式AI、判别式AI、大语言模型、扩散模型、
多模态
生成摘要:本文将带你走进生成式AI的奇妙世界,用“做蛋糕”“玩拼图”等生活案例,从基础概念到前沿应用,一步步解析生成式
AI大模型应用实战
·
2025-06-20 12:27
人工智能
ai
【深度学习|学习笔记】预训练(Pretraining)的作用有哪些?
前言✅一、提高模型性能✅二、降低训练成本✅三、迁移学习能力强✅四、模型结构验证过,可靠性高✅五、促进
多模态
和复杂任务发展总结如何将自己的遥感数据(输入波段为17)用作DenseNet121
985小水博一枚呀
·
2025-06-20 10:39
深度学习
学习笔记
深度学习
学习
笔记
人工智能
PolyTouch:一种利用触觉扩散策略实现丰富接触操作的稳健
多模态
触觉传感器
25年4月来自MIT和TRI的论文“PolyTouch:ARobustMulti-ModalTactileSensorforContact-richManipulationUsingTactile-DiffusionPolicies”。在非结构化的家庭环境中实现稳健的灵巧操作仍然是机器人技术的重大挑战。即使采用最先进的机器人学习方法,触觉无关控制策略(即仅依赖外部视觉和/或本体感觉的策略)也常常由
三谷秋水
·
2025-06-20 08:20
智能体
计算机视觉
机器学习
机器人
计算机视觉
人工智能
深度学习
智能体应用最新进展:从单点工具到企业级系统的架构演进
智能体以其自主决策、
多模态
交互以及持续进化的能力,正逐渐成为推动各行业创新与发展的核心驱动力。
金融RPA机器人丨实在智能
·
2025-06-20 07:47
架构
AI搜索的终极预测:从技术颠覆到生态重构
一、技术革命:深度思考与
多模态
交互重塑搜索内核AI搜索的底层逻辑正在经历从“信息索引”到“认知引擎”的质变。深度思考能力的普及标志着搜索技术进入新纪元。
白雪讲堂
·
2025-06-20 06:10
人工智能
搜索引擎
文心一言
gpt
大数据
百度大模型免费上线,学AI大模型就选近屿智能
文心大模型4.5是百度自主研发的新一代原生
多模态
基础大模型,通过多个模态联合建模实现协同优化,提高
多模态
理解能力,精进语言能力,提升理解、生成、逻辑、记忆能力和去幻觉、逻辑推理、代码能力,甚至还能理解网络笑话
·
2025-06-20 04:29
【AI大模型】RAG 架构图解:从基础到高级的7种模式,看到就是赚到!!
前言「RAG技术通过在AI生成过程中引入外部知识检索,从基础的文档查询发展到
多模态
、Multi-Agent体协同的智能架构,让AI回答更准确、更全面」「核心组件」嵌入模型:将文本转换为向量表示生成模型:
AI大模型datian
·
2025-06-20 02:42
人工智能
架构
语言模型
AI大模型
RAG
agi
LLM
2025年大模型学习新攻略!掌握未来AI的关键技能
1.公开课(视频):李宏毅机器学习斯坦福CS336:从零开始构建语言模型卡内基梅隆大学【
多模态
机器学习】RAGFromScratchHuggingFaceNLP课程2.机器学习和编程基础:pytorch
AI大模型-大飞
·
2025-06-19 21:09
人工智能
产品经理
程序员
Agent
AI
大模型
大模型教程
【打卡】基金金融问答
GLM支持更长的上下文(128k),具备强大的
多模态
能力,并且推
来两个炸鸡腿
·
2025-06-19 21:05
金融
AIGC
谷歌正式推出 Gemini 2.5 系列模型,使 AI 推理性能提升30%。
谷歌于2025年6月正式推出Gemini2.5系列模型,核心聚焦推理效率与
多模态
能力升级,具体解读如下:一、三大模型定位与技术亮点Gemini2.5Pro角色定位:主攻复杂推理与
多模态
分析
·
2025-06-19 20:30
从语言行为到调用协议:智能体通信的五种底层格式
个人简介作者简介:全栈研发,具备端到端系统落地能力,专注大模型的压缩部署、
多模态
理解与Agent架构设计。热爱“结构”与“秩序”,相信复杂系统背后总有简洁可控的可能。我叫观熵。
观熵
·
2025-06-19 18:16
Agentic
AI架构实战全流程
人工智能
智能体
多模态
大语言模型arxiv论文略读(127)
WhenSAM2MeetsVideoCamouflagedObjectSegmentation:AComprehensiveEvaluationandAdaptation➡️论文标题:WhenSAM2MeetsVideoCamouflagedObjectSegmentation:AComprehensiveEvaluationandAdaptation➡️论文作者:YuliZhou,GuoleiS
胖头鱼爱算法
·
2025-06-19 17:03
#
mllm_arxiv
语言模型
人工智能
自然语言处理
论文笔记
论文阅读
SiLM9409双通道H桥电机驱动器深度解析——紧凑型24V系统电机控制解决方案
一、产品概述:
多模态
驱动架构SiLM9409是一款面向12V/24V工业系统的双通道H桥驱动器,采用NFET+PFET复合功率级设计,具备三种核心工作模式:双直流电机驱动:独立控制两个直流电机(如机器人双轮差速系统
Hailey深力科
·
2025-06-19 16:55
双H桥驱动器
SiLM9409
步进电机驱动
直流电机
1.4 万智能体上岗、1.7 万数字人直播,揭秘今年京东 618 背后的 AI 力量
京东大模型经过2年发展,已经具备从3B到750B的全尺寸、
多模态
序列,能满足内部各种产业需求。今年京东618期间,大模型调用量相较去年11.11上升130%。
CSDN资讯
·
2025-06-19 15:51
人工智能
京东
AI人工智能领域DALL·E 2的技术优化方向
AI人工智能领域DALL·E2的技术优化方向关键词:DALL·E2、文本到图像生成、扩散模型、计算效率、图像质量、
多模态
学习、模型压缩摘要:本文深入探讨了OpenAI的DALL·E2模型在人工智能领域的技术优化方向
AI大模型应用工坊
·
2025-06-19 15:50
人工智能
DALL·E
2
ai
RAGFlow是一个基于深度文档理解的开源RAG引擎
其核心优势在于结合
多模态
文档解析和智能分段技术,优化传统RAG流程中的信息提取与答案生成效果。
lyh1344
·
2025-06-19 08:30
深度优先
如何用一位AI面试官,撑起万人校招现场?——得贤L5级别AI面试官Agent
这是一款基于AIGC与虚拟人技术打造的L5级AI面试官Agent,由近屿智能自研
多模态
大模型“近屿超脑”驱动,经过四代产品迭代与11个行业落地应用打磨,实现了从千人千问到三轮智能追问、从口型对齐实时视频到精准评分与报告秒出的全面跃
AI得贤招聘官
·
2025-06-19 04:37
人工智能
面试
科技
AIGC
职场和发展
文献解读-病理影像
多模态
模型预测乳腺癌新辅助化疗的病理完全反应
期刊:ScienceAdvances影响因子:11.7,中科院1区Top发表时间:2025年4月30日概要:首都医科大学宣武医院放射科卢洁教授团队近日(2025年5月)在中科院1区top期刊《SciAdv》(IF=11.7)上发表研究“Amultimodalandfullyautomatedsystemforpredictionofpathologicalcompleteresponsetoneo
今天也不想动
·
2025-06-19 00:37
文献解读
病理组学
影像组学
文献解读
多模态
病理影像组学
【MoodVine】基于AIGC生成与
多模态
交互的动态可视化情绪疗愈系统 项目实施计划
一、项目背景1.1研究背景(一)社会心理健康危机加剧,情绪管理需求爆发当代社会正深陷“情绪赤字”的全球性困境,高压生活模式催生出普遍的心理亚健康状态。中国超3亿人存在睡眠障碍,全球抑郁症患者年增长率达18%,焦虑症患者中“隐形病患”占比超过60%,折射出情绪问题已从隐性痛点演变为显性社会危机。在职场内卷加剧、代际沟通断层、社交关系虚拟化的多重夹击下,传统情绪疏导机制逐渐失效——76.2%的受访者坦
沈春庭
·
2025-06-18 20:43
MoodVine
项目博客
语音识别
react.js
java
深度学习
开源
github
prompt
工控领域
多模态
LLM测试集
MMADMultimodalLargeLanguageModelsinIndustrialAnomalyDetection从4个数据集收集8366样本,涵盖38类工业产品,生成39,672个样本,覆盖7个核心任务。https://github.com/jam-cc/MMAD.githttps://huggingface.co/datasets/jiang-cc/MMAD天池铝型材表面缺陷数据集数据
liliangcsdn
·
2025-06-18 20:42
语言模型
人工智能
智能体工具
全链路赋能:覆盖感知(
多模态
交互)、决策(规则引擎/强化学习)、执行(工具调用)全流程。二、主流开发工具与平台对比工具名称
元智启
·
2025-06-18 14:30
智能体
人工智能
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他