E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语言模型
谷歌:对比学习将LLM转为嵌入模型
GeneralizableEmbeddingsfromGemini来源:arXiv,2503.07891摘要在本报告中,我们介绍了Gemini嵌入,这是一种最先进的嵌入模型,它利用了Gemini、Google最有能力的大型
语言模型
的力量
大模型任我行
·
2025-03-21 13:59
大模型-成熟基座
人工智能
自然语言处理
语言模型
论文笔记
一、大
语言模型
微调 vs. 大
语言模型
应用
一、大
语言模型
微调vs.大
语言模型
应用1.微调(Fine-Tuning)的含义与特点定义与作用微调指在预训练好(通用)的基础模型上,通过在特定领域或任务的数据集上进一步训练来调整模型参数,使其在该领域任务中获得更优表现
AI Echoes
·
2025-03-21 13:54
深度学习
人工智能
deepseek
机器学习
算法
ollama 基本使用教程
模型管理下载预训练模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4.高级功能服务器模式与API多会话管理环境变量配置5.常见问题与技巧加速模型下载查看日志模型参数调整模型导出与分享Ollama是一个开源的大型
语言模型
服务工具
海上彼尚
·
2025-03-21 12:17
AI
ai
前端
如何用大模型评估大模型——PAI-Judge裁判员大
语言模型
的实现简介
背景:为什么需要一个「裁判员大
语言模型
」?随着大模型(LLM)技术的爆发式应用,如何快速、客观评估模型回复质量成为行业痛点。
·
2025-03-21 12:08
人工智能机器学习大模型llm
cherry-studio - 多模型支持的跨平台 AI 桌面助手
GitHub:https://github.com/CherryHQ/cherry-studio更多AI开源软件:发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI一款支持多种大
语言模型
服务的跨平台桌面客户端
小众AI
·
2025-03-21 10:57
AI开源
人工智能
AI编程
智见未来:多大模型协同的数据分析新范式
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着大
语言模型
(LLM)的快速发展,ChatGPT、DeepSeek、Grok等AI模型在数据分析和洞察生成方面展现出巨大潜力。
一ge科研小菜菜
·
2025-03-21 09:15
人工智能
大数据
人工智能
大数据
如何评估大
语言模型
生成文本的质量?
目录如何评估大
语言模型
生成文本的质量?
gs80140
·
2025-03-21 08:42
AI
语言模型
人工智能
自然语言处理
Adam-mini:深度学习内存效率新突破
在训练十亿参数级别的大
语言模型
(LLM)时,Adam-mini实现了49.6%的吞吐量提升,并减少了33%的
XianxinMao
·
2025-03-21 08:42
人工智能
深度学习
人工智能
使用提示词进行信息抽取的实用方法
在大规模
语言模型
(LLM)中进行信息抽取时,我们不一定需要工具调用功能。通过精心设计的提示词(prompt)可以指导模型输出特定格式的信息,然后对其进行解析以生成结构化数据。
scaFHIO
·
2025-03-21 08:38
windows
python
【无标题】
在大
语言模型
(LLM)进行自回归(autoregressive)文本生成时,每次生成新token,都需要基于过去的上下文重新计算self-attention机制中的Key(K)和值(V)。
gs80140
·
2025-03-21 06:19
AI
人工智能
多家车企接入DeepSeek,AI汽车战争爆发,谁站上风口,谁会下牌桌?
其中东风汽车宣布旗下自主品牌已完成DeepSeek全系列大
语言模型
接入工作,并将于近期陆续搭载应用于包括东风岚图、东风猛士、东风奕派、东风风神、东风纳米在内的东风自主品牌车型。
高工智能汽车
·
2025-03-21 04:35
人工智能
汽车
在LangChain中传递运行时值给工具
在大多数情况下,这些参数不应该由LLM(大
语言模型
)控制,因为这样可能存在安全风险。因此,我们需要一种机制,让LLM只控制那些它需要控制的参数,而其他参数则由应用逻辑来固定。
bavDHAUO
·
2025-03-21 03:31
langchain
windows
python
Qwen2-Audio:通义千问音频大模型技术解读
引言:从llm到mlm(audio)大型
语言模型
(LLM)的发展日新月异,它们在文本理解、生成、推理等方面展现出惊人的能力。
kakaZhui
·
2025-03-21 01:41
音视频
AIGC
人工智能
python
chatgpt
【AI论文】RWKV-7“鹅”模型,具备富有表现力的动态状态演化能力
摘要:我们推出RWKV-7“鹅”,这是一种全新的序列建模架构,同时发布的还有预训练
语言模型
。
东临碣石82
·
2025-03-21 00:02
人工智能
Dify 项目开源大模型应用开发平台
Dify是一款开源的大
语言模型
(LLM)应用开发平台,旨在简化生成式AI应用的创建、部署和持续优化流程。
魔王阿卡纳兹
·
2025-03-20 23:30
IT杂谈
开源项目观察
开源
dif
LLM
开发平台
基于Python的金融领域AI训练数据抓取实战(完整技术解析)
项目背景与需求分析场景描述为训练一个覆盖全球金融市场的多模态大
语言模型
(LLM),需实时采集以下数据:全球30+主要证券交易所(NYSE、NASDAQ、LSE、TSE等)的上市公司公告企业财报PDF文档及结构化数据社交媒体舆情数据
海拥✘
·
2025-03-20 23:57
python
金融
人工智能
探索 Tavily Search API:为 AI 提供快速准确的搜索结果
引言在当今的技术时代,AI代理(如大型
语言模型
)日益需要实时、准确和事实性强的搜索结果。TavilySearchAPI就是为此而生的。
nseejrukjhad
·
2025-03-20 23:53
人工智能
python
开发语言
使用 Tavily 搜索 API 获取实时精确搜索结果
技术背景介绍Tavily搜索API是一个专为AI代理(如大型
语言模型
)而设计的搜索引擎。它能够快速提供实时、准确且事实性强的搜索结果。
fgayif
·
2025-03-20 23:22
python
数据库
开发语言
效果媲美GPT4V的多模态大型
语言模型
MiniCPM-V-2_6详细介绍
MiniCPM-V-2.6概述1.1模型背景MiniCPM-V-2.6是由nuoan开发的一款达到GPT-4V级别的多模态大型
语言模型
(MLLM)。
我就是全世界
·
2025-03-20 19:54
语言模型
人工智能
自然语言处理
开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇(十二)
无论是
语言模型
还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。
开源技术探险家
·
2025-03-20 19:23
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
LangChain入门:使用Python和通义千问打造免费的Qwen大模型聊天机器人
前言LangChain是一个用于开发由大型
语言模型
(LargeLanguageModels,简称LLMs)驱动的应用程序的框架。
南七小僧
·
2025-03-20 18:44
人工智能
网站开发
AI技术产品经理
服务器
数据库
windows
大规模
语言模型
从理论到实践 分布式训练的集群架构
大规模
语言模型
从理论到实践分布式训练的集群架构作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展,大规模
语言模型
AI智能涌现深度研究
·
2025-03-20 18:14
DeepSeek
R1
&
大数据AI人工智能
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【论文阅读】MMedPO: 用临床感知多模态偏好优化调整医学视觉
语言模型
MMedPO:用临床感知多模态偏好优化调整医学视觉
语言模型
1.背景2.核心问题:3.方法:3.实验结果与优势4.技术贡献与意义5.结论MMedPO:AligningMedicalVision-LanguageModelswithClinical-AwareMultimodalPreferenceOptimizationMMedPO
勤奋的小笼包
·
2025-03-20 17:10
论文阅读
语言模型
人工智能
自然语言处理
chatgpt
大模型时代的知识焦虑
从智能客服的温声细语,到AI绘画的妙笔生花,再到自动驾驶的日趋成熟,大型
语言模型
、图像模型等人工智能技术以前所未有的姿态,渗透进我们生活的方方面面。
机载软件与适航
·
2025-03-20 16:29
机器学习-建模算法-代理模型
人工智能
大数据
复旦:过程奖励优化多模态推理
AnEffectiveProcessRewardModelforMultimodalReasoning来源:arXiv,2503.10291摘要我们引入了VisualPRM,这是一种具有8B参数的高级多模态过程奖励模型(PRM),它通过Best-of-N(BoN)评估策略提高了现有多模态大型
语言模型
大模型任我行
·
2025-03-20 13:59
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
实战LLM强化学习——使用GRPO(DeepSeek R1出圈算法)
通过不断优化决策策略,DRL能在大量数据中学习最佳行为,尤其是大型
语言模型
(LLM)在任务中展现出的巨大潜力。
大富大贵7
·
2025-03-20 10:10
程序员知识储备1
程序员知识储备2
程序员知识储备3
经验分享
AI学习指南RAG篇(24)-RAGFlow的社区与开源贡献
RAGFlow通过结合大型
语言模型
(LLMs)的强大生成能力和高效的信息检索系统,为用户提供了一种全新的交互体验。本文将鼓励读者参与到RAGFlow的开源社区中,共同推动技术的发展和创新。
俞兆鹏
·
2025-03-20 10:07
AI学习指南
人工智能
有了大模型为何还需要Agent智能体
Agent(智能体)是一种能感知环境、自主决策、执行动作的智能实体,当它与大
语言模型
(如通义千问QWen、GPT)结合时,形成一种**“增强型AI系统”**。
全栈你个大西瓜
·
2025-03-20 09:59
人工智能
人工智能
AI
Agent
Agent
智能体
Agent
原理
DeepSeek智能政务大脑:城市服务知识库构建全指南——从RAG架构到民生场景落地实践
系统需具备:自然语言理解能力(NLU)异构知识整合能力政策法规精准解读能力多轮对话上下文管理应急服务联动机制1.2DeepSeek技术栈选择基于DeepSeek-Large
语言模型
构建核心系统,
Coderabo
·
2025-03-20 07:42
DeepSeek
R1模型企业级应用
政务
架构
deepseek具体应用场景
以下是基于证据的详细总结:金融领域DeepSeek在金融领域的应用表现突出,例如通过其大
语言模型
(如DeepSeekLLM67Bt)提供数学、逻辑推理等能力,帮助金融机构提升服务效率。
ahyouxiang
·
2025-03-20 06:06
人工智能
五、AIGC大模型_09手动实现ReAct_Agent
前言在上一章节中,我们了解到:create_react_agent是LangGraph提供的一个预构建方法(fromlanggraph.prebuiltimportcreate_react_agent),它可以将
语言模型
学不会lostfound
·
2025-03-20 05:59
AI
人工智能
react_agent
LangGraph
Multi-Agent
PlanAndExecute
AIGC
DeepSeek爆火,背后模型竟藏着这些秘密!
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家专注于开发先进大
语言模型
(LLM)和相关技术的企业。它成
qq_23519469
·
2025-03-20 04:49
ai
Ai时代初期全球不同纬度的层级辐射现象
大
语言模型
的训练方式(预训练→多任务学习→强化学习
龙胥伯
·
2025-03-20 04:48
人工智能
自定义Retriever的实现方法
技术背景介绍在许多大
语言模型
(LLM)应用中,检索器(Retriever)用于从外部数据源获取信息。
vaidfl
·
2025-03-20 03:17
windows
linux
microsoft
python
如何缓存聊天模型响应以提高效率
技术背景介绍在开发基于大型
语言模型
(LLM)的应用程序时,API调用的成本和响应速度是需要考虑的两个重要因素。尤其是在开发过程中,重复请求相同的文本生成可能会增加额外的成本和延迟。
scaFHIO
·
2025-03-20 03:46
缓存
java
oracle
python
如何在一行代码中初始化各种AI模型
技术背景介绍在开发大
语言模型
(LLM)应用时,用户有时需要选择不同的模型提供商和具体模型。这通常需要一定的逻辑来根据用户配置初始化不同的聊天模型。
qahaj
·
2025-03-20 03:16
人工智能
python
深度学习
使用Tiktoken进行文本分割:优化大
语言模型
的输入
引言在处理大
语言模型
时,因其对输入的token数量有限制,文本分割成为一个至关重要的任务。为了确保生成的文本块不会超过模型的token限制,我们需要使用与模型相同的tokenizer来计数和分割文本。
bhawfgrcbtwny
·
2025-03-20 03:15
语言模型
python
人工智能
Tree of Thought Prompting(思维树提示)
TreeofThoughtPrompting(思维树提示)是一种新兴的提示工程技术,旨在通过模拟人类解决问题时的多步推理过程,提升大型
语言模型
(LLM)在复杂任务中的表现。
大数据追光猿
·
2025-03-20 02:28
大模型
人工智能
大数据
深度学习
语言模型
计算机视觉
95% 向量资源节省,火山引擎云搜索 RAG 技术体系演进
随着大型
语言模型
技术的不断成熟和行业应用的深入,人们对RAG系统的期望已经超越了对其“酷炫”效果的追求。企业和组织开始寻找更可靠、可扩展的RAG解决方案,以满足实际业务需求。
字节跳动云原生计算
·
2025-03-20 02:58
火山引擎
搜索引擎
算法
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-
语言模型
论文信息题目:AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-
语言模型
作者
小白学视觉
·
2025-03-19 21:21
医学图像处理论文解读
语言模型
人工智能
计算机视觉
医学图像顶会
医学图像处理
CVPR
论文解读
MMScan数据集:首个最大的多模态3D场景数据集,包含层次化的语言标注
一、研究背景:随着大型
语言模型
(LLMs)的兴起和与其他数据模态的融合,多模态3D感知因其与物理世界的连接而受到越来越多的关注,并取得了快速进展。然而,现有的数据集
·
2025-03-19 21:28
数据集
使用LangChain实现大规模
语言模型
自发现推理结构
使用LangChain实现大规模
语言模型
自发现推理结构在现代自然语言处理(NLP)的研究中,大规模
语言模型
(LLMs)已经展示了强大的能力。然而,在应对复杂的推理问题时,传统的提示方法常常力不从心。
VYSAHF
·
2025-03-19 20:43
langchain
语言模型
人工智能
python
A Survey of Large Language Models大模型综述论文章节总结
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型
语言模型
(LLM)的最新进展,重点关注其发展背景、关键发现和主流技术。
WhyteHighmore
·
2025-03-19 19:09
论文
语言模型
人工智能
自然语言处理
论文笔记
使用Pinecone实现自查询检索器的实现步骤
##核心原理解析自查询检索器(SelfQueryRetriever)的核心思想是通过提供文档的元数据和内容描述,结合
语言模型
生成查询条件来完成数据检
vaidfl
·
2025-03-19 19:08
python
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型
语言模型
的训练后优化综述——第9部分——应用
应用尽管预训练为大型
语言模型
(LLMs)赋予了强大的基础能力,但在部署于专业领域时,LLMs仍经常遇到持续的限制,包括上下文长度受限、容易产生幻觉(hallucination)、推理能力欠佳和固有的偏见
王金-太想进步了
·
2025-03-19 19:31
语言模型
人工智能
自然语言处理
知识蒸馏:从软标签压缩到推理能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新)
在实际应用中,无论是大规模
语言模型
(LLMs)还是其他类型的神经网络模型,都会通过softmax
AI仙人掌
·
2025-03-19 17:20
人工智能
AI
人工智能
深度学习
语言模型
机器学习
迁移学习入门
一般预训练模型具备复杂的网络模型结构;一般是在大量的语料下训练完成的预训练
语言模型
的类别现在我们接触到的预训练
语言模型
,基本上都是基于transformer这个模型迭代而来的因此划分模型类别的时候,以transformer
EmbodiedTech
·
2025-03-19 16:14
人工智能
大模型
迁移学习
人工智能
机器学习
复旦:LLM不同层位置编码缩放
标题:Layer-SpecificScalingofPositionalEncodingsforSuperiorLong-ContextModeling来源:arXiv,2503.04355摘要尽管大型
语言模型
大模型任我行
·
2025-03-19 16:12
大模型-结构原理
人工智能
自然语言处理
语言模型
论文笔记
OpenManus 代码分析
项目分析:OpenManus这是github地址OpenManus是一个基于LLM(大型
语言模型
)的智能代理系统,它采用了模块化的设计,支持工具调用、规划和执行等功能。
有个人神神叨叨
·
2025-03-19 15:38
人工智能
ai
大型
语言模型
:让Python更聪明的秘密武器
Python是一种广泛使用的编程语言,而大型
语言模型
则为Python开发者提供了一个强大的工具。大型
语言模型
可以理解人类语言,并生成具有逻辑和连贯性的文本。
qq_39605374
·
2025-03-19 14:00
语言模型
python
数据库
Python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他