E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
大语言模型(
LLM
)课程学习(Curriculum Learning)、数据课程(data curriculum)指南:从原理到实践
在人工智能的浪潮之巅,我们总会惊叹于GPT-4、Llama3.1、Qwen2.5这些顶尖大语言模型(
LLM
)所展现出的惊人能力。它们似乎无所不知,能写诗、能编程、能进行复杂的逻辑推理。
·
2025-07-08 06:34
巨兽的阴影:大型语言模型的挑战与伦理深渊
当GPT-4这样的庞然大物能够流畅对话、撰写诗歌、编写代码、解析图像,甚至在某些测试中媲美人类专家时,大型语言模型(
LLM
)仿佛成为了无所不能的“智能神谕”。
田园Coder
·
2025-07-08 05:57
人工智能科普
人工智能
科普
AI
LLM
架构与原理 - 预训练模型深度解析
一、引言在人工智能领域,大型语言模型(
LLM
)的发展日新月异,预训练模型作为
LLM
的核心技术,为模型的强大性能奠定了基础。
陈乔布斯
·
2025-07-08 04:46
AI
人工智能
大模型
人工智能
架构
机器学习
深度学习
大模型
Python
AI
2025主流AI大模型终极指南:横向对比+实战测评+官方注册教程
《2025主流AI大模型终极指南:横向对比+实战测评+官方注册教程》在人工智能技术飞速发展的今天,大型语言模型(
LLM
)已成为推动数字化转型的核心引擎。
AI新视界
·
2025-07-08 02:04
AI工具全指南:从入门到精通
解锁高效生产力
人工智能
[论文阅读] 人工智能 | 读懂Meta-Fair:让
LLM
摆脱偏见的自动化测试新方法
读懂Meta-Fair:让
LLM
摆脱偏见的自动化测试新方法论文标题:Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair
张较瘦_
·
2025-07-08 00:16
前沿技术
论文阅读
人工智能
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用(六)
一、前言随着人工智能技术的迅猛发展,大语言模型(
LLM
)在各行各业的应用日益广泛。然而,模型生成的内容是否安全、合规、符合用户预期,成为开发者和企业不可忽视的问题。
开源技术探险家
·
2025-07-07 20:17
开源模型-实际应用落地
开源
python
ai
人工智能
LangGraph是为了解决哪些问题?为了解决这些问题,LangGraph采用哪些方法?LangGraph适用于什么场景?LangGraph有什么局限性?
LangGraph旨在解决的问题LangGraph是LangChain生态系统中的一个高级库,它专注于解决构建复杂、有状态、多步
LLM
应用程序的挑战。
杰瑞学AI
·
2025-07-07 20:17
AI/AGI
NLP/LLMs
langchain
人工智能
自然语言处理
深度学习
神经网络
star31.6k,Aider:让代码编写如虎添翼的终端神器
ider是一款运行在终端中的AI结对编程工具,它能与大型语言模型(
LLM
)无缝协作,直接在您的本地Git仓库中编辑代码。无论是启动新项目,还是优化现有代码库,Aider都能成为您最得力的助手。
·
2025-07-07 16:24
vllm推理实践
定义生成参数sampling_params=SamplingParams(temperature=0.7,top_p=0.9,max_tokens=100,)#加载DeepSeek模型(以deepseek-
llm
try2find
·
2025-07-07 15:12
java
前端
服务器
目前最火的agent方向-A2A快速实战构建(二): AutoGen模型集成指南:从OpenAI到本地部署的全场景
LLM
解决方案
引言:打破模型壁垒,构建灵活AI应用在AI应用开发中,大语言模型(
LLM
)的选择往往决定了系统的能力边界。
·
2025-07-07 10:39
在 Dify 平台中集成上下文工程技术
1.提升
LLM
问答准确率的上下文构建与提示策略大语言模型在开放领域问答中常面临幻觉和知识过时等问题。为提高回答准确率,上下文工程的关键是在提示中注入相关背景知识与指导。
由数入道
·
2025-07-07 10:08
人工智能
数据库
大数据
人工智能
软件工程
dify
Go 语言实现本地大模型聊天机器人:从推理到 Web UI 的全流程
接续Go-
LLM
-CPP专案,继续扩充前端聊天室功能一.专案目录架构:go-
llm
-cpp/├──bin/#第三方依赖│├──go-llama.cpp/#封裝GGUF模型推理(CGo)│└──
llm
-go
雷羿 LexChien
·
2025-07-07 09:55
Go
golang
机器人
前端
Chat Memory
大型语言模型(
LLM
)是无状态的,这意味着它们不保留有关以前交互的信息。当您想在多个交互中维护上下文或状态时,这可能是一个限制。
虾条_花吹雪
·
2025-07-07 01:11
Spring
AI
ai
人工智能
动手实践OpenHands系列学习笔记3:
LLM
集成基础
笔记3:
LLM
集成基础一、引言大型语言模型(
LLM
)是OpenHands代理系统的核心驱动力。
JeffWoodNo.1
·
2025-07-07 00:07
笔记
人工智能
【深度学习】神经网络剪枝方法的分类
神经网络剪枝方法的分类摘要随着深度学习模型,特别是大语言模型(
LLM
)的参数量爆炸式增长,模型的部署和推理成本变得异常高昂。
烟锁池塘柳0
·
2025-07-06 21:06
机器学习与深度学习
深度学习
神经网络
剪枝
语言模型之谜:提示内容与格式的交响诗
当代人工智能领域中,语言模型(
LLM
)正以前所未有的规模和深度渗透到各行各业。
步子哥
·
2025-07-06 17:29
AGI通用人工智能
语言模型
人工智能
自然语言处理
当我的代码评审开始 “AI 打工”:聊聊这个让我摸鱼更心安的神器
直到我发现了这个藏在云效里的神器——yunxiao-
LLM
-reviewer,现在我的MR终于有了一个24小时在线的“A
Honesty861024
·
2025-07-06 16:20
ci/cd
ai
git
Xtuner:大模型微调快速上手
简单来说,XTuner是一个轻量级、易于使用的、为大语言模型(
LLM
)设计的微调工具库。它由上海人工智能实验室(OpenMMLab)开发,是其强大AI工具生态(MMCV,MMEngine等)的一部分。
潘达斯奈基~
·
2025-07-06 15:49
AIGC
AIGC
——本地部署
LLM
终极保姆级教程
在过去的十几篇文章中,我们已经将我们的AI打造成了一个顶级的“分析师”。它能看、能听、能读,能预测多维度的价值指标,甚至能用SHAP解释自己的决策。它很强大,但它的能力,始终停留在“分析”和“诊断”的层面。它能告诉我“你的开头不行”,但无法告诉我“一个好的开头应该怎么写”。这就像我的副驾驶是一位顶级的F1数据分析师,他能告诉我每个弯道的最佳速度和刹车点,但他自己并不会开车。我需要一次终极的升级,我
爱分享的飘哥
·
2025-07-06 12:51
人工智能
语言模型
python
LLM
ai
happy-
llm
第一章 NLP 基础概念
文章目录一、什么是NLP?二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法:统计表征2.神经网络:语义向量化课程地址:happy-llmNLP基础概念一、什么是NLP?核心目标:让计算机理解、生成、处理人类语言,实现人机自然交互。现状与挑战:成就:深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈:歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
weixin_38374194
·
2025-07-06 10:28
自然语言处理
人工智能
学习
Happy-
LLM
第二章 Transformer
Transform架构图片来自[Happy-
llm
](happy-
llm
/docs/chapter2/第二章Transformer架构.mdatmain·datawhalechina/happy-
llm
HalukiSan
·
2025-07-06 10:58
transformer
深度学习
人工智能
happy-
llm
第二章 Transformer架构
文章目录一、注意力机制核心解析1.1注意力机制的本质与核心变量1.2注意力机制的数学推导1.3注意力机制的变种实现1.3.1自注意力(Self-Attention)1.3.2掩码自注意力(MaskedSelf-Attention)1.3.3多头注意力(Multi-HeadAttention)二、Encoder-Decoder架构详解2.1Seq2Seq任务与架构设计2.2核心组件解析2.2.1前馈
weixin_38374194
·
2025-07-06 09:55
transformer
深度学习
人工智能
学习
SurveyForge:AI自动撰写综述论文的革命性工具,助力科研效率跃升
项目简介SurveyForge是一款基于大语言模型(
LLM
)的自动综述论文生成工具,专为计算机科学领
花生糖@
·
2025-07-06 08:47
AIGC学习资料库
人工智能
AI论文
AI助手
【AI】大语言模型(
LLM
)& NLP
大语言模型(
LLM
)&NLP1.大语言模型(
LLM
)1.1一句话解释1.2更形象的比喻1.3为什么叫“大”模型1.4它能做什么1.5现实中的例子2.对比NLP2.1用“汽车进化”比喻NLP→
LLM
2.2
G皮T
·
2025-07-06 06:04
#
大语言模型
LLM
NLP
大模型
大语言模型
AI
人工智能
2024大模型秋招
LLM
相关面试题整理
大语言模型(LargeLanguageModel,
LLM
)是针对语言的大模型。
AGI大模型资料分享官
·
2025-07-06 04:55
人工智能
深度学习
机器学习
自然语言处理
语言模型
easyui
从文档海洋到智能问答:用大模型和RAG打造下一代企业知识库的实战之路
本文将分享一次从0到1的实战探索,讲述如何利用大语言模型(
LLM
)和检索增强生成(RAG)技术,将静态、孤立的知识库,重塑为一个能“思考”和“对话”的智能问答系统。
电脑能手
·
2025-07-05 23:22
人工智能算法
语言模型
深度学习
python
提示技术系列(六)——链式提示
提示工程是指通过设计、优化和迭代输入到大语言模型(
LLM
)的提示(Prompt),系统性提升模型输出质量(如相关性、准确性、可控性)的实践领域。
AIGC包拥它
·
2025-07-05 21:38
提示技术
人工智能
prompt
python
langchain
LLM
面试题14
算法岗面试题介绍下Transformer模型。 Transformer本身是一个典型的encoder-decoder模型,Encoder端和Decoder端均有6个Block,Encoder端的Block包括两个模块,多头self-attention模块以及一个前馈神经网络模块;Decoder端的Block包括三个模块,Masked多头self-attention模块,多头Encoder-D
三月七꧁ ꧂
·
2025-07-05 16:00
破题·大模型面试
语言模型
人工智能
数据库
自然语言处理
prompt
价值的罗盘:AI对齐与人类文明的终极追问
当大型语言模型(
LLM
)在文本生成、代码创作、多模态理解等领域展现出逼近甚至超越人类专家的惊人能力,当自主智能体(Agent)开始规划复杂目标、调用工具、影响现实世界,一个关乎人类文明存续的根本性问题,
田园Coder
·
2025-07-05 16:29
人工智能科普
人工智能
科普
【
LLM
论文阅读】
LLM
论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN
一只齐刘海的猫
·
2025-07-05 11:23
论文阅读
ART(Automatic Reasoning and Tool-use):自动推理与工具使用的革命性突破
引言在人工智能快速发展的今天,大语言模型(
LLM
)的能力边界正在不断被重新定义。
·
2025-07-05 02:57
NVIDIA Isaac GR00T N1.5 人形机器人强化学习入门教程(五)
更深入的理解1.1实体化动作头微调1.1.1实体标签1.1.2工作原理1.1.3支持的实现1.2高级调优参数1.2.1模型组件1.2.1.1视觉编码器(tune_visual)1.2.1.2语言模型(tune_
llm
强化学习与机器人控制仿真
·
2025-07-05 00:15
机器人与具身智能
人工智能
机器人
深度学习
神经网络
强化学习
模仿学习
具身智能
BERT(Bidirectional Encoder Representations from Transformers)
BidirectionalEncoderRepresentationsfromTransformers)是由Google于2018年提出的一种基于Transformer架构的预训练语言模型,属于大型语言模型(
LLM
jerwey
·
2025-07-04 20:47
bert
人工智能
深度学习
大语言模型(
LLM
)按架构分类
大语言模型(
LLM
)按架构分类的深度解析1.仅编码器架构(Encoder-Only)原理双向注意力机制:通过Transformer编码器同时捕捉上下文所有位置的依赖关系#伪代码示例:BERT的MLM任务
jerwey
·
2025-07-04 20:46
语言模型
分类
人工智能
基于Google Gemini 探索大语言模型在医学领域应用评估和前景
概述近年来,大规模语言模型(
LLM
)在理解和生成人类语言方面取得了显著的飞跃,这些进步不仅推动了语言学和计算机编程的发展,还为多个领域带来了创新的突破。
知来者逆
·
2025-07-04 19:44
LLM
语言模型
搜索引擎
人工智能
Gemini
大语言模型
医疗
健康医疗
LangChain是为了解决哪些问题?为了解决这些问题,LangChain采用哪些方法?LangChain适用于什么场景?LangChain有什么局限性?
LangChain旨在解决的问题LangChain的核心目的是解决在使用大型语言模型(
LLM
)开发应用程序时面临的复杂性和挑战。
杰瑞学AI
·
2025-07-04 17:00
AI/AGI
NLP/LLMs
langchain
人工智能
自然语言处理
深度学习
神经网络
AI-native
RAG实战指南 Day 3:LangChain框架深度解析
LangChain已成为开发基于大语言模型(
LLM
)应用的事实标准,特别在检索增强生成(RAG)系统中扮演着关键角色。
在未来等你
·
2025-07-04 09:57
RAG实战指南
RAG
LangChain
检索增强生成
大语言模型
AI开发
Python
自然语言处理
大模型私有化部署的系统性挑战与解决方案:企业视角的深度解析
然而,由于数据隐私、定制需求、合规政策等多重因素,私有化部署成为多数企业采用
LLM
的首选路径。企业选择私有部署大模型,通常基于以下几个原因:数据安全需求:业务数据敏感,禁止外发;可控
慌ZHANG
·
2025-07-04 08:51
人工智能
人工智能
大模型微调到底有没有技术含量?
老生常谈的一句话吧:有没有技术含量取决于这个工作你怎么做,尤其是
llm
方向,上手门槛相比传统NLP变得更低了。
DeepSeek-大模型系统教程
·
2025-07-04 05:02
人工智能
语言模型
ai
大模型
大模型微调
程序员
AI大模型
LLM
归因的几种评估方式
参考ASurveyofLargeLanguageModelsAttribution,
LLM
归因有以下几种有效的评估方式。1人工评估归因错误的检测难度大,所以评估主要依赖人工评价进行归因检测。
liliangcsdn
·
2025-07-04 03:23
深度学习
人工智能
语言模型
算法
LLM
归因的限制和挑战
LLM
归因虽然能提升任务性能和模型的可解释性,但面临多个方面的限制。
·
2025-07-04 03:53
Python 快速入门教程:构建一个 A2A Agent
然后,您将看到一个集成了大型语言模型(
LLM
)的更高级示例。本实践指南将帮助您理解:A2A协议背后的基本概念。如何使用SDK为A2A开发设置Python环境。
@井九
·
2025-07-04 02:47
python
开发语言
BAAI/BGE-VL多模态模型部署、原理、代码详解(实现图像文本混合检索),包含BEG-VL多模态模型的本地部署详细步骤及代码原理解析
:这里可以添加本文要记录的大概内容:包含四个模型及数据集,数据集未开源,四个模型可以分别下载:其中,BGE-VL-base/Large是基于CLIP训练的模型,BGE-VL-MLLM-S1/S2是基于
LLM
令令小宁
·
2025-07-04 01:09
python
语言模型
自然语言处理
nlp
人工智能
【Agent实战】用“前置编码器+
LLM
”复刻ChatGPT附件功能
1.引言:多模态
LLM
解耦原生多模态
LLM
将多种模态的处理能力“内化”于一个庞大的模型中,是技术的前沿。
kakaZhui
·
2025-07-03 23:56
大模型Agent入门与代码实战
chatgpt
人工智能
LLM
Agent
AIGC
DeepSeek
LLM
大模型命名规则与部署硬件实践手册
文章目录一、理论基础:从信息编码到系统设计1.1命名系统的信息论基础1.2硬件架构与模型运行的关系1.3量化技术的数学原理二、国际主流模型命名规则深度解析2.1OpenAI:极简主义与功能导向2.2AnthropicClaude:诗意命名的技术内涵2.3GoogleGemini:统一品牌下的分层架构2.4MetaLlama:开源社区的透明化命名三、国内主流模型命名规则与文化内涵3.1百度文心:知识
·
2025-07-03 22:49
借助 KubeMQ 简化多
LLM
集成
将多个大语言模型(
LLM
),如OpenAI和Anthropic的Claude集成到应用程序中是一项具有挑战性的任务。处理不同API和通信协议的复杂性,以及确保请求高效路由,都会带来诸多难题。
强哥之神
·
2025-07-03 18:18
智能路由器
transformer
深度学习
语言模型
架构
deepseek
科普语音交互所需开源技术方案
以下是ASR(自动语音识别)、
LLM
(大语言模型)和TTS(文本转语音)三者结合的应用场景及开源方案:一、应用场景智能语音助手如百聆(Bailing),支持语音输入、意图理解、任务管理及语音输出,端到端延迟仅
·
2025-07-03 17:45
结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践
传统RAG通过向量数据库存储文档嵌入并检索相关内容,结合大语言模型(
LLM
)生成回答,有效缓解了
LLM
的“幻觉”问题。
大模型之路
·
2025-07-03 17:45
RAG
rag
LLM
---大语言模型技术研究报告
摘要大语言模型(LLMs)已从技术突破走向产业规模化落地。2025年,全球LLMs进入“模型即服务”(MaaS)时代,参数量级突破万亿级,多模态能力、智能体协作、专业化细分成为主流趋势。中国大模型领域在DeepSeek、通义千问、讯飞星火等头部模型推动下,实现技术突破与场景创新。本报告基于截至2025年7月的最新数据,系统梳理LLMs的技术演进、应用场景、挑战与未来方向。一、大语言模型的演进与突破
·
2025-07-03 14:23
解释
LLM
怎么预测下一个词语的
解释
LLM
怎么预测下一个词语的通过上文词的向量进行映射在Transformer架构的大语言模型(如GPT系列、BERT等)中,词语会先被转化为词向量。
ZhangJiQun&MXP
·
2025-07-03 14:23
教学
2024大模型以及算力
2021
AI
python
语言模型
python
深度学习
人工智能
机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他