E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Llama2
Llama 2 模型架构深度解析:Transformer的进化
Llama2
模型架构深度解析:Transformer的进化关键词:
Llama2
、Transformer、模型架构、进化、人工智能摘要:本文将深入剖析
Llama2
的模型架构,探讨它作为Transformer
SuperAGI架构师的AI实验室
·
2025-07-29 01:32
AI大模型应用开发宝典
llama
架构
transformer
ai
6、LangChain —— 使用 Huggingface 中的开源模型
文章目录一、概述二、大语言模型发展史三、预训练+微调的模式四、用HuggingFace跑开源模型五、申请使用Meta的
Llama2
模型六、通过HuggingFace调用Llama七、LangChain和
Miyazaki_Hayao
·
2025-07-22 13:36
LangChain
实战
langchain
大模型或多模态在能源系统优化调度中的应用
1.大模型在电力调度中的应用GAIA-电力调度大语言模型项目描述:专为电力调度设计的大语言模型,能够处理运行调整、运行监控和黑启动等任务技术特点:基于
LLaMA2
微调,专门针对电力系统领域优化论文:“Alargelanguagemodelforadvancedpowerdispatch
u013250861
·
2025-07-21 06:53
LLM
能源
人工智能
【实战AI】macbook M1 本地ollama运行deepseek
请自行;2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端(MacOS、Windows、Linux),专为无缝部署大型语言模型(LLM)(如
Llama2
、Mistral
东方鲤鱼
·
2025-07-12 08:24
chat
AI
macos
ai
llama
AIGC
chatgpt
10.2 ChatGPT自动生成训练数据实战:37.2%准确率提升秘籍
根据2023年GoogleResearch的实证研究,使用GPT-4生成的合成数据对
LLaMA2
进行微调,能达到人工标注数据85%的效果水平。
少林码僧
·
2025-07-07 09:30
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
chatgpt
人工智能
机器学习
语言模型
Llama改进之——分组查询注意力
引言今天介绍
LLAMA2
模型引入的关于注意力的改进——分组查询注意力(Grouped-queryattention,GQA)1。Transformer中的多头注意力在解码阶段来说是一个性能瓶颈。
愤怒的可乐
·
2025-07-04 01:37
#
NLP项目实战
自然语言处理
llama
深度学习
人工智能
分组查询注意力
旋转位置编码
手把手从零打造 Llama3:解锁下一代预训练模型
引言Llama3相较于
Llama2
,不仅在模型架构上做了显著优化,尤其是全局查询注意力机制(GQA)的引入,使得模型在大规模数据处理上表现更加出色。
会飞的Anthony
·
2025-07-04 01:35
信息系统
人工智能
AIGC
自然语言处理
人工智能
llama3
AIGC
PyTorch-Llama: 从零开始实现LLaMA 2模型教程
PyTorch-Llama:从零开始实现
LLaMA2
模型教程pytorch-llamaLLaMA2implementedfromscratchinPyTorch项目地址:https://gitcode.com
乔昕连
·
2025-07-04 00:05
开源浪潮之巅:当前最热门的开源项目全景图
以下精选当前最受关注、社区活跃的热门开源项目,涵盖人工智能、开发工具、基础设施等关键领域:一、人工智能与机器学习:引领创新前沿Llama系列(MetaAI):核心价值:Meta开源的大语言模型家族(
Llama2
万能小贤哥
·
2025-06-27 08:31
开源
如何在Spring AI中配置多模型切换
在SpringAI中配置多模型切换(例如同时使用OpenAI、Gemini或本地
Llama2
),可以通过Bean别名或动态运行时选择实现。
友莘居士
·
2025-06-25 08:50
spring-ai
人工智能
java
模型切换
ChatMusician:用大模型理解并创造音乐
ChatMusician由SkyworkAIPTE.LTD.和香港科技大学的研究团队共同开发,它基于持续预训练和微调的
LLaMA2
模型,并通过一种文本兼容的音乐表示法——ABC符号,将音乐作为第二语言来处理
人工智能大模型讲师培训咨询叶梓
·
2025-06-22 19:19
人工智能讲师
人工智能
音视频
计算机视觉
深度学习
大模型
多模态
音乐
人工智能杂谈(三)Dify与Coze平台对比分析
技术演进2023年初:推出首个开源版本,支持GPT系列模型接入2023年中:新增多模型兼容性(如
Llama2
、智谱AI)2024年:推出企业
技术流浪者
·
2025-05-14 04:20
AI
人工智能
详解大语言模型生态系统概念:lama,llama.cpp,HuggingFace 模型 ,GGUF,MLX,lm-studio,ollama这都是什么?
详解大语言模型生态系统概念基础模型与架构LlamaMeta(Facebook)开发的开源大语言模型系列包含不同规模的版本(例如
Llama2
、Llama3,以及7B、13B、70B等参数规模)被广泛用于创建衍生模型和微调特定应用场景模
小技工丨
·
2025-05-04 03:28
大模型LLM应用随笔
语言模型
llama
人工智能
Ollama部署的模型,怎么被调用
例如:curlhttp://localhost:11434/api/generate-d'{"model":"
llama2
","prompt":"水是由什么组成的
MonkeyKing.sun
·
2025-05-03 15:39
lua
开发语言
常见LLM大模型概览与详解
以下是一些常见的大模型的详细介绍,包括
LLaMA2
、LLaMA3、BLOOM、BERT、Falcon180B、Mistral7B、OpenHermes、GPT-NeoX-20B、Pythia、OpenLLaMA
夏沫の梦
·
2025-04-14 05:41
AI技术总览
人工智能
llama
chatgpt
深度学习
【远程AI交互】群晖Docker本地部署Chatbot Ollama搭建智能聊天实战
运行Ollama镜像3.运行ChatbotOllama镜像4.本地访问5.群晖安装Cpolar6.配置公网地址7.公网访问8.固定公网地址前言本文主要分享如何在群晖NAS本地部署并运行一个基于大语言模型
Llama2
kaixin_啊啊
·
2025-04-12 07:38
cpolar
商业合作
人工智能
docker
容器
一款神奇的本地快速部署开源大模型的工具——ollama
我们不仅可以使用
Llama2
、CodeLlama等模型,还可以使用自己自定义创建的模型。ollama支持的模型以下是ollama已经支持的开源大模型,大家可以根据需
遇码
·
2025-04-10 22:06
大模型
大模型
ollama
开源
一文速览Llama 3及其微调:从如何把长度扩展到100万到如何微调Llama3 8B_llama3 微调 mysql 数据_llama3 代码很短
Meta官方博客的介绍:IntroducingMetaLlama3:ThemostcapableopenlyavailableLLMtodate,帮你迅速梳理下LLama的关键特征,并对比上一个版本的
LLama2
AGI的大荔枝
·
2025-04-07 18:53
llama
语言模型
人工智能
自然语言处理
深度学习
机器学习
如何配置在vscode的Cline插件中调用Ollama本地部署的DeepSeek R1/V3、千问2.5等大模型
Llama系列:如Llama3、
Llama2
,具备强大的语言理解和
代码简单说
·
2025-04-06 18:20
2025开发必备
vscode
ide
编辑器
vscode
cline
vscode
ollama
vscode调用本地大模型
vscode调deepseek
声网SDK如何征服硬件碎片化?
极简接入流程:通过声网Console后台的「智能编排引擎」,开发者可完成三大关键步骤:首先是大模型选择,可视化界面支持GPT-4、DeepSeek、
Llama2
等50+模型一键接入,提供性能参数对比(如
都市速报
·
2025-04-05 02:01
人工智能
国产670亿参数的DeepSeek:超越
Llama2
,全面开源
这款模型不仅在多项中英文公开评测榜单上超越了700亿参数的
Llama2
,而且在推理、数学和编程能力方面表现突出。
努力犯错
·
2025-03-26 02:51
microsoft
llama
自然语言处理
人工智能
语言模型
使用 Baseten 部署和运行机器学习模型的指南
无论是开源模型如
Llama2
和Mistral,还是专有或经过微调的模型,Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
shuoac
·
2025-03-24 03:17
机器学习
人工智能
python
ChatGPT智能聊天机器人实现
智能聊天机器人的完整开发指南,包含技术选型、核心代码逻辑和推荐学习资源:—云端平台整理一、技术架构与工具核心模型基座模型:HuggingFaceTransformers库(如GPT-2/GPT-3.5TurboAPI/
LLaMA2
云端源想
·
2025-03-17 14:57
chatgpt
机器人
主流开源大模型能力对比矩阵
模型名称核心优势主要局限
Llama2
/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练
时光旅人01号
·
2025-03-16 12:09
人工智能
开源
python
深度学习
pytorch
基于llama_cpp 调用本地模型(llama)实现基本推理
背景llama_cpp是一个基于C++的高性能库(llama.cpp)的Python绑定,支持在CPU或GPU上高效运行LLaMA及其衍生模型(如
LLaMA2
),并通过量化技术(如GGUF格式)优化内存使用
月光技术杂谈
·
2025-03-11 10:40
大模型初探
llama
llama.cpp
python
LLM
集成显卡
本地模型
AI
【大模型技术】LlamaFactory 的原理解析与应用
LlamaFactory是一个基于LLaMA系列模型(如LLaMA、
LLaMA2
、Vicuna等)的开源框架,旨在帮助开发者和研究人员快速实现大语言模型(LLM,LargeLanguageModel)的微调
大数据追光猿
·
2025-03-07 00:32
大模型
transformer
人工智能
语言模型
python
github
docker
机器学习
Chinese-Llama-2-7b 项目使用教程
Chinese-Llama-2-7b项目使用教程Chinese-Llama-2-7b开源社区第一个能下载、能运行的中文
LLaMA2
模型!
朱均添Fleming
·
2025-03-06 23:55
LLaMA(Meta开源的AI模型)与Ollama(本地运行和管理大模型的工具)简介(注意这俩虽然名字相似但没有直接联系)
**
Llama2
(2023年7月)**3.
Dontla
·
2025-03-04 04:54
人工智能
大模型LLM
llama
开源
人工智能
Llama 3.2入门基础教程(非常详细),Llama 3.2微调、部署以及多模态训练入门到精通,收藏这一篇就够了!
Llama3技术剖析与部署相较于
Llama2
,Llama3的改变其实并不是太大。Tokenizer变成了128K的词表,使用了GQA,不在是原来的只在Llama2-70B里使用了。
中年猿人
·
2025-03-03 17:49
llama
android
人工智能
语言模型
深度学习
学习
自然语言处理
Llama 2架构深度解析:Meta开源的70B参数大模型设计哲学
一、架构设计理念
Llama2
作为Meta开源的商用级大语言模型,其架构设计体现了三大核心原则:效率优先:在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化:通过改进注意力机制支持4k上下文长度安全性内嵌
AI时代已来!
·
2025-03-02 14:46
llama
架构
[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案
N=20(N:剪枝崩溃临界点,
LLaMA2
在45%,Mistral-7B在35%,Qwen在20%,Phi-2在25%)对后(P
心心喵
·
2025-03-01 04:25
论文笔记
剪枝
算法
机器学习
Ollama微调
它支持多种流行的开源大语言模型,如
Llama2
、Qwen2.5等。在上一篇文章中我们部署Ollama,并使用简单命令管理Ollama。接下来我们学习Ollama的高级应用。
软件不硬
·
2025-02-26 19:08
LLM
tool
AIGC
Meta官宣Llama3:迄今为止最强大的开源大模型
领先的性能新的8B和70B参数Llama3模型是
Llama2
模型的重大飞跃,为这些规模的LLM模型确立了新的先进水平。得
·
2025-02-24 19:09
人工智能开源
科普:大模型使用中的temperature 与 top-k及其它
在大语言模型(如通过Ollama运行的
llama2
模型)中,temperature和top-k是两个用于控制文本生成过程的重要参数,它们在功能上相互独立,但又共同影响着模型生成文本的随机性和多样性。
人工干智能
·
2025-02-22 23:35
大模型编程
人工智能
大模型
大模型(含deepseek r1)本地部署利器ollama的API操作指南
它支持多种预训练的大型语言模型(如
LLaMA2
、Mistral、Gemma、DeepSeek等),并提供了一个简单高效的方式来加载和使用这些模型。
·
2025-02-20 13:41
人工智能llm
AIGC 实战:如何使用 Docker 在 Ollama 上离线运行大模型(LLM)
Ollama简介Ollama是一个开源平台,用于管理和运行各种大型语言模型(LLM),例如
Llama2
、Mistral和Tinyllama。它提供命令行界面(CLI)用于安装、模型管理和交互。
surfirst
·
2025-02-16 04:04
LLM
架构
AIGC
docker
容器
LLM
大模型
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
模型定位与技术背景DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如
Llama2
热爱分享的博士僧
·
2025-02-11 18:36
架构
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在预训练新的大模型,在
Llama2
或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
【明明安装flash-attn成功,但是import的时候报错】
Thismodelingfilerequiresthefollowingpackagesthatwerenotfoundinyourenvironment:flash_attn.明明安装flash-attn成功,但是import的时候报错问题描述:运行
Llama2
厂泉心
·
2025-02-02 12:07
python
自然语言处理
Firefly-LLaMA2-Chinese - 开源中文
LLaMA2
大模型
文章目录关于模型列表&数据列表训练细节增量预训练&指令微调数据格式&数据处理逻辑增量预训练指令微调模型推理权重合并模型推理部署关于github:https://github.com/yangjianxin1/Firefly-LLaMA2-Chinese本项目与Firefly一脉相承,专注于低资源增量预训练,既支持对Baichuan2、Qwen、InternLM等原生中文模型进行增量预训练,也可对L
伊织产研
·
2025-01-27 00:07
Firefly-LLaMA2
LLaMA-2
增强大型语言模型(LLM)可访问性:深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程
EnhancingLLMAccessibility:ADeepDiveintoQLoRAThroughFine-tuningLlama2onasingleAMDGPU—ROCmBlogs基于之前的博客《使用LoRA微调
Llama2
109702008
·
2025-01-22 11:35
人工智能
#
ROCm
#
python
语言模型
llama
人工智能
一文看懂
llama2
(原理&模型&训练)
自从Transformer架构问世以来,大型语言模型(LargeLanguageModels,LLMs)以及AIGC技术的发展速度惊人,它们不仅在技术层面取得了重大突破,还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出,这一技术日益走进大众视野,这也预示着一个由生成式AI塑造的未来正在加速到来。与此同时,MetaAIMetaAI在2023年推出了LLama(LargeLan
Qpeterqiufengyi
·
2025-01-20 07:38
llama
BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术
团队近期发布的BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分:DynamicShape场景下显存优化的背景与挑战BladeDISC++的创新解决方案
Llama2
·
2025-01-17 20:51
人工智能机器学习分布式阿里云
大模型实战—Ollama 本地部署大模型
AI的应用范围广泛,从自动驾驶汽车到语音助手,再到智能家居系统,都有着AI的身影,而随着Facebook开源
LLama2
更让越来越多的人接触到了开源大模型。
猫猫姐
·
2024-09-12 16:34
大模型
大模型
Langchain + Ollama
运行起来后,使用langchain加载fromlangchain.llmsimportOllamaollama=Ollama(base_url='http://localhost:11434',model="
llama2
AI工程仔
·
2024-09-10 15:23
LLM
&
AIGC
langchain
ollama
rag
本地电脑大模型系列之 20 离线 AI:使用 Ollama+llama3+privateGPT+Langchain+GPT4ALL+ChromaDB 与 Pdf、Excel、CSV、PPTX、PPT、
Windows至少需要16GBRAMpython3.10和git系列文章《本地电脑搭建StreamDiffusion:用眼睛见证实时人工智能创意利用交互式高速扩散技术彻底改变图像生成》权重1,本地类《使用本地
Llama2
知识大胖
·
2024-09-01 10:10
NVIDIA
GPU和大语言模型开发教程
人工智能
langchain
pdf
Code Llama: Open Foundation Models for Code论文阅读
都是基于
Llama2
。
yang_daxia
·
2024-08-27 18:46
大模型
llama
codellama
使用LangChain和
LLaMA2
构建自然语言SQL查询助手
使用LangChain和
LLaMA2
构建自然语言SQL查询助手引言在当今数据驱动的世界中,能够轻松查询和分析数据库中的信息变得越来越重要。然而,并非所有人都精通SQL语言。
qq_37836323
·
2024-08-24 08:14
langchain
sql
数据库
python
3月18日,每日信息差
据介绍,该平台支持广泛的AI模型,包括目前主流的Baichuan-7B、GeminiNano、
Llama2
和智谱
信息差Pro
·
2024-03-25 09:26
信息差Pro
人工智能
tomcat
java
ffmpeg
数据库
LLaMA 2 - 你所需要的一切资源
摘录关于
LLaMA2
的全部资源,如何去测试、训练并部署它。
LLaMA2
是一个由Meta开发的大型语言模型,是LLaMA1的继任者。
·
2024-02-19 21:59
llama人工智能
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他