E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
llama
大模型生态开源工具整理
最近一直在做大模型应用开发工作,总结下用到的一些开源工具1-模型训练
LLaMA
-Factory整体介绍
LLaMA
-Factory是一个开源的微调框架,为开发者提供简便高效的工具,以便在预训练模型基础上快速适应特定任务需求
miracletiger
·
2025-02-07 08:35
开源
Ollama安装部署deepseek
目录Ollama安装软件(Windows)安装软件(Linux)安装软件(Docker)最简单下载模型下载Ollama内置的模型下载
llama
3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3
angel725
·
2025-02-07 02:53
llama
ai
大模型面试必看!超详细面经指南+答案,轻松拿Offer!2025大模型上岸就靠它了!
[x]大模型(LLMs)进阶面[x]1.
llama
输入句子长度理论上可以无限长吗?[x]1.什么是LLMs复读机问题?[x]2.为什么会出现LLMs复读机问题?[x]3.如何缓解LLMs复读机问题?
AI大模型-大飞
·
2025-02-06 16:47
大模型
AI大模型
大模型教程
人工智能
学习
LLM
Deepseek
llama
.cpp LLM_ARCH_DEEPSEEK and LLM_ARCH_DEEPSEEK2
llama
.cppLLM_ARCH_DEEPSEEKandLLM_ARCH_DEEPSEEK21.`LLM_ARCH_DEEPSEEK`and`LLM_ARCH_DEEPSEEK2`2.
Yongqiang Cheng
·
2025-02-06 06:42
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK
DEEPSEEK2
DataWhale wow-agent task 2:
llama
-index搭建电商数据库查询&课本问答agent
llama
-index库之于openai库的优势方便连接外部数据SQL数据库操作配置对话模型创建数据库对话引擎
llama
中的NLSQLTableQueryEng
Meteora1024875
·
2025-02-05 18:07
数据库
llama
llama
.cpp GGML Quantization Type
llama
.cppGGMLQuantizationType1.GGMLQuantizationType2.
Yongqiang Cheng
·
2025-02-05 18:06
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
GGML
Quantization
在Ubuntu 22.04 LTS下编译
llama
.cpp(基于OpenBLAS)
步骤如下:a.安装make、C++、pkg-config:sudoaptinstallmakeg++pkg-configb.安装openblas-lapack:wgethttps://github.com/xianyi/OpenBLAS/releases/download/v0.3.27/OpenBLAS-0.3.27.tar.gztarzxvfOpenBLAS-0.3.27.tar.gzsudo
m0_70960708
·
2025-02-05 18:35
笔记
ubuntu
llama
linux
运行 Deepseek 视觉模型的方法
推荐文章《24GBGPU中的DeepSeekR1:UnslothAI针对671B参数模型进行动态量化》权重1,DeepSeek类《在RaspberryPi上运行语音识别和
LLaMA
-2GPTWhisperASR
知识大胖
·
2025-02-05 13:30
NVIDIA
GPU和大语言模型开发教程
deepseek
人工智能
如何利用DeepSeek打造医疗领域专属AI助手?从微调到部署全流程解析
一、基座模型选型:医疗推理的黄金搭档1.1为什么选择DeepSeek-R1-Distill-
Llama
-8
明哲AI
·
2025-02-05 10:05
AIGC
人工智能
机器学习
Deepseek
大模型
Ollama能本地部署
Llama
3等大模型的原因解析(ollama核心架构、技术特性、实际应用)
、
Llama
3模型的技术特性2.1、模型架构2.2、模型性能3.
周杰伦_Jay
·
2025-02-05 03:19
大模型LLMs
llama
架构
transformer
深度学习
人工智能
数据结构
使用Ollama本地化部署DeepSeek
多模型支持:兼容多种开源模型,如
LLaMA
、DeepSeek等。高效管理:提供命令行工具,方便用户下载
·
2025-02-05 02:15
大模型llm人工智能
Llama
最新开源大模型
Llama
3.1
Meta公司于2024年7月23日发布了最新的开源大模型
Llama
3.1,这是其在大语言模型领域的重要进展。
kcarly
·
2025-02-04 21:32
LLaMA2
食用指南
llama
开源
开源大模型
Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型,旨在以更少的参数和计算量实现更高的准确率
性能优异:在代码生成、数学解题、科学知识和推理等多个领域展现出与
Llama
3-70B等大型模型相当甚至更优的性能。模型结构
东方佑
·
2025-02-04 06:01
量子变法
架构
语言模型
人工智能
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在预训练新的大模型,在
Llama
2或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
最强开源大模型炸场!全网独一份AI大模型学习实践资源...(待会删)
Meta发布
Llama
3系列模型,号称「最强大的开源大模型」,震撼科技圈!毫不夸张地说,AI大模型正在颠覆程序员的价值!
大模型应用
·
2025-02-02 21:11
人工智能
大数据
prompt
langchain
Agent
ai大模型
LLM
本地部署LLM工具大比拼:谁才是你的智能之选?
今天,就带大家深入对比几款热门的本地部署LLM工具:ollama、Llamafile、jan、
LLaMa
.cpp、GPT4All、LMStudio,从多个关键角度剖析它们的特点与优势,助你挑选出最契合自身需求的智能伙伴
Python_金钱豹
·
2025-02-02 21:10
microsoft
ocr
人工智能
cnn
transformer
分类
国产大模型 DeepSeek,能跟 ChatGPT 一战,还不用梯子,确定不试试?
深度求索公司最新推出的自研MoE模型DeepSeek-V3,多项评测成绩超越了Qwen2.5-72B和
Llama
-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude
集成显卡
·
2025-02-02 21:38
AI/人工智能
chatgpt
什么是LLM?看这一篇就够了!
GPT、
LLaMA
、M
Python程序员罗宾
·
2025-02-02 14:50
人工智能
语言模型
AIGC
自然语言处理
在Windows上用
Llama
Factory微调
Llama
3的基本操作
这篇博客参考了一些文章,例如:教程:利用
LLaMA
_Factory微调
llama
3:8b大模型_
llama
3模型微调保存-CSDN博客也可以参考LlamaFactory的Readme:GitHub-hiyouga
蛐蛐蛐
·
2025-02-02 13:16
深度学习
Python技巧
科研工具
llama
【llm对话系统】大模型
Llama
源码分析之并行训练方案
Llama
作为当前最流行的开源大模型之一,其训练代码中采用了多种并行技术。本文将深入
Llama
的训练代码,分析其并行训练方案,主要关注参数并行和部分结构参数共享。
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm对话系统】大模型
Llama
源码分析之 LoRA 微调
本文将深入分析LoRA的原理,并结合
Llama
源码解读其实现逻辑,最后探讨LoRA的优势。2
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【llm对话系统】大模型
Llama
源码分析之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型语言模型(LLM)在自然语言处理(NLP)领域取得了巨大的成功。Transformer的核心组件是自注意力(Self-Attention)机制,它允许模型捕捉输入序列中不同位置之间的关系。然而,标准的自注意力机制的计算复杂度与序列长度的平方成正比,这使得它在处理长序列时效率低下。为了解决这个问题,FlashAttention被提出,它是一种高
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
llama
.cpp LLM_CHAT_TEMPLATE_DEEPSEEK_3
llama
.cppLLM_CHAT_TEMPLATE_DEEPSEEK_31.`
LLAMA
_VOCAB_PRE_TYPE_DEEPSEEK3_LLM`2.
Yongqiang Cheng
·
2025-02-02 12:10
ggml
-
llama.cpp
-
whisper.cpp
llama.cpp
DEEPSEEK_3
【明明安装flash-attn成功,但是import的时候报错】
Thismodelingfilerequiresthefollowingpackagesthatwerenotfoundinyourenvironment:flash_attn.明明安装flash-attn成功,但是import的时候报错问题描述:运行
Llama
2
厂泉心
·
2025-02-02 12:07
python
自然语言处理
【llm对话系统】大模型
Llama
、Qwen 和 ChatGLM 的网络结构和训练方法对比
1.引言近年来,大型语言模型(LLM)取得了令人瞩目的进展,其中
Llama
、Qwen和ChatGLM是三个备受关注的开源模型。
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
开源LLMs导览:工作原理、顶级LLM列表对比
4.1BERT4.2
LLaMA
(LargeLanguageModelM
万俟淋曦
·
2025-02-01 23:11
Some
Insights
人工智能
AI
生成式人工智能
大模型
LLM
chatgpt
大语言模型
深入探索
Llama
.cpp:在LangChain中使用
llama
-cpp-python
深入探索
Llama
.cpp:在LangChain中使用
llama
-cpp-python随着大语言模型(LLMs)的普及,开发者需要更有效的方法来部署和使用这些模型。
dfvcbipanjr
·
2025-02-01 16:10
python
llama
langchain
使用Ollama本地化部署DeepSeek
多模型支持:兼容多种开源模型,如
LLaMA
、DeepSeek等。高效管理:提供命令行工具,方便用户下载
·
2025-02-01 16:48
大模型llm人工智能
Llama
大型语言模型原理详解
Llama
大型语言模型是一种基于深度学习的自然语言处理模型,它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。
摆烂大大王
·
2025-01-31 11:40
llama
llama
语言模型
人工智能
中国Deepseek超
Llama
4触发Meta
恐慌模式始于DeepseekV3,它在性能测试中已经超过了
Llama
4。更让人尴尬的是
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
开源大模型(LLM)下载
1、找到对应的模型文件,比如Meta-
Llama
-3-8B,然后找到下载入口2、点击模型下载,有2种下载方式,这里我们通过git下载(注意由于模型文件一般都比较大,直接使用gitclone下载时会有问题
baidu_20834545
·
2025-01-31 06:25
语言模型
【llm对话系统】大模型源码分析之
llama
模型的long context更长上下文支持
1.引言
Llama
模型的一个重要特性是支持长上下文处理。本文将深入分析
Llama
源码中实现长上下文的关键技术点,包括位置编码(positionembedding)的外推方法、注意力机制的优化等。
kakaZhui
·
2025-01-30 12:57
llama
深度学习
pytorch
AIGC
chatgpt
Llama
3:开源大模型的里程碑式突破
标题:
Llama
3:开源大模型的里程碑式突破文章信息摘要:Meta通过
Llama
3展现了开源LLM的重大突破:采用超大规模训练数据和多阶段训练方法(SFT、rejectionsampling、PPO和DPO
XianxinMao
·
2025-01-30 08:50
llama
开源
【深度分析】Deepseek为什么会这么爆火?
这场看似技术跃迁的盛宴,实则是算力霸权崩塌的末日钟声——当中国团队用1/10的显卡数量训练出性能碾压
Llama
3的模型,硅谷引以为傲的暴力堆料范式正在沦为数字时代的蒸汽机车。
精通代码大仙
·
2025-01-30 06:35
深度分析
新媒体运营
创业创新
如何评价deepseek上线的deepseek-V3模型?怎么使用?
该模型在多项评测中表现出色,超越了Qwen2.5-72B和
Llama
-3.1-405B等开源模型,并与世界顶尖的闭源模型如GPT-4o和Claude-3.5-Sonnet相媲美。
百态老人
·
2025-01-30 01:36
学习
【llm对话系统】大模型源码分析之
LLaMA
位置编码 RoPE
本文将深入探讨
LLaMA
模型中使用的RotaryEmbedding(旋转式嵌入)位置编码方法,并对比传统的Transformer位置编码方案,分析其设计与实现的优势。1.传
kakaZhui
·
2025-01-29 23:17
llama
深度学习
人工智能
AIGC
chatgpt
大模型部署工具
llama
.cpp 介绍与安装使用
1.大模型部署工具
llama
.cpp大模型的研究分为训练和推理两个部分。训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,推理结果最优化的过程。
大模型柳儿
·
2025-01-29 18:03
llama
服务器
人工智能
web安全
linux
安全
为什么提到各种本地化部署模型软件时总要提到
llama
.cpp?
为什么提到各种本地化部署模型软件时总要提到
llama
.cpp?
llama
.cpp是一个完整的开源项目,而不是单独的.cpp文件。
风雅GW
·
2025-01-29 18:00
人工智能
llama
人工智能
机器学习
LLM
ai
Llama
.cpp与Python的完美结合:快速入门指南
Llama
.cpp与Python的完美结合:快速入门指南引言在现代AI的浪潮中,
Llama
.cpp提供了一种便捷的方法,将大型语言模型(LLM)集成到您的项目中。
nseejrukjhad
·
2025-01-29 17:29
llama
python
开发语言
Llama
-CPP-Python 教程
Llama
-CPP-Python教程项目地址:https://gitcode.com/gh_mirrors/ll/
llama
-cpp-python1.项目介绍
Llama
-CPP-Python是一个Python
胡寒侃Joe
·
2025-01-29 17:27
RAG:AI大模型联合向量数据库和
Llama
-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和
Llama
-index,助力检索增强生成技术在大模型爆发的时代,快速准确地从大量数据中检索出有价值的信息变得至关重要。
AI学习不迷路
·
2025-01-29 10:21
人工智能
数据库
llama
语言模型
RAG
大模型
AI大模型
A7. Jenkins Pipeline自动化构建过程,可灵活配置多项目、多模块服务实战
此时我们在构建之前也要执行不可用的镜像清除操作;4.本地
LLama
大模型服务地址,如何以容器部署时作
smart_ljh
·
2025-01-29 02:01
AI大模型应用与实战
spring
boot
自动化
后端
自动化构建
服务构建
build
A6.Springboot-
LLama
3.2服务自动化构建(三)——编写Pipeline构建仓库初始化脚本
下面我们接着上一篇文章《A5.Springboot-
LLama
3.2服务自动化构建(二)——Jenkins流水线构建配置初始化设置》继续往下分析,编写Pipeline构建脚本。
smart_ljh
·
2025-01-29 00:50
AI大模型应用与实战
spring
boot
自动化
servlet
jenkins
构建
Ollama 可以设置的环境变量
Llama
3.1是Meta(Facebook的母公司)发布的一系列最先进的开源大语言模型。
Llama
3
刘贤松
·
2025-01-28 22:02
工具
服务器
运维
[论文笔记]
llama
-factory 微调qwen2.5、
llama
3踩坑
pre-tokenize的时候,会OOM解决:在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/
LLaMA
-Factory
心心喵
·
2025-01-28 20:14
论文笔记
深度学习
人工智能
llamafactory0.9.0微调qwen2vl
LLaMA
-Factory/data/README_zh.mdatmain·hiyouga/
LLaMA
-Factory·GitHubEfficientlyFine-Tune100+LLMsinWebUI
Kun Li
·
2025-01-28 15:07
多模态大语言模型
lmm
qwen2vl
实验踩坑 flash_attn_2_cuda undifiend symol
报错RuntimeError:Failedtoimporttransformers.models.
llama
.modeling_llamabecauseofthefollowingerror(lookuptoseeitstraceback
崩溃李
·
2025-01-28 00:51
linux
探索
Llama
3.1:深入理解其多语言与长上下文处理能力
摘要
Llama
3.1,一款先进的语言模型,以其庞大的参数量和卓越的性能而闻名。
技术猿18870278351
·
2025-01-27 08:00
代码技术
llama
对话小羊驼vicuna
文章目录1.gpu租用2.公网网盘存储实例/数据3.登录实例4.预训练模型下载5.
llama
、alpaca、vicuna的前世今生6.对话Vicuna(1)
llama
-2-7b-hf(2)vicuna-
Always_Shine
·
2025-01-27 01:44
大模型
人工智能
深度学习
大模型
自然语言处理
Firefly-
LLaMA
2-Chinese - 开源中文
LLaMA
2大模型
数据列表训练细节增量预训练&指令微调数据格式&数据处理逻辑增量预训练指令微调模型推理权重合并模型推理部署关于github:https://github.com/yangjianxin1/Firefly-
LLaMA
2
伊织产研
·
2025-01-27 00:07
Firefly-LLaMA2
LLaMA-2
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他