LLaMA 第3页

2025年大模型学习路线图：史上最全、最新的大模型学习指南！非常详细收藏这一篇就够了！

大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本前排提示，文末有大模型AGI-CSDN独家资料包哦

大模型教程·2025-06-15 16:42

Llama 4 群：原生多模态 AI 创新新时代的开始

我们正在分享Llama4群中的首批模型，这将使人们能够构建更加个性化的多模式体验。

爱分享的小明·2025-06-15 11:04

在 Windows 和 Linux 系统上安装和部署 Ollama

引言Ollama是一个强大的本地大语言模型（LLM）运行工具，允许用户轻松下载和运行不同的AI模型，如LLaMA、Mistral和Gemma。

萧鼎·2025-06-13 10:34

大模型笔记_模型微调

1.大模型微调的概念大模型微调（Fine-tuning）是指在预训练大语言模型（如GPT、BERT、LLaMA等）的基础上，针对特定任务或领域，使用小量的目标领域数据对模型进行进一步训练，使其更好地适配具体应用场景的过程

饕餮争锋·2025-06-13 02:12

OpenPrompt 是什么？

OpenPrompt是一个基于自然语言处理（NLP）的提示工程（PromptEngineering）工具/框架，主要用于帮助开发者设计、优化和管理自然语言模型（如GPT、LLaMA等）的提示词（Prompt

ZhangJiQun&MXP·2025-06-12 22:37

网络受限情况下，在Ollama中导入从Model Scope下载的safetensors提示错误Error: unsupported architecture “Qwen3ForCausalLM“

Ollamasupportsimportingmodelsforseveraldifferentarchitecturesincluding:Llama(includingLlama2,Llama3,Llama3.1

stupidorclever·2025-06-12 12:30

13.7亿级用户订阅系统架构实战：Stripe支付集成+LLaMA动态权限控制

亿级用户订阅系统架构实战：Stripe支付集成+LLaMA动态权限控制关键词：订阅系统架构设计、支付接口集成、订阅生命周期管理、用户权限控制、SaaS计费模型订阅模式技术实现详解在LanguageMentor

少林码僧·2025-06-11 07:07

Ai自动补全编程工具:llama vscode

CIb0la·2025-06-10 13:22

大语言模型（LLM）中的KV缓存压缩与动态稀疏注意力机制设计

传统注意力机制的计算复杂度随序列长度呈二次方增长，而KV缓存的内存消耗可能高达数十GB（例如Llama2-7B处理100Ktoken时需50GB内存）。

华清远见成都中心·2025-06-10 12:19

【大模型入门】2025年大模型学习路线图：史上最全、最新的学习指南，助你成为AI领域的佼佼者！

大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本前排提示，文末有大模型AGI-CSDN独家资料包哦

·2025-06-10 12:15

【LLaMA-Factory实战】Web UI快速上手：可视化大模型微调全流程

LLaMA-Factory的WebUI（LlamaBoard）提供了低代码可视化平台，支持从模型加载、数据管理到训练配置的全流程操作。本文将结合结构图、代码示例和实战命令，带您快速掌握这一核心工具。

陈奕昆·2025-06-10 05:57

【大模型】大模型分布式训练问题（上）

以LLaMA2-13b为例，按1

油泼辣子多加·2025-06-09 16:59

LLaMA Factory 微调与量化模型并部署至 Ollama

以下是使用LLaMAFactory进行模型微调与量化，并部署至Ollama的分步指南：一、环境准备安装LLaMAFactorygitclonehttps://github.com/hiyouga/LLaMA-Factory.gitcdLLaMA-Factorypipinstall-rrequirements.txt

GGlow·2025-06-09 15:26

边缘AI推理突破：树莓派5运行Llama3-13B的异构计算极致优化指南

ARMCortex-A76CPU峰值算力仅0.5TFLOPS，远低于GPU服务器内存墙限制：8GBLPDDR4X内存难以容纳原始FP16模型（约26GB）能耗约束：5WTDP下需平衡性能与散热本文将深入探讨基于树莓派5的Llama3

尘烬海·2025-06-09 00:38

构建面向大模型训练与部署的一体化架构：从文档解析到智能调度

作者：汪玉珠｜算法架构师标签：大模型训练、数据集构建、GRPO、自监督聚类、指令调度系统、Qwen、LLaMA3背景与挑战随着Qwen、LLaMA3等开源大模型不断进化，行业逐渐从“能跑通”迈向“如何高效训练与部署

weixin_40941102·2025-06-08 10:56

基于Firecrawl和Llama 3构建网站问答机器人实战指南

基于Firecrawl和Llama3构建网站问答机器人实战指南firecrawlTurnentirewebsitesintoLLM-readymarkdown项目地址:https://gitcode.com

陆璞朝Jocelyn·2025-06-08 04:16

大模型呼叫中心场景分享之七：银行业如何使用大模型呼叫中心

大模型呼叫中心场景分享之七：银行业如何使用大模型呼叫中心作者：开源大模型呼叫中心系统FreeIPCC1.引言随着人工智能（AI）和大模型（如DeepSeek、GPT、Claude、Llama、KIMI、

FreeIPCC·2025-06-07 19:46

CMake find_package(CUDAToolkit) 报错，找不到 CUDA_CUDART

安装llama-cpp-python时，使用GPU版本，系统版本是Ubuntu22.04cuda版本是12.1安装命令：CMAKE_ARGS="-DLLAMA_CUBLAS=on"pipinstallllama-cpp-python

0语1言·2025-06-07 18:40

架构师炼丹炉 | 大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama

原文链接：大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX和Ollama本文将带你深入了解Transformers、vLLM、Llama.cpp、SGLang

双木的木·2025-06-07 18:39

五大主流大模型推理引擎深度解析：llama.cpp、vLLM、SGLang、DeepSpeed和Unsloth的终极选择指南

在人工智能的竞技场上，大模型推理框架就像是为超级跑车精心调校的引擎系统——选对了能让你的AI应用一骑绝尘，选错了可能连"停车场"都开不出去。这些框架的核心价值在于将训练好的"大脑"转化为实际可用的"肌肉记忆"，而选择标准则需要像职业赛车手挑选装备般精准。在人工智能的竞技场上，大模型推理框架就像是为超级跑车精心调校的引擎系统——选对了能让你的AI应用一骑绝尘，选错了可能连"停车场"都开不出去。这些框

我就是全世界·2025-06-07 18:37

在Windows下编译出llama_cpp_python的DLL后，在虚拟环境中使用方法

VS2022编译完成后，在构建目录（如build/Release或build/Debug）中寻找以下关键文件：ggml.dll、ggml_base.dll、ggml_cpu.dll、ggml_cuda.dll、llama.dll

晨尘光·2025-06-07 18:37

【AI】大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama，最佳选择？

近年来，大语言模型（LLMs）如GPT、LLaMA、BERT等已经成为人工智能领域的核心驱动力。然而，如何高效地运行和优化这些模型，成为了开发者和研究者面临的重要挑战。

厦门德仔·2025-06-07 12:02

LLaMA-Factory环境安装-重点总结

问题：在使用官网介绍的博客，进行安装，比较顺利。只不过，在需要推理加速时，UI界面上，给出的选项所支持的FlashAttention-2和Unsloth，不好实现。在进行一系列的调整，总结如下：想要同时实现FlashAttention-2和Unsloth推理加速的环境安装方式：以Ubuntu22.04RTX409024GB为例：1.系统配置：CUDA版本选择12.2.x，因为高版本的flash-a

丁兆海1991·2025-06-07 12:01

LLaMA-Factory的5种推理方式总结

LLaMA-Factory作为一款开源的大语言模型微调与推理框架，提供了5种核心推理方式，覆盖从本地调试到生产部署的全流程需求。

勤奋的知更鸟·2025-06-07 12:00

LLaMA-Factory 微调 Qwen2-VL 进行人脸情感识别（二）

在上一篇文章中，我们详细介绍了如何使用LLaMA-Factory框架对Qwen2-VL大模型进行微调，以实现人脸情感识别的功能。

anneCoder·2025-06-07 12:30

本地电脑大模型系列之 15 如何使用 Meta Llama 3 通过 Ollama 和 Wren AI 查询 MySQL 数据库

简介在这篇博客中，我们将逐步探讨在Ollama和WrenAI的帮助下使用MetaLlama3进行无缝数据库查询的过程。这种技术组合使您可以在自己的服务器中托管AI助手，您可以在自己的环境中向WrenAI询问任何业务问题并立即获得结果，而无需编写SQL。系列文章《本地电脑搭建StreamDiffusion：用眼睛见证实时人工智能创意利用交互式高速扩散技术彻底改变图像生成》权重1，本地类《使用本地Ll

知识大胖·2025-06-05 18:14

Ollama提供的WebUI界面

Ollama提供了一个WebUI界面，旨在让用户能够更方便地通过浏览器与本地运行的LLaMA模型进行交互。

中工钱袋·2025-06-05 18:40

大语言模型学习笔记

transformer能够聚焦于输入序列中的重要部分，类似于人类阅读时关注关键词2、模型大小与性能关系：与小模型架构相似，但参数量级提升带来解决复杂任务的显著优势3、LLM国内外代表：国外有GPT系列、LLaMA

wyzgq0515·2025-06-05 10:21

【大模型入门指南 10】大模型推理部署：vLLM和llama.cpp

青松ᵃⁱ·2025-06-05 06:18

(LLaMa Factory)大模型训练方法--准备模型（Qwen2-0.5B）

1、准备训练框架LLaMAFactory是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过WebUI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架。2、运行环境要求硬件：GPU：推荐使用24GB显存的显卡或者更高配置软件：python：3.10pytorch：2.1.2+cuda12.1操作系统：Ubuntu22.043、准备训练模型在开展大模型训练之前，由于

风起晨曦·2025-06-04 23:21

【仿生系统】qwen的仿生机器人解决方案

模块化可进化架构）1.多模态感知引擎-视觉子系统：YOLOv8+SAM组合实现实时物体检测+场景语义分割-听觉子系统：Whisper+SpeakerEmbedding+情感识别三重处理-语言理解：基于LLaMA3

DFminer·2025-06-03 04:39

【深度学习新浪潮】以Dify为例的大模型平台的对比分析

适用群体、易用性、可扩展性和安全性五个维度展开对比分析：一、核心功能对比平台核心功能多模型支持插件与工具链Dify低代码开发、RAG增强、Agent自律执行、企业级安全支持GPT-4/5、Claude、Llama3

小米玄戒Andrew·2025-06-02 21:40

探索AI人工智能领域Llama的知识图谱融合

探索AI人工智能领域Llama的知识图谱融合关键词：AI人工智能、Llama、知识图谱融合、大语言模型、语义理解摘要：本文聚焦于AI人工智能领域中Llama大语言模型与知识图谱的融合。

AI大模型应用实战·2025-06-02 10:58

node-llama-cpp开源程序使用 llama.cpp 的 node.js 绑定在计算机上本地运行 AI 模型。在生成级别的模型输出上强制实施 JSON 架构

一、软件介绍文末提供程序和源码下载node-llama-cpp开源程序使用llama.cpp的node.js绑定在计算机上本地运行AI模型。在生成级别的模型输出上强制实施JSON架构。

struggle2025·2025-06-01 21:19

OpenAI重磅回归开源！首发推理模型不限商用，直面DeepSeek挑战

（为了阴阳Llama，奥特曼甚至“铁树开花了”）第二，OpenAI完成最新400亿美元融资，投后估值3000亿

奋斗的java小伙·2025-06-01 11:14

Spring Boot 深度集成 Ollama 指南：从聊天模型配置到生产级应用开发

Ollama作为开源的本地LLM运行平台，支持Mistral、LLaMA等主流模型，并提供与OpenAI兼容的API接口，而SpringAI则为Java开发者提供了便捷的集成工具链。

-曾牛·2025-05-28 22:58

最强开源模型 Llama 3.1 部署推理微调实战大全

目录引言一、Llama3.1简介二、Llama3.1性能评估三、Llama3.1模型推理实战1、环境准备2、安装依赖3、模型下载4、模型推理四、Llama3.1模型微调实战1、数据集准备2、导入依赖包3

寻道AI小兵·2025-05-28 15:08

[AI Meta Llama-3] 最强开源大模型Llama 3发布！

最强开源大模型Llama3发布！我们看下重点：今天，我们介绍MetaLlama3，这是我们最先进的开源大型语言模型的下一代。

从零开始学AI·2025-05-28 15:36

太卷了，Meta最强开源大模型Llama 3开源了，不要错过

准备工作在开始使用Llama3之前，我们首先需要进行一些基础的准备工作。首先是访问MetaLlama官网以

deepseek大模型·2025-05-28 15:35

Large-Scale Language Models: In-Depth Principles and Pioneering Innovations

从BERT的语义洞察到GPT系列的生成奇迹，再到Grok、LLaMA等模型的跨界创新，LLMs在智能对话、代码生成、科学探索等领域展现出近乎人类的水准，本文以清晰的逻辑和优雅的笔触，深入剖析LLMs的架构

Kelaru·2025-05-28 06:33

大模型「瘦身」指南：从LLaMA到MobileBERT的轻量化部署实战

大模型「瘦身」指南：从LLaMA到MobileBERT的轻量化部署实战系统化学习人工智能网站（收藏）：https://www.captainbed.cn/flu文章目录大模型「瘦身」指南：从LLaMA到

layneyao·2025-05-27 05:16

一文彻底搞懂大语言模型：GPT与LlaMA的架构设计对比

目录一、Transformer：大模型的核心底座1.1Transformer架构全景图二、GPT系列：Decoder-Only的进化之路2.1GPT发展里程碑2.2GPT-2架构详解三、LlaMA：开源模型的架构创新

Sonal_Lynn·2025-05-27 01:20

Llama 4以光速重塑AI推理边界

Llama4Maverick模型在单节点（8颗BlackwellGPU）上实现每秒1000token的生成速度，这一数字不仅超越了前代Blackwell的基线表现，更让单台服务器（72颗GPU）的吞吐量飙升至

TGITCIC·2025-05-26 17:14

Scikit-LLM：大模型加持的scikit-learn

这种集成将GPT、Vertex、Gemma、Mistral、Llama等大型语言模型的强大功能带入了scikit-learn生态系统，使其成为机器学习爱

新缸中之脑·2025-05-26 13:18

facebook开源Triton编写GPU内核的编程模型速读：KernelLLM

KernelLLM一、引言KernelLLM是一个基于Llama3.1Instruct的大型语言模型，专为使用Triton编写GPU内核的任务而训练。

Open-source-AI·2025-05-24 13:06

【大模型面试每日一题】Day 16：为什么SwiGLU激活函数在LLaMA等模型中取代ReLU？从梯度和稀疏性角度分析

【大模型面试每日一题】Day16：为什么SwiGLU激活函数在LLaMA等模型中取代ReLU？

是麟渊·2025-05-23 06:26

LlamaIndex 项目安装和配置指南

LlamaIndex项目安装和配置指南llama_index项目地址:https://gitcode.com/gh_mirrors/lla/llama_index1.项目基础介绍和主要编程语言项目基础介绍

冯伊沙Giles·2025-05-23 03:37

如何基于自定义MCP服务器构建支持工具调用的Llama智能体（含code）

本文将详细介绍如何构建一个完全本地化的AI智能体，通过自定义的ModelContextProtocol（MCP）服务器实现知识隔离，并结合Llama3.2轻量级模型实现工具调用能力。

大模型之路·2025-05-23 01:26

Vllm框架入门及本地私有化部署

主流框架对比目前主流大模型部署框架包括llama.cpp、Ollama和Vllm，其在Gi

Zhong Yang·2025-05-22 20:28

使用 LlamaIndex 构建 RAG 应用程序

像ChatGPT和Llama这样的大型语言模型(LLM)擅长解答问题，但受限于它们所训练的知识。它们无法访问私人数据，也无法学习超出训练范围的知识。所以，关键在于……我们如何扩展它们的知识？

爱分享的小明·2025-05-22 10:26

推荐频道

LLaMA