E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Models
TPAMI 2023:Constructing Stronger and Faster Baselines for Skeleton-based Action Recognition
ConstructingStrongerandFasterBaselinesforSkeleton-basedActionRecognitionAbstract1.INTRODUCTION2.RELATEDWORK2.1Efficient
Models
3
盖盖的博客
·
2025-05-05 03:31
论文相关
transformer
深度学习
人体行为识别
Aspose.Words for .NET 24 Crack
Aspose.Wordsfor.NET24CrackAspose.Wordsfor.NET24.11allowsyoutoeffortlesslyextractkeyinsightsfromlengthydocumentsusingadvancedgenerativeAI
models
.Aspose.Wordsfor.NETisasoftwaredevelopmentlibrarythatempow
SEO-狼术
·
2025-05-05 01:48
Delphi
net
Crack
数据库
Stop Overthinking: A Survey on Efficient Reasoning for Large Language
Models
文章目录摘要1引言2背景:长思维链推理模型与过度思考现象2.1思维链(CoT)推理2.2长CoT推理模型中的过度思考问题3基于模型的高效推理3.1基于长度奖励设计的强化学习(RL)3.2使用可变长度CoT数据的监督微调(SFT)3.2.1构建可变长度CoT推理数据集3.2.2微调方法4基于推理输出的高效推理4.1将推理步骤压缩为更少的潜在表示4.2推理过程中的动态推理范式4.2.1基于显式标准的动
绒绒毛毛雨
·
2025-05-04 18:00
搜索推荐
语言模型
人工智能
自然语言处理
No module named ‘llama_index.readers‘
from
models
copeimportsnapshot_download#1、下载模型##推理模型model_dir=snapshot_download(model_id="deepseek-ai/DeepSeek-R1
GIS从业者
·
2025-05-04 17:56
python
llama
人工智能
deepseek
论文阅读:2024 arxiv Jailbreaking Black Box Large Language
Models
in Twenty Queries
总目录大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328JailbreakingBlackBoxLargeLanguage
Models
inTwentyQuerieshttps
CSPhD-winston-杨帆
·
2025-05-04 12:55
论文阅读
语言模型
人工智能
Diffusion Model相关论文解析之(一)Denoising Diffusion Probabilistic
Models
目录1、摘要2、创新点3、主要公式4、主要实现过程1、摘要DenoisingDiffusionProbabilistic
Models
(DDPMs)是一种基于参数化的马尔可夫链的模型,它使用变分推理进行训练
mm_exploration
·
2025-05-04 07:53
Diffusion论文解读
python
pytorch
diffusion
计算机视觉
python kafka与flask_socketio的使用
#create_app.pyfromflaskimportFlask,current_appfrom
models
.modelimportdbfromflask_corsimportCORSfromsocketio_appimportsocketiofromutils.web_scoket.indeximportindex_bluefromviews.viewimportblue1defcreate
菜鸡的我想成为高手
·
2025-05-04 03:02
flask
python
后端
kafka
flask_scoketio
Large Language
Models
Could Be Rote Learners
主要内容研究背景:大语言模型(LLMs)发展迅速,基于选择题(MCQ)基准的评估方法广泛应用,但基准污染问题影响评估可靠性。研究方法预调查:将MMLU基准测试集的MCQ分为记忆和非记忆子集,通过对比模型在不同子集上的准确率,发现LLMs在记忆的MCQ上表现更差,表明存在死记硬背和真正能力学习两种现象。量化记忆:提出一种基于生成序列中低概率词元的记忆量化指标FmF_{m}
UnknownBody
·
2025-05-03 19:33
LLM
Daily
语言模型
人工智能
自然语言处理
Switch Transformers:核心贡献与MoE的区别
SwitchTransformers:核心贡献与MoE的区别《SwitchTransformers:ScalingtoTrillionParameter
Models
withSimpleandEfficientSparsity
阿正的梦工坊
·
2025-05-03 18:31
LLM
DL
Papers
Deep
Learning
人工智能
机器学习
【深度学习】LoRA: Low-Rank Adaptation of Large Language
Models
,论文解读
文章:https://arxiv.org/abs/2106.09685文章目录摘要介绍LoRA的特点什么是低秩适应矩阵?什么是适应阶段?低秩适应矩阵被注入到预训练模型的每一层Transformer结构中,这一步是如何做到的?摘要自然语言处理的一个重要范式是在通用领域数据上进行大规模预训练,并适应特定任务或领域。随着我们预训练更大的模型,全面微调,即重新训练所有模型参数,变得不太可行。以GPT-31
XD742971636
·
2025-05-03 13:54
深度学习机器学习
深度学习
语言模型
人工智能
论文笔记:How Can Large Language
Models
Understand Spatial-Temporal Data?
arxiv2024011introLLM在NLP和CV领域表现出色,但将它们应用于时空预测任务仍然面临挑战,主要问题包括:数据不匹配传统的LLMs设计用于处理序列文本数据,而时空数据具有复杂的结构和动态性,这两者之间存在显著差异模型设计限制现有的时空预测方法通常需要为特定领域设计专门的模型,这限制了模型的通用性和适应性数据稀缺和泛化能力传统的时空预测方法在面对数据稀缺或稀疏的情况下表现不佳,且泛化
UQI-LIUWJ
·
2025-05-03 13:23
论文笔记
论文阅读
语言模型
人工智能
深入解析Transformer:LLM大模型的核心架构
大量的研究从n元语言模型(n-gramLanguage
Models
)、神经语言模型(NeuralLanguage
Models
,NLM)以及预训练语言模型(Pre-trainedLan
bishedaima_com_q
·
2025-05-03 10:39
transformer
深度学习
人工智能
WPF+MVVM案例实战与特效(二十四)- 粒子字体效果实现
界面与功能代码3、总结1、案例效果提示:这里可以添加本文要记录的大概内容:2、案例实现1、文件创建打开Wpf_Examples项目,在Views文件夹下创建窗体界面ParticleWindow.xaml,在
Models
凌霜残雪
·
2025-05-03 06:35
WPF实战案例与特效系列
wpf
字体粒子特效
首发!Llama3纯本地部署攻略!中文方法!
日刚刚发布,官方的对比结果中在开源模型中堪称世界第一,整好周六日有时间,在魔搭社区上测试一下一、启动环境登录魔搭社区,到自己的机器资源,可以看到,可选的机器配置,这里我们选择:8核32G内存,24G显存;预装
ModelS
cope
添财小哥
·
2025-05-03 04:21
人工智能
论文翻译:Universal and Transferable Adversarial Attacks on Aligned Language
Models
UniversalandTransferableAdversarialAttacksonAlignedLanguage
Models
https://arxiv.org/pdf/2307.15043v2通用且可转移的对抗性攻击对齐语言模型文章目录通用且可转移的对抗性攻击对齐语言模型摘要
CSPhD-winston-杨帆
·
2025-05-03 03:48
LLMs-安全
论文翻译
语言模型
人工智能
自然语言处理
论文阅读:2023 arxiv Survey of Vulnerabilities in Large Language
Models
Revealed by Adversarial Attacks
总目录大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328SurveyofVulnerabilitiesinLargeLanguage
Models
RevealedbyAdversarialAttacks
CSPhD-winston-杨帆
·
2025-05-03 03:48
论文阅读
LLMs-安全
论文阅读
语言模型
人工智能
【python】【keras】【optimizers.py】【优化器】
Abstractoptimizerbaseclass.Note:thisistheparentclassofalloptimizers,notanactualoptimizerthatcanbeusedfortraining
models
.AllKerasoptimizerssupportthefollowingk
资源存储库
·
2025-05-03 00:55
python
开发语言
Paddlex 安装错误
ValueError:signalonlyworksinmainthreadFile"F:\ProgramData\Anaconda3\envs\yolo5\lib\site-packages\paddlex\cv\
models
走错路的程序员
·
2025-05-02 03:36
机器视觉
python
AI推介-大语言模型LLMs论文速览(arXiv方向):2024.04.25-2024.05.01
文章目录~1.SoftPreferenceOptimization:AligningLanguage
Models
toExpertDistributions2.RepEval:EffectiveTextEvaluationwithLLMRepresentation3
小小帅AIGC
·
2025-05-01 17:35
LLMs论文时报
人工智能
语言模型
深度学习
自然语言处理
机器学习
LLM
大语言模型
【人工智能】Tensorflow深度学习模板(极简版)
模型定义importtensorflowastffromtensorflow.kerasimportlayers,
models
,optimizers,losses,metrics,callbacksimportnumpyasnp
ImDebuging
·
2025-05-01 15:21
人工智能
tensorflow
python
deepseek-mcp-server:无缝集成深度语言模型的解决方案
deepseek-mcp-server:无缝集成深度语言模型的解决方案deepseek-mcp-serverModelContextProtocolserverforDeepSeek'sadvancedlanguage
models
凌朦慧Richard
·
2025-05-01 09:10
ai agent(智能体)开发 python基础2 包名、类名、变量名 方法名 命名规则
示例:#正确users#包名(存放用户相关模块)user_
models
#允许下划线,但尽量简短(若需明确语义)#错误UserPackage#大写开头user-package#含连字符2.模块(Module
一刀到底211
·
2025-05-01 09:08
python3
agent
python
开发语言
Kotlin协程在Android开发中的核心技术解析与最佳实践
CoroutineScope)协程构建器(launch/async)调度器(Dispatchers)挂起函数(suspend)二、技术架构1.分层实现方案表示层(UI)├─ViewModel←view
ModelS
cope
奋斗理想
·
2025-05-01 09:37
Kotlin
android
android
kotlin
Django 07
今日考题1.必知必会N条都有哪些,每个都是干啥使的
models
.User.objects.all()#查询所有数据
models
.User.objects.filter()#带有过滤条件的查询
models
.User.objects.get
右耳要加油
·
2025-05-01 01:19
Django
django
python
后端
django admin 中更新表数据 之后再将数据返回管理界面
例如:#
models
.pyfromdjango.dbimport
models
classM
计算机辅助工程
·
2025-05-01 00:46
django
sqlite
数据库
spring-ai-mcp:Java 应用与 AI 模型的标准化接口
spring-ai-mcpJavaSDKfortheModelContextProtocol(MCP),providingseamlessintegrationbetweenJavaandSpringapplicationsandMCP-compliantAI
models
andtools
马兰菲
·
2025-04-30 22:58
全量微调Llama2-7b遇到的错误(stanford_alpaca)_bash pretrain_llama2_7b_distributed_zl200
项目地址:GitHub-tatsu-lab/stanford_alpaca:CodeanddocumentationtotrainStanford’sAlpaca
models
,andgeneratethedata.CodeanddocumentationtotrainStanford
2401_84009679
·
2025-04-30 21:54
程序员
bash
开发语言
WPF 程序监控硬件设备状态变化的实现方案
1.项目结构设计HardwareMonitor/├──
Models
/#数据模型│└──DeviceStatus.cs├──Services/#硬件服务层│├──IDeviceService.cs│└──
CoderIsArt
·
2025-04-30 20:43
C#
设备制造
wpf
windows
2.2 主流大模型架构:GPT、DeepSeek、GLM、Claude、QwQ、Qwen2.5-Max等模型的比较与应用场景
大语言模型(LargeLanguage
Models
,LLMs)的快速发展深刻改变了企业运营模式,推动了智能化自动化、数据驱动决策和创新商业模式的实现。
MonkeyKing.sun
·
2025-04-30 18:29
大模型+agent企业应用实践
架构
gpt
大规模语言模型从理论到实践 具有外推能力的位置编码
大规模语言模型从理论到实践:具有外推能力的位置编码1.背景介绍1.1问题的由来大规模语言模型(LargeLanguage
Models
,LLMs)在最近几年取得了突破性的进展,这些模型通过深度学习技术,能够生成高质量的文本
AI天才研究院
·
2025-04-30 17:27
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【学习资源】知识图谱与大语言模型融合
1模型库获取https://
models
cope.cn/
models
注下载模型需运行gitlfsinstal2论文和文章2.1大型语言模型与知识图谱:机遇与挑战https://arxiv.org/pdf
苹果二
·
2025-04-30 17:55
学习资源
人工智能
知识图谱
大语言模型
LangChain入门(四) 部署应用程序
、使用LangServe部署应用程序安装langservepipinstalllangserve[all]代码示例fromfastapiimportFastAPIfromlangchain.chat_
models
importinit_chat_modelfromlangchain_core.messagesimportSystemMessage
悠然程
·
2025-04-30 14:08
langchain
[论文笔记]Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language
Models
through Question Com
引言今天带来论文Adaptive-RAG:LearningtoAdaptRetrieval-AugmentedLargeLanguage
Models
throughQuestionComplexity的笔记
愤怒的可乐
·
2025-04-30 14:36
自然语言处理
论文翻译/笔记
论文阅读
语言模型
人工智能
FastAPI与Tortoise-ORM模型配置及aerich迁移工具
/3000:11:45updated:2025/04/3000:11:45author:cmdragonexcerpt:FastAPI中使用Tortoise-ORM时,模型类通过继承tortoise.
models
.Model
·
2025-04-30 10:41
【大模型解惑】大模型如何在 Supervised Fine‑Tuning (SFT) 之后进行 PPO 强化学习微调?
在SFT拿到一个可用初始策略后,再用PPO让模型最大化奖励(人类偏好或自动指标),既能维持语言流畅度,又能显著提升服从性与安全性([2203.02155]Traininglanguage
models
tofollowinstructionswithhumanfeedback
云博士的AI课堂
·
2025-04-30 08:27
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型
强化学习
SFT
PPO
预训练
监督学习
机器学习
使用SGLang部署Qwen3大模型的完整指南
使用SGLang部署Qwen3大模型的完整指南一、前言二、环境准备1.安装
ModelS
cope库2.创建Python虚拟环境三、依赖安装1.安装SGLang框架2.更新Transformers库四、模型部署
engchina
·
2025-04-30 08:24
LINUX
SGLang
Qwen3
本地部署
DRF凭什么更高效?Django原生API与DRF框架开发对比解析
示例:原生Django返回JSON数据fromdjango.httpimportJsonResponsefrom.
models
importBookdefbook_list
Bruce-li__
·
2025-04-30 05:04
Django
django
sqlite
数据库
【nodejs】express-generator项目--创建接口及数据库连接
、创建接口1、路由routes(1)新建路由文件(2)注册路由2、控制器controller(1)新建controller文件(2)代码3、services(1)新建services文件(2)代码4、
models
步步生花@苏殿主
·
2025-04-30 01:09
nodejs
express
数据库
node.js
FPGA车牌识别
先用matlab对原理进行仿真,后用vivado和
models
im进行设计和仿真。
超能力MAX
·
2025-04-29 23:22
fpga开发
【大模型应用开发 动手做AI Agent】LangChain和Agent开发
ZenandtheArtofComputerProgramming关键词:LangChain,AIAgent,大模型,编程式AI,自然语言处理1.背景介绍1.1问题的由来随着人工智能技术的飞速发展,大模型(LargeLanguage
Models
AI天才研究院
·
2025-04-29 21:05
计算
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
语言策略的博弈论新境界:从对话到平衡——大语言模型的博弈解构与前瞻
最新研究《StatesasStringsasStrategies:SteeringLanguage
Models
withGame-TheoreticSolvers》正是尝试将对话过程映射为博弈论
步子哥
·
2025-04-29 14:12
AGI通用人工智能
语言模型
人工智能
自然语言处理
django-学习-验证码
django,一边看vue.在写用户登录注册的时候,需要验证码,这时候用到了django-simple-captcha下面是这个其中的一个模型类:>>>classCaptchaStore(django.db.
models
.base.Model
京金
·
2025-04-29 14:39
django
【AI】如何改换Ollama的模型存储位置
【方法】在希望存放模型的位置新建一个文件夹,比如:D:\AI
Models
新建环境变量:重启Ollama即可。
踏雪无痕老爷子
·
2025-04-29 10:13
ai
ai
llama
AI推介-大语言模型LLMs论文速览(arXiv方向):2024.03.10-2024.03.15
文章目录~1.LargeLanguage
Models
andCausalInferenceinCollaboration:AComprehensiveSurvey2.VisionGPT-3D:AGeneralizedMultimodalAgentforEnhanced3DVisionUnderstanding3
小小帅AIGC
·
2025-04-29 04:30
LLMs论文时报
人工智能
语言模型
自然语言处理
深度学习
LLM
大语言模型
论文推送
语音合成之四大语言模型(LLM)与TTS的深度融合
1.1LlaSA1.2CosyVoice(和CosyVoice2)1.3SparkTTS2特性对比2.1零样本语音克隆2.2多语种支持2.3可控语音生成2.4计算效率和模型大小总结当前,在大型语言模型(LargeLanguage
Models
shichaog
·
2025-04-29 04:00
语音合成
声码器
语音识别
人工智能
4.2 Prompt工程与任务建模:高效提示词设计与任务拆解方法
提示词工程通过精心设计的自然语言提示词(Prompts),引导大型语言模型(LargeLanguage
Models
,LLMs)生成准确、相关的输出,而任务建模通过结构化分析任务目标、输入、输出及子任务,
MonkeyKing.sun
·
2025-04-29 03:20
大模型+agent企业应用实践
prompt
人工智能
agent
【LLM】llama.cpp:合并 GGUF 模型分片
当从开源社区(如HuggingFace或
ModelS
cope)下载量化模型时,常会遇到分片存储的情况。
T0uken
·
2025-04-28 21:11
llama
语言模型
lstm用电量预测+网页可视化大屏
importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportMinMaxScalerfromsklearn.model_selectionimporttrain_test_splitfromtensorflow.keras.
models
importSequentialfromtensorflow.kera
甜辣uu
·
2025-04-28 19:59
机器学习实战100例
lstm
机器学习
深度学习
ollama运行huggingface的gguf模型(mac)
找到你本地的Ollama模型目录,默认位置:MacOS/Linux:~/.ollama/
models
Windows:%USERPROFILE%\.ollama\
models
把你的.gguf文件(比如qwen2.5
纠结哥_Shrek
·
2025-04-28 18:57
AI算法
macos
ollama
ChatGPT论文:Evaluating the Text-to-SQL Capabilities of Large Language
Models
评估大语言模型的文本到 SQL 的功能 (一)
摘要我们对Codex语言模型的文本到SQL功能进行了实证评估。我们发现,在没有任何微调的情况下,Codex是Spider基准测试的强大基线;我们还分析了Codex在此设置下的故障模式。此外,我们在GeoQuery和Scholar基准测试中证明,提示中提供的少量域内示例使Codex的性能优于在此类少数示例上进行微调的最先进模型。1.简介1简介将自然语言问题转换为SQL查询(文本到SQL)是一个重要的
数大招疯
·
2025-04-28 17:21
chatgpt
sql
语言模型
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他