17、Swift框架微调实战(2)-QWQ-32B LORA微调cot数据集

1、QWQ-32B介绍

1.1 基本介绍

QwQ 是 Qwen 系列的大模型之一,专注于 推理能力(reasoning)。相比于传统的 指令微调(instruction-tuned) 模型,QwQ 具备 思考与推理(thinking and reasoning) 的能力,因此在各种下游任务(特别是复杂问题)上,能实现 显著的性能提升。
QwQ-32B 是该系列的 中等规模推理模型,其性能可媲美当前最先进的推理模型,如 DeepSeek-R1 和 o1-mini。

17、Swift框架微调实战(2)-QWQ-32B LORA微调cot数据集_第1张图片

1.2 QwQ 32B模型基本参数

QwQ 32B 模型,具有以下特性:

  • 类型(Type):因果语言模型(Causal Language Model)
  • 训练阶段(Training Stageÿ

你可能感兴趣的:(大模型学习,Swift,QWQ,微调,LORA)