【多模态大模型实战】 搭建通义千问Qwen 2.5-VL-7B-Instruct多模态模型,以及推理微调

模型信息

Qwen2.5是Qwen大型语言模型的最新系列。对于Qwen2.5,我们发布了从0.5亿到72亿参数不等的一系列基础语言模型和指令调优语言模型。Qwen2.5在Qwen2的基础上带来了以下改进:

  • 拥有了显著更多的知识,并且在编码和数学方面的能力得到了极大提升,这得益于我们在这些领域开发的专门专家模型。

  • 在指令遵循、生成长文本(超过8000个标记)、理解结构化数据(如表格)以及生成结构化输出(特别是JSON)方面有了显著改善。对系统提示的多样性更具适应性,增强了聊天机器人的角色扮演实现和条件设置。

  • 支持长达128,000个标记的长上下文,并能生成多达8,000个标记的文本。

  • 支持超过29种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。
    【多模态大模型实战】 搭建通义千问Qwen 2.5-VL-7B-Instruct多模态模型,以及推理微调_第1张图片

  • 代码链接:https://github.com/QwenLM/Qwen2.5-VL

  • 模型链接:https://www.modelscop

你可能感兴趣的:(大模型论文翻译与实战,人工智能,语言模型,深度学习)