微调大模型如何准备数据集——常用数据集,Alpaca和ShareGPT

微调大模型如何准备数据集——常用数据集,Alpaca和ShareGPT

  • 数据集准备
    • 常用数据集
    • 自定义数据集
      • Alpaca
      • ShareGPT

数据集准备

常用数据集

预训练数据集
  • Wiki Demo (en)
  • RefinedWeb (en)
  • RedPajama V2 (en)
  • Wikipedia (en)
  • Wikipedia (zh)
  • Pile (en)

你可能感兴趣的:(人工智能与机器学习教程,大模型,人工智能,微调,python,github,Deepseek,Qwen)