工控领域多模态LLM测试集

MMAD

Multimodal Large Language Models in Industrial Anomaly Detection

从4个数据集收集8366样本,涵盖38类工业产品,生成 39,672个样本,覆盖7个核心任务。

https://github.com/jam-cc/MMAD.git

https://huggingface.co/datasets/jiang-cc/MMAD

天池铝型材表面缺陷数据集

数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

https://cvmart.net/dataSets/detail/272

PanNuke癌组织细胞数据集

半自动生成的细胞核实例分割和分类数据集,包含 19 种不同组织类型的详尽细胞核标签。该数据集由 481 个视野组成,其中 312 个视野是从多个数据源的 20K 多个不同放大倍率的整张幻灯片图像中随机采样的。该数据集总共包含 205,343 个标记的核,每个核都有一个实例分割掩码。在 pannuke 上训练的模型可以帮助整个幻灯片图像组织类型分割,并推广到新组织。PanNuke 演示了首批成功半自动生成的数据集之一。

https://cvmart.net/dataSets/detail/413

PanNuke_数据集-飞桨AI Studio星河社区

---

你可能感兴趣的:(语言模型,人工智能)