AI 实战训练营(Class 1)OpenMMLab 概述

AI 实战训练营(Class 1)OpenMMLab 概述

    • OpenMMLab 概述
  • OpenMMLab各开源算法库详细介绍
    • 明星算法库:MMDetection
    • MMYOLO
    • MMOCR
    • MMDetection3D
    • MMRotate
    • MMSegmentation
    • MMpretrain
    • MMpose
    • MMHuman3D
    • MMAction2
    • MMagic
    • MMDeploy
    • Playground
  • OpenMMLab开源生态

OpenMMLab 概述

OpenMMLab诞生于2018年,是一个由中国开发者主导,有国际影响力的人工智能·
计算机视觉开源算法体系。
AI 实战训练营(Class 1)OpenMMLab 概述_第1张图片
OpenMMLab累计开源超过30个算法库、2400个预训练模型,涵盖图像识别分类、目 标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模 型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机 视觉任务,在Github上累计获得十万颗star,超过了Pytorch。

AI 实战训练营(Class 1)OpenMMLab 概述_第2张图片

无论是巨头公司做商业产品,研究机构发顶会论文,各行各业做AI应用,大学生做毕 业设计,中小学生参加科创竞赛,都可以站在OpenMMLab巨人肩膀上,开箱即用, 开发自己的人工智能项目。 也许大家的下一个课程作业,下一场kaggle竞赛,下一 篇毕业论文,下一家入职的公司,就能用到OpenMMLab。

AI 实战训练营(Class 1)OpenMMLab 概述_第3张图片

OpenMMLab所有算法库都在Github上免费开源,并且有专人维护,我们可以进入每 个算法库的Github主页,点star或者提issue、提PR,下载所有的源代码和模型文 件。
AI 实战训练营(Class 1)OpenMMLab 概述_第4张图片

OpenMMLab 包含了多个项目,涵盖了图像分类、目标检测、语义分割、人脸识别、人体姿态估计、视频理解、文本生成等多个任务。每个项目都提供了灵活的配置系统、丰富的数据增强、模块化的设计和易于扩展的接口,以满足不同场景的需求。

其中包含的领域有:

  • 学术:提供高质量代码框架和算法基准,促进学术界健康、快速发展。
  • 产业:缩短算法落地链条,促进产学研打通;为行业降本增效。
  • 生态:提高中国在 AI 生态上的话语权;促进上下游企业发展。
  • 人才:行程持续成长的开源社区,促进 AI 行业人才成长;构建课程体系,助力人才培养。

OpenMMLab各开源算法库详细介绍

明星算法库:MMDetection

目标检测算法库MMDetection,它可以解决目标检测实例分割全景分割 和目标追踪任务 这是OpenMMLab在业界最有影响力的算法库,在github上有2万多star~
AI 实战训练营(Class 1)OpenMMLab 概述_第5张图片
OpenMMLab是开源算法体系,它已经提供了各个计算机视觉方向的大量开箱即用的 预训练模型和算法。也就是说 OpenMMLab的算法研究员已经帮我们把这些cv任务的常见算法都现好了!
MMDetection被广泛用于学术界和工业界,很多顶会论文,很多比赛的冠军,很多 商业落地的产品都是基于MMDetection实现的!

MMYOLO

目标检测算法:MMYOLO,它是专门用来解决YOLO目标检测问题 的,它的特点就是特别快!!!
AI 实战训练营(Class 1)OpenMMLab 概述_第6张图片

MMOCR

OpenMMLab还有一个文字检测识别的算法库,叫做MMOCR,那这也是计算机视觉很 古老的一个经典问题了,它主要解决三类问题,文本检测就是把图像上的文本区域抠 出来,或者说画出来,文本识别呢是把文字的内容识别出来,关键信息提取呢是对一 些结构化的票据,证件牌照来进行信息的提取。AI 实战训练营(Class 1)OpenMMLab 概述_第7张图片

MMDetection3D

MMDetection3D是专门做3D目标检测的算法库,这个在无人驾驶中用的特别多,要 通过激光雷达和毫米波雷达,感知无人驾驶车周围的3d点云数据,来进行3d目标检 测,很多无人驾驶的初创公司都使用MMDetection3D来实现自己的无人驾驶算法。AI 实战训练营(Class 1)OpenMMLab 概述_第8张图片

MMRotate

MMRotate是专门做旋转目标检测算法库,在传统的目标检测框是横平竖直的,但是 在旋转目标检测框有方向,比如说不同方向的车,不同方向的船,那这是一个比较小 众的研究领域,如果你的研究领域恰恰是旋转框目标检测,那MMRotate将是你最佳 的学习资料!AI 实战训练营(Class 1)OpenMMLab 概述_第9张图片

MMSegmentation

MMSegmentation是专门做图像分割,特别是语义分割的算法库,在街景,在无人 驾驶遥感图像医疗领域,语义分割都是非常重要的算法,任务本质上就是给每一个像 素进行分类。可以用它来识别医疗影像中的病灶区域,肿瘤的区域,遥感图像中河流 山地农田的面积,街景数据里边的马路牙,交通标志和其他车的位置以及车道线,所 以语义分割是一个非常常用的计算机视觉任务,MMSegmentation提供了600多个预 训练模型,复现了40多篇的经典和前沿的语义分割的论文,那如果你想入门语义分割 领域,MMSegmentation将是你最佳的学习资料!AI 实战训练营(Class 1)OpenMMLab 概述_第10张图片

MMpretrain

MMpretrain呢是做图像分类,预训练和多模态的算法库,那图像分类也是计算机视 觉解决的,基础任务之一,用MMpretrain可以实现图像分类,图像描述,视觉问 答,视觉定位和视觉检索。AI 实战训练营(Class 1)OpenMMLab 概述_第11张图片

MMpose

MMPose 是一款基于 PyTorch 的姿态分析的开源工具箱,所谓的姿态估计其实就 是关键点检测,比如说把这么一个人各个的关节骨架的点识别出来,然后串成一个火 柴人,那这就叫做姿态估计,通过姿态估计,我们就能定量的去衡量这个人的行为动 作,比如说健身的打分~AI 实战训练营(Class 1)OpenMMLab 概述_第12张图片

MMHuman3D

MMHuman3D 是一款基于 PyTorch 的人体参数化模型的开源工具箱。
所谓的三维人体姿态估计就是要用一个3d的模型去包络出人体,我们就可以用一个 3d的数字人去拟合一个真人,特别是在动作捕捉领域和虚拟现实领域,有了一个3d 的人,就能跟真实世界的人进行对应了,比如说在足球运动里,在交通事故的模拟 中,甚至在很多的竞技类运动中,都可以用到这个算法。AI 实战训练营(Class 1)OpenMMLab 概述_第13张图片

MMAction2

MMAction2 是一款基于 PyTorch 的视频理解开源工具箱,MMAction2 支持多 种视频理解任务,包括动作识别,时序动作检测,时空动作检测以及基于人体姿态的 动作识别。AI 实战训练营(Class 1)OpenMMLab 概述_第14张图片

MMagic

MMagic 是基于 PyTorch 的图像&视频编辑和生成开源工具箱,MMagic 支持了 流行的图像修复、图文生成、3D生成、图像修补、抠图、超分辨率和生成等任务的应 用。特别是 MMagic 支持了 Stable Diffusion 的微调和许多激动人心的 diffusion 应用,例如 ControlNet 动画生成。MMagic 也支持了 GANs 的插 值,投影,编辑和其他流行的应用。
AI 实战训练营(Class 1)OpenMMLab 概述_第15张图片

MMDeploy

MMDeploy 提供了一系列工具,帮助我们更轻松的将 OpenMMLab 下的算法部署到 各种设备与平台上。AI 实战训练营(Class 1)OpenMMLab 概述_第16张图片

Playground

OpenMMLab还有一个趣味应用的游乐场,叫做playground,在playground里有 很多有趣的项目,其中一些项目也很前沿,比如说结合最新的这个SAM视觉大模型, 你可以用它来辅助你标注,用它来做视频实例分割。这样。就可以结合我们其他的算 法库,来开发出你自己的有趣又有用的好玩应用!AI 实战训练营(Class 1)OpenMMLab 概述_第17张图片

OpenMMLab开源生态

全球有超过1800个开发者参与了OpenMMLab开源算法库的代码贡献;OpenMMLab的 使用者涵盖了科研院所,高校和各行各业的商业公司;同时有一些大家耳熟能详的, 影响力非常大的开源项目,也是基于OpenMMLab开发的!AI 实战训练营(Class 1)OpenMMLab 概述_第18张图片

你可能感兴趣的:(MMLab实战训练营,人工智能,深度学习,计算机视觉)