阅读笔记:The Devilis in the Details: Delving into Unbiased Data Processing for Human Pose Estimation

在paper with code里面,看了下姿态识别,找了最高的一篇论文,但是里面的公式推导太需要时间了,只看了其大致结构。
另外,知乎这篇文章讲的更加简单透彻:魔鬼在细节中:人体姿态估计中无偏的数据处理方法。
阅读笔记:The Devilis in the Details: Delving into Unbiased Data Processing for Human Pose Estimation_第1张图片
1.图片预处理时,可能会反转、旋转,以及在特征的提取过程中,会引起keypoint的偏移。
2.本文就是处理这中偏移,用的公式有点多阅读笔记:The Devilis in the Details: Delving into Unbiased Data Processing for Human Pose Estimation_第2张图片
阅读笔记:The Devilis in the Details: Delving into Unbiased Data Processing for Human Pose Estimation_第3张图片
不过可以看出来,都是对关键点进行变换的。
不明白的地方是,一个关键点坐标是(x,y),就算是b-box也是(x1,y1,x2,y2),为什么进行变换的时候用的是三节矩阵呢,x和k的结构是怎样的呢?
为此去看了代码,但是因为代码量有点大。。。容后再看把。。。希望有知道的大神回复下,这里先行谢过。

你可能感兴趣的:(论文阅读,机器学习,计算机视觉)