基于人体骨架动作识别的神经信息处理技术(2 相关工作-2.4提高信号质量)

 2  相关工作

在本节中,我们将回顾本论文的相关工作。我们根据文献的功能将文献分为四类,包括1)数据集,2)提取空间特征,3)捕获时间模式,4)提高信号质量。对于每个组件,我们将其进一步分解为细分区域。最后,我们展示了现有方法在不同数据集上的SOTA改进。

总之,该分类法如下:

1)数据集

2)提取空间特征

利用拓扑结构、设计空间操作符、分离通道功能、学习参数化拓扑、分区层次结构。

3)捕获时间模式

提取多尺度特征、设计时间特性、选择具有信息性的框架。

4)提高信号质量

编码语义信息、变换几何坐标、缓解过拟合问题。

在本章中,我们将描述遵循上述结构的基于骨架的动作识别。我们用方法而不是论文来组织这一章。也就是说,在某些情况下,一篇论文包含了多个分散在不同功能类别中的方法。

2.4提高信号质量

2.4.1编码语义信息

SGN:在[42]中,作者指出,以前的方法可能忽略了每个骨架关节的类型信息和帧的相对顺序。[42]提出了一种简单而有效的语义引导神经网络(SGN)用于基于骨架的动作识别。作者通过明确地输入关节类型的信息来丰富关节特征。该信息以一个热向量的形式存在,其中值为1的维数描述了一个特定的关节类型。类似地,不同的索引帧也被表示为不同的单热向量。

2.4.2变换几何坐标

骨骼的三维变换(3D Transformations of Skeletons::两个流递归神经网络[35]通过其各种几何变换增强了原始骨骼,包括旋转、缩放和剪切。x、y和z坐标的旋转矩阵格式如下:

基于人体骨架动作识别的神经信息处理技术(2 相关工作-2.4提高信号质量)_第1张图片

该比例矩阵的定义为:

基于人体骨架动作识别的神经信息处理技术(2 相关工作-2.4提高信号质量)_第2张图片

其中,三个轴的缩放因子分别为s_{x}s_{y}s_{z}

剪切变换的矩阵定义为:

基于人体骨架动作识别的神经信息处理技术(2 相关工作-2.4提高信号质量)_第3张图片

其中

你可能感兴趣的:(动作识别,人工智能)