An Overview:Maritime Spatial-Temporal Trajectory Mining 论文阅读笔记

1 引言

在轨迹数据挖掘研究中,大多数研究都是集中在城市轨迹上,这些研究有更多的数据来源,如交通监控系统,手机和GPS等。然而,随着海上目标数量的增加,海洋空间-时空轨迹挖掘逐渐变的重要起来。海洋空间-时空轨迹主要包含一系列的位置和时间,同时还需要考虑与目标相关的信息,例如环境信息等。目前。海洋空间-时空轨迹有许多数据源,如识别系统(AIS)、地理信息系统(GIS)和雷达等。我们可以从AIS获取位置和目标信息,从GIS获取环境信息。结合雷达等信息,可以验证接收的海上时空轨迹的可靠性。

海洋时空轨迹数据挖掘算法主要包含三个方面:轨迹聚类、异常值检测和轨迹预测。海洋时空轨迹数据挖掘的框架图1所示:

An Overview:Maritime Spatial-Temporal Trajectory Mining 论文阅读笔记_第1张图片

2 海洋时空轨迹的聚类算法

时空轨迹的数据量大且紊乱,轨迹聚类算法可以去除离群值,将有相似移动趋势和行为模式的轨迹聚类起来。目前用于海洋时空轨迹的聚类算法有以下几种:基于相似性聚类、基于网格聚类和基于自定义聚类。

An Overview:Maritime Spatial-Temporal Trajectory Mining 论文阅读笔记_第2张图片

轨迹由许多点组成,测量轨迹多样性的最佳方法是相似性。轨迹的主要相似性指标是DTW、LCSS和MDR等。根据相似性或相似性矩阵,聚类方法可以将轨迹分组到不同的类别中。主要的聚类方法有DBSCAN、K-means和KNN等。大多数算法都试图从两个方面改进聚类:提高相似性索引或矩阵以及改进聚类算法。

2.1 改进相似性索引或矩阵

不同的相似指数代表不同的含义。例如,基于空间距离的相似度可以衡量轨迹的空间变化。但我们可能不仅需要关注空间差异,还需要分析其他相关信息。Sheng根据目标的速度、时间和距离特征定义了三种行为。然后,使用Logistic回归(LR)模型进行聚类。但该算法只能适用于两类分类。Liu计算了平均距离、航向和速度的融合距离,然后使用了K-最近邻居(KNN)聚类。但是这种方法需要先验知识和对数据的进一步处理。

2.2 改进聚类算法

一些研究试图通过改进聚类算法来提高聚类效果,这种改进可能更高效、更准确。首先,有些方法需要用户选择参数。一些研究侧重于计算自适应参数。例如,Mou提出了一种自适应谱聚类算法,它计算平均Hausdorff距离以确定自适应参数\sigma _{A}\sigma _{B}

如今深度学习方法在许多领域都表现出令人满意的表现。如目标识别、检测和预测。它还可以用于海洋时空轨迹聚类。Yao提出了一个由两个RNN组成的序列到序列自动编码器模型。该模型接收由提出的特征提取算法提取运动行为特征。深度学习算法显示出比其他聚类方法更高的准确性。

3 基于海洋时空轨迹的异常检测

异常检测在海上安全中起着重要作用。海上安全主要通过AIS支持的海事态势感知(MSA)实现,相关研究可防止海上事故和发现非法活动。海洋时空轨迹的异常检测是寻找显示异常的轨迹,它主要包含两种算法:基于定义规则的异常检测、数据驱动异常检测。

 An Overview:Maritime Spatial-Temporal Trajectory Mining 论文阅读笔记_第3张图片

3.1 基于定义规则的异常检测

每个行为都有其特定特征,可以描述为数学公式。这种检测方法需要专业知识,而专业知识很容易影响判断的准确性。同时,这种检测只能检测预先定义的行为,对于从未定义的反常现象没有任何效果。Costas提出了基于定义行为的在线监控系统,以监控来自海上大型目标的异常行为。该系统不仅可以监测运动轨迹事件,还可以监视复杂的海上事件。

3.2 数据驱动异常检测

许多研究也侧重于历史数据。通过对历史数据的分析,我们可以在聚类算法中找到正常的行为。异常行为意味着它不属于任何类型的正常行为。对于带有标签的历史数据,我们可以尝试受监督的算法,例如统计算法、机器学习和深度学习。例如,zhen提出了一个异常检测算法,将海洋轨迹聚类和贝叶斯分类器相结合。它包含两个步骤:第一,基于相似性和挖掘典型行为对海洋轨迹进行聚类。第二,贝叶斯分类器用于检测轨迹。如果属于现有的典型行为,则是正常的轨迹;如果不属于任何现有的行为,则是异常轨迹。

4 海洋时空轨迹的轨迹预测算法

轨迹预测意味着预测下一步位置或采取的行为。海洋时空轨迹预测可以从巨大的历史轨迹中挖掘海洋目标的运动规律,这种规律有助于管理海上交通和判断海上状况。目前的研究主要包括基于统计方法的传统预测算法、基于机器学习的预测算法和基于深度学习的算法。

An Overview:Maritime Spatial-Temporal Trajectory Mining 论文阅读笔记_第4张图片

4.1 基于统计方法的轨迹预测算法

基于运动的方程,我们可以直接找到运动的规律性。同时,也可以通过统计找到分布规律。主要算法是卡尔曼过滤器、马尔可夫模型和灰色预测模型等。当我们没有足够的数据和高性能计算机时,我们会考虑这些算法。渐渐地,当情况变得复杂时,就会出现不利因素。例如,当环境对轨迹预测产生巨大影响时,我们找不到合适的统计模型来表达相关性,但是,我们可以很容易地构建一个神经网络,从数据中学习知识。

4.2 基于机器学习的轨迹预测

最近,大多数轨迹预测研究都集中在机器学习算法上。例如,BP网络和K-最近邻居(KNN)等。机器学习方法比传统方法性能更好,复杂性也比深度学习方法低。因此,对于不需要高精度的应用程序来说机器是一个更好的选择。机器学习包含监督和无人监督的方法,我们可以根据数据选择合适的方法,有时也可以结合不同的方法。例如,使用无人监督的方法聚类到多个聚类中,并且每个轨迹都有标签。然后,我们可以尝试监督的方法来训练网络。

4.3 基于深度学习的轨迹预测

深度学习在许多领域都有出色的表现,如智能机器人、人脸识别和数字图像处理。最近,一些研究尝试在轨迹预测中深入学习的方法。例如Quan使用LSTM神经网络来预测轨迹。除了直接使用位置信息外,还有一些预处理方法来转换数据类型。例如,Nguyen提出了一个seq2seq模型,该模型使用空间网格进行预测。

对于更复杂的研究,一些研究尝试结合更多的方法。Tu提出了基于AIS数据的全面预测框架。首先,K-MEANS用于将轨迹聚类到k个聚类,这些带有标签的集群用于训练神经网络。然后,测试样本将使用K-最近邻居(KNN)算法找到最接近的K相邻。最后,输出关联近邻的融合结果。

5 前景

许多现存轨迹挖掘算法都是基于位置信息,一些算法也会考虑目标的速度和航向,但是很少有算法考虑到环境条件。考虑多种因素,建立海洋目标时空轨迹挖掘算法会大大增加模型的复杂度。传统算法无法满足简单高效的要求。因此,有必要探索一种新的海洋目标时空轨迹挖掘算法。

深度学习在海洋目标时空轨迹数据挖掘领域的应用需要在以下三个方面进一步探索:

(1)海洋时空轨迹数据量大而复杂,结合不同类型的数据是困难的。同时,海量轨迹数据中存在大量错误或缺失数据,这就需要高效的数据清洗方法。数据清洗的目的是检查数据的一致性,处理离群数据和缺失数据。目前,数据清洗主要采用偏差分析、回归方程、线性插值、非线性插值等统计方法。一方面,通过构建更加简洁、便捷、高效的数据清洗工具和数据清洗引擎,可以实现高效的数据清洗;另一方面,可以研究更有效的数据清洗方法。

(2)世界海洋环境复杂多变,需要建立一个通用的深度学习模型,满足不同地区、不同季节、不同类型数据的学习效果。在设计学习模型之前,应该使用统计知识来判断与轨迹相关的环境信息,例如风的大小和波浪的大小。然后,在模型的输入中应考虑尽可能多的因素。应使用不同区域、不同季节和不同环境的海上目标的时空轨迹进行训练。

(3)海洋时空轨迹挖掘的深度学习网络是已经成熟应用于其他领域的网络。大多数算法只是微小的改进。在海洋时空轨迹挖掘领域,需要从基础理论构建适合海洋时空轨迹的网络,能够适应海洋目标时空轨迹数据密度不均、高维、数据类型复杂的特点。

6 总结

本文综述了近年来海洋时空轨迹挖掘的研究进展。它包含轨迹聚类、异常检测和轨迹预测。同时,我们也回顾了海洋时空轨迹挖掘的一些应用。我们可以很容易地发现,许多其他领域的先进算法已被用于海上时空轨迹挖掘。为进一步研究,本文从数据预处理能力、模型的完备性和模型的适用性三个方面进行展望。

你可能感兴趣的:(笔记,论文阅读)