NoSQL,数据库技术在船舶AIS,数据系统的应用

郭立强

(1. 南昌软件工程新技术创新重点实验室, 江西 南昌 330000;
2. 江西软件职业技术大学, 江西 南昌 330000)

在船舶行驶的过程中,会出现很多异常情况,如硬件故障(GPS 失灵等),恶劣的海上环境影响(风、浪、礁石等),这些不确定因素都会导致船舶偏离预定航线的情况发生[1–3]。为了提高船舶航行安全,应当加强对船舶航行过程的指导,及时、准确地获取船舶航行信息,及时发现船舶航行时的异常轨迹。对船舶运动规律的预测和提高预测轨迹的可靠性是水上交通安全领域重要的研究课题[4–5]。为了改善船舶交通安全,本文基于NoSQL数据库技术采用一种新的导航系统AIS,自动向沿海相关部门以及海域内的其他船只提供关于目标船舶的航行信息。

本系统后端数据服务采用多数据库持久化策略,主要思路为在使用传统Mysql 数据库进行开发的基础上引入多种主流NoSQL 现代数据库,根据其对应特性选择适合的数据进行使用,如表1 所示。

表1 系统所用NoSQL 数据库特性表Tab. 1 Characteristics of NoSQL database used in the system

通过以上特性分析,最终确定数据持久化方案如表2 所示。

表2 系统数据持久化方案表Tab. 2 System data persistence scheme

2.1 AIS 数据集的结构分析

AIS 是一种船舶导航系统,在同一海域搭载AIS设备的船舶能够互相感知,它是船舶之间以及船岸之间重要的数据信息交互设备,具有大容量、多样性、快速度、真实性等特征。卫星,地面和装有AIS 设备的船舶能不断接收AIS 设备的广播信息。现在AIS 已经非常普及,我国沿海以及河流港口水域基本上都被AIS 系统覆盖,能够有效地提高船舶的通行效率,是船舶交通管理系统不可或缺的一部分,既能够有效跟踪船舶的状态,还可以向安全监管系统提供有效准确的信息,有效保障了船舶交通安全,同时这些数据也促进了对船舶交通安全领域的研究。

1)静态信息

MMSI 唯一识别码、船名、呼号、货物类型、船舶长宽、IMO 呼号等信息,这些信息一般固定不变,由人为填写。

2)动态信息

关于船舶的定位、航向、航速、经纬度等随着船舶的传感器同步更新的信息。

3)船舶的航行相关信息

船舶的目的港口地和预计到港时间、船舶吃水深度、船舶航行状态等。

4)安全相关信息

安全航行相关数据、船载人数等。

2.2 船舶轨迹模型的建立

为了有效训练模型,需要从AIS 数据集中选取船舶运动时的主要特征,其中包括经度、纬度、对地速度、船首向和对地航向,经度和纬度用来表示船舶的位置,速度用来表示船舶运动的快慢,对地航向表示船舶运动的方向,以此来作为输入建立网络模型,输出为下一时刻的位置,也就是下一时刻的经度和纬度,充分利用与船舶位置状态关系最密切的信息。所以在t时刻,目标船舶的状态特征可以表示为:

式中:lat为船舶纬度,lon为船舶的经度,v为船舶的航行速度,c为船舶的对地航向,δ为船首向,选取的是MMSI 号为367 339 240 的船舶2022 年9 月的数据,部分数据如表3 所示。

表3 船舶AIS 信息Tab. 3 AIS Information of Ships

2.3 船舶轨迹数据的特点

船舶轨迹是连续的,因为AIS 每次发送数据之间有一定的时间间隔,所以船舶的位置信息不是连续的,而是离散的,本文需要将这一系列离散的位置信息连起来才能构成船舶的轨迹,而轨迹的预测是指根据前一时刻船舶的状态信息来推测船舶下一时刻的位置。船舶轨迹受到环境等不确定因素的影响呈现出以下特征:

1)非线性

由于海上环境具有诸多不确定性,会发生很多情况,而船舶的运动轨迹很容易受这些环境因素的影响,如风、海、浪、礁石等,这些环境因素又相互影响,让船舶的轨迹呈现非线性的特征。

2)随机性

在船舶的航行过程中也难免会受到很多不可控因素的影响,如船舶故障、交通管制,包括船员操作也具有随机性,所以船舶的轨迹呈现出了随机性的特征。

3)趋势性

由于船舶的航行会有一个明确的目的地,所以船舶的整体航向趋势不会有太大的变化,因此船舶的轨迹具有趋势性。

4)周期性

大部分船舶都往返于两地之间,而大致的路线相同,所以船舶的轨迹具有周期性的特点。

5)相关性

船舶每个时刻的位置都会受到上一个时刻或更久之前时刻位置状态的影响,所以船舶的轨迹具有相关性的特点。

2.4 AIS 数据预处理

AIS 数据集中存放着大量船舶不同时刻的位置信息,但AIS 系统在接收数据过程中会受到噪声的影响,导致数据错误、数据丢失等问题。其中错误信息一般有如下几类:

1)用来区分船舶的水上移动通信业务唯一标识码(MMSI)不是9 位,或存在相同时间的MMSI 号且其位置数据冲突。

2)船速(SCG<0)、船向(COG>360)的数据是不合理数据,属于噪声。

3)经度(LON>180)、纬度(LAT>90)为不合理数据。

删除这些非法数据、重复数据、空值数据后能很好地减少噪声对轨迹建模的影响,减少预测误差。

同时可能由于设备老化、人为操作等问题导致数据集中还存在许多数据缺失,本文可以从AIS 数据集中的DataBaseTime 中看出每一个数据的传送间隔大概是1 min 左右,但数据集中会出现2 个数据相隔好几分钟的情况,这其中就出现了数据缺失,导致时间间隔不均匀,对模型预测下一时刻的位置时产生较大的影响。

数值缺失的原因主要可分为无意的缺失、有意的缺失和本身就不存在。无意的缺失是由于人员操作疏忽、数据采集器故障等造成的,经常发生在对系统实时性要求比较高的时候。有意的缺失是数据集在特征描述中将缺失值也作为一种特征值,不存在是指特征属性根本不存在,显然AIS 数据集的缺失是无意的。而数据的缺失又可分为完全随机缺失、随机缺失、非随机缺失,由于AIS 数据集缺失数据的概率和已观察到的数据和未观察到的数据无关,属于完全随机缺失,对于这种缺失,常用的方法有特殊值插补、均值插补。本文选用均值插补,用一个时间间隔内观测值的平均值来插补缺失的值,该方法计算快速、方便,对船舶的轨迹补差前后的对比如图1 所示。

图1 均值补差前后轨迹对比Fig. 1 Comparison of trajectories before and after mean compensation

2.5 数据集的划分

经过预处理后一共970 组数据,对预处理后的数据进行划分,前800 组作为训练集,放入神经网络进行训练,后170 组数据作为测试集。由于不同参数间的数量级相差较大,需要对经度、纬度、对地航向以及船首向参数除以100,来保证和对地速度差不多的数量级,可以有效提高精度。

3.1 实验的环境与数据

本实验编程语言为python3.9,基于NoSQL 数据库选用公开的A I S 实验数据, 其M M S I 号为367339240 的船舶在2021 年10 月和11 月中7 天的数据,一共970 组,选取其中重要的运动特征LAT,LON,SOG,COG,Heading 作为模型的输入。

3.2 模型评估函数

为了评估一个模型的精度,准确地衡量不同模型的差异,需要对模型进行评估,常用的模型评估函数有均方误差(MSE)、均方根误差(RMSE)、最大绝对误差(MAE)等。

1)均方差(MSE)

均方误差是将模型的预测值和真实值相减,再将差平方后求和取平均值,其值越接近于0 说明预测精度越高,模型的预测效果越好,其公式如下:

2)均方根误差(RMSE)

均方根误差是对均方差开根号,能够让结果在数量级的比较上更加直观,其公式为:

3)最大绝对误差(MAE)

最大绝对误差是预测值和真实值相减取绝对值中最大的值,表现了预测值和观测值之间最大的误差,其公式为:

3.3 RNN 模型的预测结果

RNN 神经网络将船舶的时序数据转换为三维的格式进行输入,取数据集中800 组数据作为训练集,剩余170 组数据作为测试集,损失函数选用均方误差(mse)进行计算,RNN 损失值变化如图2 所示。

图2 RNN 损失值变化Fig. 2 Changes in RNN loss values

图2 为100 次训练后的损失值变化,其预测轨迹与实际轨迹之间的对比如图3 所示。

图3 RNN 轨迹预测图Fig. 3 RNN trajectory prediction

3.4 LSTM 模型预测结果

LSTM 模型的输入同样需要将时序数据转换成为三维的输入格式,并增加防止过拟合的Dropout 层,参数设置为0.1,损失函数选用均方误差(mse),每次梯度更新的样本数(batch_size)为269,迭代次数(epochs)为100 次,最后用均方差、均方根误差、最大绝对误差进行评估对比,其损失图变化如图4 所示。可以看出整个LSTM 模型在优化后均方误差明显降低,效果良好。

图4 LSTM 损失值变化Fig. 4 Changes in LSTM loss values

本文将NoSQL 数据库应用于船舶AIS 数据系统中,对船舶轨迹进行分析预测。建立船舶轨迹模型,并对NoSQL 数据库的AIS 数据进行预处理。通过对模型预测结果的分析和评估,发现NoSQL数据库技术适合应用于船舶轨迹预测。

猜你喜欢航行时刻轨迹冬“傲”时刻环球人物(2022年4期)2022-02-22捕猎时刻小资CHIC!ELEGANCE(2021年32期)2021-09-18到慧骃国的航行疯狂英语·新读写(2021年6期)2021-08-05轨迹读友·少年文学(清雅版)(2020年4期)2020-08-24轨迹读友·少年文学(清雅版)(2020年3期)2020-07-24轨迹现代装饰(2018年5期)2018-05-26小舟在河上航行中学生英语(2017年6期)2017-07-31进化的轨迹(一)——进化,无尽的适应中国三峡(2017年2期)2017-06-09航行青年歌声(2017年6期)2017-03-13一天的时刻小学阅读指南·高年级版(2014年2期)2014-05-27

推荐访问:船舶 数据库技术 数据