This repository contains the source code for the paper: Architecture for Trajectory-Based Fishing Ship Classification with AIS Data, made by David Sánchez Pedroche, Daniel Amigo, Jesús García and José Manuel Molina, from University Carlos III of Madrid.
The reference of the published paper is included in BibTeX format. If you have used this article or this code, please cite us. The paper is available at: https://www.researchgate.net/publication/342723317_Architecture_for_Trajectory-Based_Fishing_Ship_Classification_with_AIS_Data The source code to generate the illustrations made in the paper is also provided.
The data used is the property of the Danish Maritime Authority, made available to anyone at: https://dma.dk/SikkerhedTilSoes/Sejladsinformation/AIS/Sider/default.aspx (link in: Get historical AIS data). The article uses three days from June 2017: dk_csv_jun2017.rar. In particular: aisdk_20170625.csv, aisdk_20170626.csv and aisdk_20170627.csv. The rest of datasets are obtained by executing these original data and the code provided.
It is necessary to add the whole framework to the Matlab path. To do this:
- Home
- Set Path
- Add with Subfolders...
- Root folder
- Ok
- Save
The file script.m orchestrates the whole performance, from the original files of each day, it does all the cleaning, filtering and pre-processing, and finally the classification. Each one of the steps is customizable according to the parameters that are passed to the function. Broadly speaking (for more detail read the article) the whole process executes the following functions:
1. mmsiToCleaned(selectedDay, cleanedParameters)
2. cleanedToTimestamp(selectedDay, timestampParameters)
3. timestampFolderToFilter(selectedDay, filterParameters)
4. mergeDays(days)
5. segmentation(segmentationAlgorithm)
6. extractSegmentInfo(segmentationAlgorithm)
7. classifier(segmentationAlgorithm, classificationParameters)
The code has been tested on MATLAB version R2020 Update 1, 64-bit (win64). It requires the use of the Parallel Computing Toolbox. It can be disabled by changing the "parfor" loops to "for".
To make the illustrations, Python + Jupyter Notebook + Plot.ly, executed from VSCode, is used. Also the base code and data are provided.
It is required that each ipynb file can access the csv data (through the Pandas library). It has been tested with Python 3.7.6 64-bit through Anaconda 3 (in VSCode it requires the extension ms-python.anaconda-extension-pack).
If you have any questions, suggestions or problems with the code or the item, please do not hesitate to contact damigo@inf.uc3m.es or davsanch@inf.uc3m.es.
Este repositorio contiene el código fuente para la realización del paper: Architecture for Trajectory-Based Fishing Ship Classification with AIS Data, hecho por David Sánchez Pedroche, Daniel Amigo, Jesús García y José Manuel Molina, de la Universidad Carlos III de Madrid.
Se incluye la referencia en formato BibTeX. Si le ha servido este artículo o este código, cítenos. El artículo está disponible en: https://www.researchgate.net/publication/342723317_Architecture_for_Trajectory-Based_Fishing_Ship_Classification_with_AIS_Data También se proporciona el código fuente para generar las gráficas realizadas en el artículo.
Los datos utilizados son propiedad de Danish Maritime Authority, puestos a disposición de cualquiera en: https://dma.dk/SikkerhedTilSoes/Sejladsinformation/AIS/Sider/default.aspx (enlace en: Get historical AIS data). El artículo utiliza tres días del mes de Junio de 2017: dk_csv_jun2017.rar. En concreto: aisdk_20170625.csv, aisdk_20170626.csv y aisdk_20170627.csv. El resto de datasets se obtienen con la ejecución de estos datos originales y el código proporcionado.
Es necesario añadir todo el framework al path de Matlab. Para ello:
- Home
- Set Path
- Add with Subfolders...
- Root folder
- Ok
- Save
El fichero script.m orquesta toda la ejecución, desde los ficheros originales de cada día, realiza todo el limpiado, filtrado y preprocesado, y finalmente la clasificación. Cada uno de los pasos es customizable según los parámetros que se pasen a la función. A grandes rasgos (para más detalle leer el artículo) el proceso completo ejecuta las siguientes funciones:
1. mmsiToCleaned(selectedDay, cleanedParameters)
2. cleanedToTimestamp(selectedDay, timestampParameters)
3. timestampFolderToFilter(selectedDay, filterParameters)
4. mergeDays(days)
5. segmentation(segmentationAlgorithm)
6. extractSegmentInfo(segmentationAlgorithm)
7. classifier(segmentationAlgorithm, classificationParameters)
El código ha sido probado en la versión MATLAB R2020 Update 1, 64-bit (win64). Requiere el uso de la Toolbox Parallel Computing. Se puede desactivar si se cambian los bucles "parfor" por "for".
Para realizar las gráficas se utiliza Python + Jupyter Notebook + Plot.ly, ejecutado desde VSCode. También se proporciona el código base y datos de las mismas.
Se requiere que el fichero ipynb pueda acceder a los datos csv (mediante la bibilioteca Pandas). Ha sido probado con Python 3.7.6 64-bit mediante Anaconda 3 (en VSCode requiere la extensión ms-python.anaconda-extension-pack).
Cualquier duda, sugerencia o problema con el código o el artículo, no duden en contactar con damigo@inf.uc3m.es o davsanch@inf.uc3m.es