O projekcie



Wersja polska (English version follows)



Wprowadzenie


Czypociagsiespozni.pl jest projektem niekomercyjnym mającym na celu ułatwienie podróżowania pociągami w komunikacji krajowej poprzez możliwość sprawdzenia informacji o historycznych opóźnieniach dla wybranego pociągu i wybranej stacji, wraz z prognozą opóźnienia na podstawie modelu opartego na sztucznych sieciach neuronowych. Dzięki tym informacjom, pasażer jest w stanie uwzględnić możliwe opóźnienie w swoim planie podróży, a także wybrać alternatywne połączenie kolejowe w sytuacjach gdy punktualność jest istotna (np. przy połączeniach przesiadkowych, podróży na samolot lub spotkanie biznesowe) i dzięki temu uniknąć sytuacji stresujących.

Zdaniem autora, powyższe powinno pozytywnie przyczynić się do wzrostu ogólnej satysfakcji pasażerów z usług przewoźników kolejowych.


Model


Model zastosowany w niniejszym projekcie jest modelem opartym na sztucznych sieciach neuronowych, w tym w szczególności na sieciach konwolucyjnych i rekurencyjnych. Model czerpie inspirację ze znanych architektur sieci neuronowych, w tym z modelu Transformer.

Model został wyuczony z wykorzystaniem danych o opóźnieniach wszystkich pociągów w Polsce z okresu 9 grudnia 2018 – 30 września 2020. Dane te zostały pozyskane ze strony http://ipa.lovethosetrains.com/, która według jej autora archiwizuje dane o opóźnieniach publikowane w czasie rzeczywistym na stronie http://infopasazer.intercity.pl, oficjalnym serwisie utrzymywanym przez PKP Intercity we współpracy w większością krajowych przewoźników kolejowych.

Na dzień dzisiejszy, model jest w dalszym ciągu w trakcie budowy oraz jest regularnie ulepszany. Bieżąca dokładność modelu mierzona na danych testowych (danych, które nie zostały użyte do jego wytrenowania) osiąga poziom około 92%. Po ukończeniu finalnych prac nad modelem, zostanie on udostępniony publicznie wraz ze szczegółowymi wskaźnikami efektywności.

Szczegółową listę źródeł wykorzystanych w trakcie budowy modelu zamieszczono w zakładce „Źródła” poniżej.


Kontakt


Ogólny: kontakt@czypociagsiespozni.pl

Zgłoś problem: postmaster@czypociagsiespozni.pl


Źródła


1. Informacja dla podróżnych o ruchu pociągów, http://infopasazer.intercity.pl

2. InfoPasażer Archiver, http://ipa.lovethosetrains.com/

3. Stylianou V., Deep Learning for Time Series Classification (InceptionTime), https://towardsdatascience.com/deep-learning-for-time-series-classification-inceptiontime-245703f422db

4. Fawaz H. I. et al., InceptionTime: Finding AlexNet for Time Series Classification, https://arxiv.org/abs/1909.04939

5. Wu N. et al., Deep Transformer Models for Time Series Forecasting: The Influenza Prevalence Case, https://arxiv.org/pdf/2001.08317.pdf

6. Godfried I., Attention for time series forecasting and classification, https://towardsdatascience.com/attention-for-time-series-classification-and-forecasting-261723e0006d

7. Agarwal R., Using Gradient Boosting for Time Series prediction tasks, https://towardsdatascience.com/using-gradient-boosting-for-time-series-prediction-tasks-600fac66a5fc



English version



Introduction


Czypociagsiespozni.pl is a non-commercial project aimed at making domestic train journeys easier by making it possible to check historical delays for the selected train at the selected station together with the delay prediction based on the artificial neural networks model. Thanks to this information, passengers are able to take into account the possible delay and choose alternative rail connections if arriving on time is important (e.g. in case of transfers, travelling to the airport or to business meetings).

According to the author, the above should positively contribute to the passenger satisfaction with the services provided by train operating companies.


Model


The model which is used in the project is an artificial neural networks model based on convolutional neural networks (CNNs) and recurrent neural networks (RNNs) in particular. The model takes the inspiration from a few notable artificial neural networks architectures, including the state-of-the-art Tranformer model.

The model has been trained using the data of all the train delays in Poland in the period 9 December 2018 - 30 September 2020. The data has been sourced from http://ipa.lovethosetrains.com/ which according to its author, tracks and archives the real-time delays published on http://infopasazer.intercity.pl, the official site maintained by PKP Intercity in cooperation with most of the domestic train operating companies.

As of October 2020, the model is still in the development and is constantly being improved. Current accuracy measured on the test data (the data which has not been used to train the model) reaches about 92%. Once the development is finished, the model’s detailed metrics will be shared and the model itself will be made available to the public.

In the Sources section, one can find the list of sources which have been used so far during the model development.


Contact


General: kontakt@czypociagsiespozni.pl

Report an issue: postmaster@czypociagsiespozni.pl


Sources


1. Informacja dla podróżnych o ruchu pociągów, http://infopasazer.intercity.pl

2. InfoPasażer Archiver, http://ipa.lovethosetrains.com/

3. Stylianou V., Deep Learning for Time Series Classification (InceptionTime), https://towardsdatascience.com/deep-learning-for-time-series-classification-inceptiontime-245703f422db

4. Fawaz H. I. et al., InceptionTime: Finding AlexNet for Time Series Classification, https://arxiv.org/abs/1909.04939

5. Wu N. et al., Deep Transformer Models for Time Series Forecasting: The Influenza Prevalence Case, https://arxiv.org/pdf/2001.08317.pdf

6. Godfried I., Attention for time series forecasting and classification, https://towardsdatascience.com/attention-for-time-series-classification-and-forecasting-261723e0006d

7. Agarwal R., Using Gradient Boosting for Time Series prediction tasks, https://towardsdatascience.com/using-gradient-boosting-for-time-series-prediction-tasks-600fac66a5fc