Η μεθοδολογία του Ανιχνευτή Ελληνικών Τάνκερ στη Ρωσία

Σκοπός της έρευνας ήταν να εντοπίσουμε τους Έλληνες εφοπλιστές, τα πλοία των οποίων μεταφέρουν ορυκτά καύσιμα από τη Ρωσία. Ξεκινώντας από το Twitter bot της Greenpeace δημιουργήσαμε μια βάση δεδομένων με όλα τα πλοία ελληνικών συμφερόντων που έχουν αποπλεύσει από ρωσικά λιμάνια μετά την αρχή του πολέμου, τα αντιστοιχίσαμε με τις πλοιοκτήτριες εταιρείες και στη συνέχεια εντοπίσαμε τους ιδιοκτήτες τους.

17 Μαΐου 2022
17 Μαΐου 2022

Πόσα και ποια τάνκερ της ελληνικής ναυτιλίας μεταφέρουν πετρέλαιο και φυσικό αέριο από τη Ρωσία εν μέσω πολέμου; Ποιοι είναι οι ιδιοκτήτες τους; Δημόσια ή κεντρικά συγκεντρωμένα δεδομένα δεν υπάρχουν. Ως αφετηρία όμως της έρευνάς μας χρησιμοποιήσαμε ένα Twitter bot, το Russian Tanker Tracker: Έναν αυτοματοποιημένο λογαριασμό καταγραφής των εξερχόμενων από ρωσικά λιμάνια τάνκερ τον οποίο έφτιαξε η Greenpeace.

Το Russian Tanker Tracker της Greenpeace στο Twitter

Το Russian Tanker Tracker αντλεί δημόσια ναυτιλιακά δεδομένα (όπως η θέση, η κίνηση και το όνομα ενός πλοίου) σε πραγματικό χρόνο από την online υπηρεσία εντοπισμού πλοίων Marine Traffic. Κάθε φορά που ένα τάνκερ αναχωρεί από ρωσικό λιμάνι μεταφέροντας ορυκτά καύσιμα, το bot της Greenpeace δημοσιεύει αυτόματα ένα tweet που περιέχει, μεταξύ άλλων, το όνομα και τον τύπο του τάνκερ, μια εικόνα με τη θέση και τον προορισμό του, καθώς και το URL της σελίδας του τάνκερ στο Marine Traffic για την επαλήθευση των παραπάνω πληροφοριών.

Όπως αναφέρουν οι δημιουργοί του bot:

«Εμπνευστήκαμε το feed από το Oligarch Plane Tracker. Δυστυχώς, όμως, ο εντοπισμός των τάνκερ δεν είναι πάντα το ίδιο ακριβής. Τα τάνκερ πολλές φορές αναχωρούν χωρίς σαφή προορισμό, αλλάζουν προορισμό εν πλω ή απλώς περιμένουν οδηγίες στα ανοιχτά. Επιπλέον, κάποια από τα στοιχεία που δημοσιεύουμε στον λογαριασμό μας βασίζονται σε πληροφορίες που προέρχονται από τα ίδια τα τάνκερ, οι οποίες ενδέχεται να μην είναι αντιπροσωπευτικές για τις πραγματικές τους κινήσεις. Κοινοποιώντας τον σύνδεσμο της δωρεάν εφαρμογής εντοπισμού πλοίου, από την οποία αντλούμε τα δεδομένα, δίνουμε τη δυνατότητα σε οποιοδήποτε άτομο να ελέγξει μόνο του όσα δημοσιεύει το bot και να επαληθεύσει τι συμβαίνει στην πραγματικότητα (σύμφωνα με το Αυτόματο Σύστημα Αναγνώρισης AIS). Καταπιαστήκαμε με το συγκεκριμένο έργο ως μια άμεση αντίδραση απέναντι στη ρωσική εισβολή. Το bot μας δεν είναι τέλειο, το ίδιο κι εμείς, αλλά τουλάχιστον εμείς δεν εισβάλαμε παράνομα σε μιαν άλλη χώρα. Παρακαλούμε να το έχετε υπόψη αυτό όταν το χρησιμοποιείτε».

Το disclaimer της Greenpeace είναι φυσικά και δικό μας disclaimer ως προς την ακρίβεια των δεδομένων μας.

Η πρώτη δημοσίευση του bot έγινε στις 9 Μαρτίου, 14 ημέρες μετά τη ρωσική εισβολή στην Ουκρανία, και αφορούσε το ρωσικών συμφερόντων δεξαμενόπλοιο αργού πετρελαίου MENDELEEV PROSPECT με προορισμό την πόλη Σκάγκεν στη Δανία. 

Την ίδια μέρα, άλλα επτά τάνκερ φορτωμένα με ρωσικά ορυκτά καύσιμα εντοπίστηκαν από το bot, ανάμεσα τους και το DELTA TOLMI, συμφερόντων της οικογένειας Διαμαντίδη, που είχε αποπλεύσει στις 8 Μαρτίου από το λιμάνι του Νοβοροσίσκ στη Μαύρη Θάλασσα με προορισμό το λιμάνι Σίκκα στην Ινδία διαμέσου του Αιγαίου και της διώρυγας του Σουέζ .

Εκτός από την αναχώρηση του πλοίου, τα tweet που δημοσιεύει το bot ενημερώνουν για τυχόν αλλαγή πορείας του ή για τον εκτιμώμενο χρόνο άφιξης στον προορισμό του. Για τον λόγο αυτό και για την αποφυγή λανθασμένων συμπερασμάτων στην ανάλυσή μας, λάβαμε υπόψη αποκλειστικά τις μοναδικές εγγραφές για τον απόπλου κάθε πλοίου από ρωσικά λιμάνια και όχι τα tweet που αφορούν αλλαγή πορείας ή τον εκτιμώμενο χρόνο άφιξης. Το φιλτράρισμα των μοναδικών εγγραφών έγινε με βάση το κείμενο κάθε tweet και τον επταψήφιο αριθμό αναγνώρισης IMO, ο οποίος είναι μοναδικός για κάθε πλοίο και δεν αλλάζει καθ’ όλη τη διάρκεια της ζωής του, ασχέτως αν αλλάξει όνομα, σημαία, ή πλοιοκτήτη. 

Εντοπίζοντας τα ελληνόκτητα τάνκερ στα tweet του Russian Tanker Tracker

Ο μόνος τρόπος για να συλλέξουμε αυτά τα δεδομένα ήταν αρχικά να καταγράψουμε τις σχετικές πληροφορίες κάθε tweet που δημοσιεύει το bot και να τις καταχωρήσουμε σε ένα ενιαίο σύνολο δεδομένων, ώστε να μπορέσουμε να τις αναλύσουμε και να τις συνδυάσουμε με άλλες πηγές.

Το σύνολο των δεδομένων που έχουμε δημιουργήσει, το οποίο ενημερώνεται περιοδικά, δίνει πρόσβαση σε κάθε tweet που έχει δημοσιεύσει το bot, συμπεριλαμβανομένου του συνδέσμου της δημοσίευσης στο Twitter, της ημερομηνίας δημοσίευσής του, και του link του τάνκερ στην υπηρεσία Marine Traffic. Για να εμβαθύνουμε και να ερευνήσουμε τα ελληνόκτητα τάνκερ, προσθέσαμε στο σύνολο δεδομένων στήλες για τα βασικά στοιχεία του κάθε πλοίου, όπως το όνομα, τον αριθμό αναγνώρισης IMO, τον τύπο και το έτος κατασκευής του, τη σημαία υπό την οποία ταξιδεύει, την εγγεγραμμένη ως πλοιοκτήτρια εταιρεία (Registered Owner), τη διαχειρίστρια εταιρεία (Ship/Commercial Manager) και την εταιρεία διαχείρισης ασφάλειας (ISM Manager). 

Για τη δημιουργία του συνόλου δεδομένων χρειάστηκε να συνδυάσουμε διαφορετικές υπολογιστικές μεθόδους με πληροφορίες από πολλαπλές πηγές. Για παράδειγμα, για τη συλλογή των tweet του Russian Tanker Tracker χρησιμοποιούμε τα δωρεάν online εργαλεία εξόρυξης δεδομένων από το Twitter TweetBeaver και Vicinitas. 

Στη συνέχεια, για την ανάκτηση στοιχείων από την υπηρεσία εντοπισμού πλοίων Marine Traffic και τη βάση ναυτιλιακών δεδομένων Equasis χρησιμοποιούμε με αυτοματοποιημένο τρόπο τη γλώσσα προγραμματισμού Python και, συγκεκριμένα, τις βιβλιοθήκες Selenium και BeautifulSoup. Συμπληρωματικά χρειάστηκε να συγκεντρώσουμε ναυτιλιακά και εταιρικά δεδομένα με χειροκίνητο τρόπο, αφού τις δύο πρώτες μέρες λειτουργίας του (9 και 10 Μαρτίου) το bot δεν συμπεριλάμβανε στα tweet του το link για τη σελίδα κάθε τάνκερ στο Marine Traffic.

Μετά τη συλλογή των στοιχείων, δημιουργούνται τρία διαφορετικά σύνολα δεδομένων, τα οποία εμπλουτίζονται περιοδικά: 

  1. Ένα με τα tweet του bot.
  2.  Ένα με τον αριθμό IMO για κάθε τάνκερ που αναφέρεται στα tweet του bot τον οποίο ανακτούμε με τη μέθοδο της ιστοσυγκομιδής (web scraping) από το MarineTraffic.
  3. Ένα με τις βασικές πληροφορίες και τα χαρακτηριστικά των τάνκερ που ανακτούμε από το Equasis επίσης μέσω scraping.

Μεθοδολογία έρευνας και ανάλυσης δεδομένων

Οι παρακάτω ροές εργασιών αποτυπώνουν τη μεθοδολογία συγκέντρωσης και ανάλυσης

δεδομένων από το Reporters United. Αξιοποιώντας τον λογαριασμό της Greenpeace για τον

αυτοματοποιημένο εντοπισμό τάνκερ που μεταφέρουν πετρέλαιο και αέριο από τα λιμάνια της

Ρωσίας, συγκεντρώσαμε μια σειρά από στοιχεία για τα πλοία που κάνουν αυτές τις μεταφορές,

όπως το όνομα και τον αριθμό IMO τους, ώστε μέσα από ιστοσυγκομιδή (scraping) ανοιχτών

βάσεων δεδομένων (MarineTraffic, Equasis) να εντοπίσουμε τα ελληνόκτητα τάνκερ και να τα

ομαδοποιήσουμε ανάλογα με τον ιδιοκτήτη τους.

Πηγή δεδομένων

TweetBeaver, Vicinitas

Python script

Χειροκίνητη επεξεργασία

MarineTraffic

Equasis

Twitter

Αποθήκευση του @RUTankerTracker feed σε csv

Scrape

Equasis

Scrape

MarineTraffic

MarineTraffic URL

Αριθμός IMO

Εξόρυξη & επεξεργασία

κειμένου

Εξόρυξη & επεξεργασία

κειμένου

Εξόρυξη & επεξεργασία

κειμένου

Αποθήκευση δεδομένων

σε csv

Αποθήκευση δεδομένων

σε csv

Αποθήκευση δεδομένων

σε csv

Κανονικοποίηση δεδομένων

(normalization)

Twitter.csv

MarineTraffic.csv

Equasis.csv

Δημιουργία ενιαίου

συνόλου δεδομένων

Fact

Checking

Πλοία ελληνικών συμφερόντων

Αρχείο

Reporters United

Ελληνόκτητα

τάνκερ.csv

Μεθοδολογία έρευνας και ανάλυσης δεδομένων

Οι παρακάτω ροές εργασιών αποτυπώνουν τη μεθοδολογία συγκέντρωσης και ανάλυσης

δεδομένων από το Reporters United. Αξιοποιώντας τον λογαριασμό της Greenpeace για τον

αυτοματοποιημένο εντοπισμό τάνκερ που μεταφέρουν πετρέλαιο και αέριο από τα λιμάνια της

Ρωσίας, συγκεντρώσαμε μια σειρά από στοιχεία για τα πλοία που κάνουν αυτές τις μεταφορές,

όπως το όνομα και τον αριθμό IMO τους, ώστε μέσα από ιστοσυγκομιδή (scraping) ανοιχτών

βάσεων δεδομένων (MarineTraffic, Equasis) να εντοπίσουμε τα ελληνόκτητα τάνκερ και να τα

ομαδοποιήσουμε ανάλογα με τον ιδιοκτήτη τους.

Πηγή δεδομένων

TweetBeaver, Vicinitas

Python script

Χειροκίνητη επεξεργασία

MarineTraffic

Equasis

Twitter

Αποθήκευση του @RUTankerTracker feed σε csv

Scrape

Equasis

Scrape

MarineTraffic

MarineTraffic URL

Αριθμός IMO

Εξόρυξη & επεξεργασία κειμένου

Εξόρυξη & επεξεργασία κειμένου

Εξόρυξη & επεξεργασία κειμένου

Αποθήκευση δεδομένων

σε csv

Αποθήκευση δεδομένων

σε csv

Αποθήκευση δεδομένων

σε csv

Κανονικοποίηση δεδομένων

(normalization)

Twitter.csv

MarineTraffic.csv

Equasis.csv

Δημιουργία ενιαίου

συνόλου δεδομένων

Όμιλοι Ελλήνων

εφοπλιστών

Fact

Checking

Αρχείο

RU

Ελληνόκτητα

τάνκερ.csv

Σε καθένα από αυτά χρειάστηκε να γίνουν καθαρισμός και διορθώσεις, ώστε να δημιουργηθεί το τελικό σύνολο δεδομένων και να είναι δυνατό το φιλτράρισμα των ελληνόκτητων τάνκερ. Αν έστω και μία από τις εταιρείες που συνδέονται με κάποιο τάνκερ -είτε ως πλοιοκτήτρια (Registered Owner), είτε ως διαχειρίστρια (Ship/Commercial Manager), είτε ως διαχειρίστρια ασφάλειας (ISM Manager)- εδρεύει σε ελληνική διεύθυνση, τότε αυτό το τάνκερ θεωρείται ελληνικών συμφερόντων.

Στη συνέχεια εξετάζουμε τα στοιχεία των εταιρειών για να διερευνήσουμε τις συνδέσεις τους με ομίλους και οικογένειες Ελλήνων εφοπλιστών. Για τον καθαρισμό και την ανάλυση των δεδομένων χρησιμοποιούμε τις ανοιχτές βιβλιοθήκες της Python Pandas και Regular Expressions.

Παρουσιάζουμε τα εργαλεία διαχείρισης δεδομένων που χρησιμοποιούμε, καταγράφουμε την τεχνική μας μεθοδολογία βήμα – βήμα και δημοσιεύουμε ανοιχτά τα δεδομένα, για να δώσουμε στον καθένα και στην κάθε μια τη δυνατότητα να αξιοποιήσει τα αποτελέσματα της έρευνάς μας, επαληθεύοντας τα στοιχεία. 

Δεδομένης της πολυπλοκότητας καταγραφής των κινήσεων ενός πλοίου με αυτοματοποιημένο τρόπο και σε πραγματικό χρόνο από το bot, απαιτείται ανθρώπινη επιμέλεια για να εξαλειφθούν οι διπλότυπες εγγραφές και να αναδειχθούν τα πραγματικά στοιχεία. Από τις 9 Μαρτίου έως τις 30 Απριλίου  ανακτήσαμε 1988 tweet. Από αυτά φιλτράραμε μόνο τα 538 που αφορούσαν πραγματικές αναχωρήσεις από ρωσικά λιμάνια.

Στο σύνολο δεδομένων που δημοσιεύουμε υπάρχουν και tweet τα οποία διαγράφηκαν από τον λογαριασμό του bot μετά τη δημοσίευσή τους. Αυτά τα tweet αφορούσαν την αλλαγή πορείας κάποιου τάνκερ ή το νέο εκτιμώμενο χρόνο άφιξης στον προορισμό του.

Αν εντοπίσετε κάποιο λάθος στα δεδομένα, ενημερώστε μας στο reporters@reportersunited.gr.

Αφήστε μια απάντηση