Πολύ συχνά, οι επισκέπτες σε έναν τουριστικό προορισμό καταγράφουν στα online/social media τις απόψεις και εμπειρίες τους. Άλλες φορές, οι χρήστες των μέσων αυτών εκφράζουν την πρόθεση ή επιθυμία να επισκεφθούν έναν τόπο για αναψυχή. Μπορεί να προτείνουν τεκμηριωμένα ένα προορισμό ή μία τουριστική δραστηριότητα. Άλλοτε πάλι εκφράζονται αρνητικά και αποτρεπτικά. Η συγκέντρωση και ανάλυση του περιεχομένου αυτού, μπορεί να αφορά μια γεωγραφική τοποθεσία, μία τουριστική επιχείρηση ή και τα δύο. Το αποτέλεσμα του άμεσου εντοπισμού και της ανάλυσης των απόψεων αυτών αποτελεί πολύτιμη γνώση για έναν φορέα διαχείρισης προορισμού, που έχει αναλάβει την προώθηση για μία συγκεκριμένη περιοχή. Η συλλογή των μη δομημένων δεδομένων και η εξαγωγή γνώσης από αυτά σε μεγάλη κλίμακα είναι σχεδόν αδύνατη και ακριβή με τα διατιθέμενα μέσα αναζήτησης και επεξεργασίας κειμένων, τα οποία στηρίζονται σε τεχνικές μηχανικής μάθησης και φυσικής επεξεργασίας γλώσσας με στατιστική προσέγγιση. Δεν ενσωματώνουν δυνατότητες γλωσσολογικής ανάλυσης με εξειδίκευση στον τουρισμό, ενώ ταυτόχρονα δεν μπορούν να επεξεργαστούν με κλιμακωσιμότητα (scalability) τους τεράστιους όγκους δεδομένων που προέρχονται από το διαδίκτυο. Συνεπώς, οι υπάρχοντες μηχανισμοί ανάλυσης συναισθημάτων δεν εξάγουν ακριβή γνώση, δεν εξελίσσονται και δεν προσαρμόζονται εύκολα στις εκάστοτε θεματικές απαιτήσεις, σε έννοιες, γλώσσες και γεωγραφικά δεδομένα.
Το προτεινόμενο έργο εξελίσσει τους αλγόριθμους ανάλυσης και επεξεργασίας φυσικής γλώσσας, ώστε να ανταποκρίνονται στις ανάγκες του τουρισμού και ιδιαίτερα στην ανάγκη ανάλυσης και αιτιολόγησης των απόψεων. Για τον σκοπό αυτό, το έργο ενσωματώνει σύγχρονες μεθόδους βαθύτερης εκμάθησης (deep learning) σε πλατφόρμα ανίχνευσης λέξεων και όρων, για την εφαρμογή τους στην αναγνώριση εννοιών με απώτερο στόχο την ακριβέστερη ανάλυση απόψεων και αιτιών σε κείμενα με αντικείμενο τον τουρισμό. Εκτός από την ακριβή ανάλυση απόψεων, είναι εξίσου σημαντική η δυνατότητα επεξεργασίας μεγάλου όγκου τέτοιων δεδομένων. Γι’ αυτό, το έργο επιχειρεί την προσαρμογή της εκτέλεσης των αλγορίθμων σε προηγμένους μηχανισμούς κλιμάκωσης επεξεργασίας (scale out) με βάση την αρχιτεκτονική Spark, σε όλες τις φάσεις της επεξεργασίας: μετασχηματισμό δεδομένων, εκπαίδευση και χρήση του υπολογιστικού μοντέλου. Η αρχιτεκτονική θα αξιοποιεί την κατανεμημένη μνήμη για τη φόρτωση των δεδομένων και θα εφαρμόζει πληθώρα τελεστών για την εξαγωγή των απαραίτητων γνωρισμάτων που θα χρησιμοποιεί το υπολογιστικό μοντέλο. Για την εκπαίδευση του υπολογιστικού μοντέλου, το έργο θα αξιοποιήσει βελτιστοποιημένες υλοποιήσεις μεθόδων που χρησιμοποιούν οι αλγόριθμοι βαθύτερης εκμάθησης.
Την πλατφόρμα ολοκληρώνουν οι εφαρμογές χρήσης, δίνοντας έμφαση στην οπτικοποίηση των αναλύσεων και στην πρακτικότητα ενός μηχανισμού ειδοποιήσεων, ώστε να εξυπηρετεί τα σενάρια χρήσης των επαγγελματιών του τουρισμού. Η πιλοτική εφαρμογή της ολοκληρωμένης πλατφόρμας σε επιλεγμένους προορισμούς θα επιτρέψει την αξιολόγηση της πλατφόρμας σε πραγματικά δεδομένα και συνθήκες, και ως προς τα τεχνολογικά κριτήρια απόδοσης και ως προς τα χρηστικά και λειτουργικά κριτήρια χρηστικότητας και ακρίβειας των αναλύσεων. Έτσι, με πειστικό τρόπο θα τεκμηριωθούν τα οφέλη για τον τουρισμό και τους εμπλεκόμενους φορείς. Το προτεινόμενο σύστημα θα είναι σημαντικά χρήσιμο για τον τουρισμό και τις περιοχές που θα το αξιοποιήσουν. Η ανάλυση των απόψεων μπορεί να αξιοποιηθεί προληπτικά. Ο άμεσος εντοπισμός αρνητικών απόψεων δίνει το σήμα για έγκαιρες διορθωτικές ενέργειες. Ακόμα και η γνώση για θετικές απόψεις, οδηγεί σε αποτελεσματικές και στοχευμένες ενέργειες προώθησης. H συστηματική ανάλυση των δεδομένων αυτών είναι αναγκαία για την πληρέστερη αποτύπωση της αντίληψης των επισκεπτών και των τάσεων που διαμορφώνονται και για την άμεση λήψη αποφάσεων και αντίδραση σε γεγονότα και απόψεις που εκφράζονται στα social media.