Το νέο ευρωπαϊκό έργο «LISTEN« έχει ως στόχο τη δημιουργία μιας φωνητικής διεπαφής για το έξυπνο σπίτι. Οι εταίροι του έργου από την Ελλάδα, τη Γερμανία και την Ιταλία θα αναπτύξουν μια διεπαφή ελέγχου διαδικτυακών υπηρεσιών που αφορούν στο έξυπνο σπίτι με χρήση ομιλίας. Επιπλέον στόχος είναι να γεφυρωθούν οι περιοχές της επεξεργασίας σήματος, όπως είναι τα συστήματα μικροφώνων και η αναγνώριση ομιλίας.
Σήμερα, γίνεται ολοένα και περισσότερο προσιτός για τους καταναλωτές ο έλεγχος διάφορων λειτουργιών του σπιτιού τους με χρήση λογισμικού, όπως είναι ο έλεγχος του κλιματισμού, της αναπαραγωγής εικόνας και ήχου, καθώς και των επικοινωνιών. Τέτοιοι αυτοματισμοί είναι ιδιαίτερα σημαντικοί για άτομα με αναπηρία ή τους ηλικιωμένους και παρέχουν στα άτομα αυτά σημαντική βοήθεια για τις καθημερινές τους δραστηριότητες, ενώ σε περίπτωση κινδύνου μπορεί να αποδειχθούν σωτήριοι. Όμως, η πρόσβαση στους αυτοματισμούς ενός έξυπνου σπιτιού είναι δύσκολη, ακριβώς για τα άτομα που τους έχουν περισσότερο ανάγκη. Η χρήση φωνητικών εντολών θα ήταν το ιδανικό μέσο χρήσης των αυτοματισμών για τον καθένα.
Ερευνητές στην τεχνολογία φωνής και την επεξεργασία σήματος εργάζονται πάνω στα παραπάνω θέματα στο πλαίσιο του ευρωπαϊκού έργου «LISTEN: Hands-Free Voice-Enabled Interface to Web Applications for Smart Home Environments». Οι ερευνητές θα σχεδιάσουν ένα σύστημα που επιτρέπει τη φωνητική πρόσβαση σε διαδικτυακές εφαρμογές για έξυπνα σπίτια. Δυο καίρια συστατικά του συστήματος είναι ότι θα επιτρέπουν μεγάλο εύρος λεξιλογίου στο χρήστη, και ότι θα στηρίζονται σε συστοιχίες μικροφώνων για την καταγραφή των φωνητικών εντολών. Το σύστημα θα επιτρέπει τον φωνητικό έλεγχο διάφορων συσκευών σε ένα έξυπνο σπίτι που μπορούν να ελεγχθούν μέσω του Διαδικτύου. Επίσης, θα επιτρέπει τη χρήση φωνητικών εντολών για την πρόσβαση σε διάφορες διαδικτυακές εφαρμογές. Το έργο LISTEN χρηματοδοτείται από το πρόγραμμα πλαίσιο Horizon 2020 και ειδικότερα από τις δράσεις Marie Skłowdowska-Curie Research and Innovation Staff Exchange (RISE). Έχει τετραετή διάρκεια και ξεκίνησε την 1η Ιουνίου 2015. Οι εταίροι είναι: το Ινστιτούτο Πληροφορικής τουΙδρύματος Τεχνολογίας και Έρευνας, που είναι και ο συντονιστής του έργου, η εταιρεία EML European Media Laboratory GmbH, με βάση την Χαϊδελβέργη, το πανεπιστήμιο RWTH Aachen, και η εταιρεία Cedat85 srl, με βάση τη Ρώμη.
Ένας σημαντικός στόχος του έργου είναι η αλληλεπίδραση του χρήστη με το σύστημα να γίνεται ελεύθερα μέσα στον χώρο, χωρίς δηλαδή να πρέπει να κρατάει στα χέρια του ή να έχει επάνω του κάποια συσκευή, ή να πρέπει στραφεί προς κάποιο μικρόφωνο. Για το σκοπό αυτό, θα σχεδιαστεί ένα ασύρματο δίκτυο ακουστικών αισθητήρων ειδικά σχεδιασμένο για το έξυπνο σπίτι. Θα υλοποιηθούν τα απαραίτητα στοιχεία του δικτύου αυτού τόσο σε υλικό (hardware) όσο και σε λογισμικό (software) και η λειτουργία του λογισμικού θα γίνεται αυστηρά σε πραγματικό χρόνο.
Ένας άλλος σημαντικός στόχος του έργου είναι ο σχεδιασμός ενός συστήματος που θα προσφέρει πρόσβαση σε διαδικτυακές εφαρμογές και σε λειτουργίες του έξυπνου σπιτιού με την ίδια φωνητική διεπαφή. Για διαδικτυακές λειτουργίες όπως: αναζήτηση, πρόσβαση σε –και αλληλεπίδραση με– κοινωνικά δίκτυα, σύνταξη ηλεκτρονικών μηνυμάτων (email), κ.ά., το σύστημα αναγνώρισης ομιλίας θα βασίζεται σε ένα μεγάλο λεξικό. «Θα προσαρμόσουμε το σύστημα αναγνώρισης ομιλίας της εταιρείας μας για πρόσβαση σε τέτοιες διαδικτυακές εφαρμογές και για αλληλεπίδραση με τους αυτοματισμούς ενός έξυπνου σπιτιού. Θα παρέχουμε, επίσης, αναγνώριση ομιλίας για τις εφαρμογές αυτές σε πολλές γλώσσες», αναφέρει σχετικά ο Δρ. Siegfried Kunzmann, Διευθυντής Έρευνας και Ανάπτυξης στην EML GmbH. Το LISTENθα «ακούει» πολλές γλώσσες, όπως: αγγλικά, ελληνικά, γερμανικά και ιταλικά, για να επιδείξει την ευκολία του συστήματος να προσαρμόζεται σε διαφορετικές γλώσσες.
Έχοντας τους παραπάνω στόχους, το LISTEN πηγαίνει πιο πέρα από την τρέχουσα τεχνολογική στάθμη. Οι εταίροι του έργου στοχεύουν να γεφυρώσουν διάφορες ερευνητικές περιοχές, όπως είναι η έρευνα σε ακουστικούς αισθητήρες και η έρευνα σε αυτόματη αναγνώριση ομιλίας. Στο έργο θα εργαστούν ερευνητές με μεγάλη εμπειρία στις παραπάνω περιοχές, και η συνεργασία διαφορετικών τομέων, από πανεπιστήμια, ερευνητικά κέντρα και εταιρείες, θα συμβάλλει στην αντιμετώπιση του θέματος από διαφορετικές οπτικές γωνίες, που θα το καταστήσουν άμεσα χρήσιμο και εκμεταλλεύσιμο.
Το Ινστιτούτο Πληροφορικής του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ ) είναι ο συντονιστής του έργου και συνεισφέρει στο ερευνητικό αντικείμενο του έργου με εμπειρία σε ακουστικά δίκτυα αισθητήρων και επεξεργασία σημάτων συστοιχιών μικροφώνων. Η εταιρεία EML GmbH συνεισφέρει στο έργο με το σύστημά της για αναγνώριση ομιλίας. Το πανεπιστήμιο RWTH Aachen φέρνει στο έργο δεκαετίες ερευνητικής εμπειρίας σε αναγνώριση ομιλίας. Η εταιρεία Cedat85 srl προσφέρει στο έργο την εμπειρία της σε ανάπτυξη συγκεκριμένων εφαρμογών και συστημάτων που έχουν ως βάση τους την αναγνώριση ομιλίας.
Πληροφορίες:
Αθανάσιος Μουχτάρης, Αναπληρωτής Καθηγητής Επιστήμης Υπολογιστών Ινστιτούτο Πληροφορικής, Ίδρυμα Τεχνολογίας και Έρευνας Ν. Πλαστήρα 100, Τ.Κ. 700 13, Ηράκλειο, Κρήτη E-mail: mouchtar@ics.forth.gr Iστοσελίδα έργου LISTEN: http://www.listen-project.eu
Το Ίδρυμα Τεχνολογίας και Έρευνας (ΙΤΕ) (Ελλάδα) είναι ένα ερευνητικό κέντρο, το οποίο, περιλαμβάνει ερευνητικό δυναμικό υψηλού επιπέδου και μια σημαντική φήμη ως ενός εκ των κορυφαίων ερευνητικών κέντρων σε διεθνές επίπεδο. Στο έργο LISTEN, το ΙΤΕ συμμετέχει μέσω του Ινστιτούτου του Πληροφορικής, και συγκεκριμένα του Εργαστηρίου Επεξεργασίας Σήματος, το οποίο στελεχώνεται από ερευνητές με μεγάλη εμπειρία σε ακουστικά δίκτυα αισθητήρων, εντοπισμό ηχητικών πηγών στο χώρο, μοντελοποίηση και κωδικοποίηση ήχου, κατανεμημένη επεξεργασία σημάτων και επικοινωνίες.
Η εταιρεία EML European Media Laboratory GmbH (Γερμανία) είναι μια ιδιωτική επιχείρηση στον τομέα της τεχνολογίας πληροφοριών, και ιδρύθηκε από τον Klaus Tschira, έναν εκ των ιδρυτών της εταιρείας πληροφορικής SAP AG. Η εταιρεία έχει μεγάλη δραστηριότητα έρευνας και ανάπτυξης στους τομείς της επικοινωνίας ανθρώπου-υπολογιστή και της αυτόματης αναγνώρισης ομιλίας.
Η ομάδα αναγνώρισης ομιλίας του πανεπιστημίου RWTH Aachen (Γερμανία) έχει επιτύχει σημαντική συνεισφορά στην ανάπτυξη της περιοχής αυτής διεθνώς και περιλαμβάνει ερευνητές με δεκαετίες εμπειρίας στην αναγνώριση ομιλίας, ιδιαίτερα στατιστικών μοντέλων, επεξεργασίας φυσική γλώσσας, και ανάπτυξης εφαρμογών.
Η εταιρεία Cedat85 srl (Ιταλία) έχει μια μακρά παράδοση στην ανάπτυξη εφαρμογών αναγνώρισης ομιλίας, περιλαμβανομένης της αξιολόγησης συστημάτων επικοινωνίας φωνής και της ενοποίησης συστημάτων τεχνολογίας φωνής.