Πρόγραμμα Επιστήμης Δεδομένων

Συντονιστές: Καθ. Δημήτρης Πλεξουσάκης, Καθ. Νικόλαος Σπυράτος

Το ερευνητικό πρόγραμμα Επιστήμης Δεδομένων (που δημιουργήθηκε στα τέλη του 2017) στοχεύει στην αξιοποίηση της υπολογιστικής υποδομής και της τεχνογνωσίας των ερευνητικών εργαστηρίων του Ινστιτούτου στη διαχείριση, ανάλυση και οπτικοποίηση μεγάλων όγκων δεδομένων με σκοπό τη διερεύνηση της αλυσίδας αξίας που σχετίζεται με τα μεγάλα δεδομένα. Δίνεται έμφαση στην ανάπτυξη τεχνικών για τη συλλογή, αποθήκευση, επεξεργασία, ανάλυση και ερμηνεία μεγάλων όγκων ετερογενών δεδομένων που είναι δυναμικά, αλληλένδετα και αφορούν διάφορους τομείς όπως η βιολογία, η ιατρική, η σωματιδιακή φυσική, η αστρονομία, η τηλεπισκόπηση (remote sensing), οι περιβαλλοντικές μελέτες , τα οικονομικά κ.λπ. Το πρόγραμμα σκοπεύει να δημιουργήσει σταδιακά μια μεγάλης κλίμακας υπολογιστική υποδομή, μαζί με μεθόδους και εργαλεία που θα καλύπτουν τις ανάγκες των ερευνητικών εργαστηρίων του ICS και των άλλων ινστιτούτων του ΙΤΕ για διαχείριση και ανάλυση μεγάλων δεδομένων. Το πρόγραμμα εκμεταλλεύεται την υπολογιστική υποδομή των εργαστηρίων CARV και ISL, συμπεριλαμβανομένων εργαλείων λογισμικού για τη διαχείριση και την ανάλυση μεγάλου όγκου δεδομένων (π.χ., Apache Spark, Flink, Blazegraph, Cassandra).

Τα ακόλουθα κύρια ζητήματα αποτελούν μέρος της στρατηγικής κατεύθυνσης του προγράμματος Επιστήμης Δεδομένων:

  • Αποθήκευση, ευρετηρίαση και αναζήτηση πολύ μεγάλων όγκων ετερογενών δεδομένων
  • Προέλευση και σύνοψη δεδομένων
  • Ενοποίηση δεδομένων μεγάλης κλίμακας
  • Εξόρυξη δεδομένων και αιτιώδης ανακάλυψη
  • Εξαγωγή πληροφοριών από τον Ιστό
  • Διαχείριση συνδεδεμένων δεδομένων, αναζήτηση και ενημέρωση
  • Διασφάλιση ποιότητας δεδομένων
  • Εξαγωγή μεταδεδομένων από σήματα χαμηλού επιπέδου
  • Στατιστική μηχανική μάθηση
  • Οπτικοποίηση σε πραγματικό χρόνο
  • Αναλύσεις μεγάλης κλίμακας για υποστήριξη αποφάσεων
  • Συλλογισμός περιορισμένων πόρων με μεγάλο όγκο δεδομένων
  • Εφαρμογές στην ιατρική, τη βιολογία, την αστροφυσική

 

Συμμετέχοντα εργαστήρια ΙΠ: Εργαστήριο Πληροφοριακών Συστημάτων (ISL) (συντονιστής), Εργαστήριο Αρχιτεκτονικής Υπολογιστών και Συστημάτων VLSI (CARV) , Εργαστήριο Υπολογιστικής Βιο-Ιατρικής (ΕΥΒΙ), Εργαστήριο Αλληλεπίδρασης Ανθρώπου-Υπολογιστή (HCI), Εργαστήριο Επεξεργασίας Σήματος (SPL), Εργαστήριο Τηλεπικοινωνιών & Δικτύων (TNL).