Η διαχείριση μεγάλων δεδομένων υπόσχεται να φέρει σημαντική βελτίωση στις ζωές μας, επιταχύνοντας την ανακάλυψη γνώσης, την έρευνα και την καινοτομία. Ωστόσο, τα τελευταία χρόνια αυξάνεται η ανησυχία για την έλλειψη δικαιοσύνης, διαφορετικότητας, και διαφάνειας σε αλγορίθμους που λαμβάνουν αποφάσεις βάσει δεδομένων, εγείροντας έτσι την ανάγκη για υπεύθυνα, από το σχεδιασμό τους, αυτόματα συστήματα λήψης αποφάσεων βάσει δεδομένων. Ως τώρα, προσπάθειες για υπεύθυνη λήψη αποφάσεων έχουν εστιάσει σε αλγορίθμου Μηχανικής Μάθησης, υποθέτοντας ότι αυτοί έχουν εκπαιδευτεί με δεδομένη υψηλής ποιότητας, αγνοώντας τις υποκείμενες σύνθετες ροές που μπορεί να έχουν παράξει αυτά τα δεδομένα. Μια τέτοια σύνθετη ροή δεδομένων είναι η ταυτοποίηση οντοτήτων (ΤΟ), η οποία ανακαλύπτει και ενοποιεί περιγραφές που αναφέρονται στην ίδια πραγματική οντότητα. Σε αυτό το έργο, στοχεύουμε σε υπεύθυνα εκ σχεδιασμού συστήματα ΤΟ, συγκεκριμένα όταν οι αποφάσεις για το ποιες περιγραφές θα πρέπει να αναλυθούν πρώτα, λαμβάνονται με βάση ένα δοθέντα προϋπολογισμό. Οι στόχοι του ResponsibleER είναι: (α) να εμπλουτίσει τη διαφορετικότητα των ταυτοποιημένων οντοτήτων, (β) να διασφαλίσει τη δικαιοσύνη της ΤΟ, και (γ) να βελτιώσει τη διαφάνεια των συστημάτων ΤΟ. Για το (α), μας ενδιαφέρει να ορίσουμε την προοδευτική ΤΟ ως πρόβλημα βελτιστοποίησης, με στόχο τη μεγιστοποίηση της διαφορετικότητας. Για το (β), μας ενδιαφέρουν μέτρα κεντρικότητας για υποψήφια προς ταυτοποίηση ζευγάρια σε ένα γράφο οντοτήτων που επεξεργάζεται ένας αλγόριθμος προοδευτικής ΤΟ, διασφαλίζοντας ότι όλες οι ομάδες οντοτήτων αντιπροσωπεύονται δίκαια στα αποτελέσματα. Για το (γ), χρειάζεται να επεκετείνουμε τα ευρετήρια που ορίζουμε στα (α) και (β) για να παράξουμε κατανοητές επεξηγήσεις σχετικά με τις ενδιάμεσες αποφάσεις που λαμβάνονται σε μία διαδικασία ΤΟ (π.χ., ευρετηριασμός, ταυτοποίηση). Ενώ και τα τρία προβλήματα έχουν οριστεί ως σπουδαίες προκλήσεις, δεν υπάρχουν εργασίες που να μελετούν οποιαδήποτε από αυτά.