Author name | Αργύριος Ζαφειρίου |
---|---|
Title | Ensembling to leverage the interpretability of medical image analysis systems / Σύνολο για την αξιοποίηση της ερμηνευσιμότητας των συστημάτων ανάλυσης ιατρικής εικόνας |
Year | 2021-2022 |
Supervisor | Ilias Maglogiannis IliasMaglogiannis |
Modern Artificial Intelligence (AI) systems have been achieving human-level and, in some cases, even higher predictive capabilities, solving numerous and various tasks. Two primary reasons behind this accomplishment are the rapid technological evolution, and the rising volume of available data, both of which allowed the development of multimillion parameter models. Inevitably, along with accuracy, complexity has also risen. But no matter how high the accuracy may be, some tasks, including any medicalrelated task, require explanations about the model’s decision.
When dealing with image data, the explanations of the model’s decision usually take the form of salient and nonsalient areas over the image that highlight the important and non-important areas respectively. Whichever the importance attribution method though, the saliency of an area represents the view of the model towards the stimuli that influenced mostly the outcome and can be as accurate as the quality of the features the model has learned. Thus, a plausible assumption would be that the better predictions the model makes, the more accurate explanations it produces. In this work, the efficacy of ensembling models as a means of leveraging explanations is examined, under the concept that ensemble models are combinatory informed. Apart from ensembling, a novel approach is herein presented for the aggregation of the importance attribution maps, in an attempt to examine an alternative way of combining the different views that several competent models offer.
The purpose of aggregating is to lower computation costs, while allowing for the combinations of maps of various origin. Following a saliency map evaluation scheme, four tests are performed over three datasets, two of which are medical image datasets, and one is generic. The results indicate that explainability can, indeed, benefit from the combination of information, either by ensembling or aggregating. Discussion follows, in an attempt to provide insight over the mechanics that led to the provided results, as well as to give guidelines for potential future work.
Περίληψη:
Τα σύγχρονα συστήματα Τεχνητής Νοημοσύνης (AI) έχουν επιτύχει σε ανθρώπινο επίπεδο και, σε ορισμένες περιπτώσεις, ακόμη υψηλότερες προγνωστικές ικανότητες, επιλύοντας πολυάριθμες και ποικίλες εργασίες. Δύο βασικοί λόγοι πίσω από αυτό το επίτευγμα είναι η ταχεία τεχνολογική εξέλιξη και ο αυξανόμενος όγκος των διαθέσιμων δεδομένων, που επέτρεψαν την ανάπτυξη πολλών εκατομμυρίων μοντέλων παραμέτρων. Αναπόφευκτα, μαζί με την ακρίβεια, έχει αυξηθεί και η πολυπλοκότητα. Όμως, ανεξάρτητα από το πόσο υψηλή μπορεί να είναι η ακρίβεια, ορισμένες εργασίες, συμπεριλαμβανομένων οποιωνδήποτε εργασιών που σχετίζονται με την ιατρική, απαιτούν εξηγήσεις σχετικά με την απόφαση του μοντέλου.
Όταν ασχολούμαστε με δεδομένα εικόνας, οι επεξηγήσεις της απόφασης του μοντέλου συνήθως λαμβάνουν τη μορφή εμφανών και μη εμφανών περιοχών πάνω από την εικόνα που τονίζουν τις σημαντικές και τις μη σημαντικές περιοχές αντίστοιχα. Όποια και αν είναι η μέθοδος απόδοσης σημασίας, η εξέχουσα θέση μιας περιοχής αντιπροσωπεύει την άποψη του μοντέλου προς τα ερεθίσματα που επηρέασαν κυρίως το αποτέλεσμα και μπορεί να είναι τόσο ακριβής όσο και η ποιότητα των χαρακτηριστικών που έχει μάθει το μοντέλο. Έτσι, μια εύλογη υπόθεση θα ήταν ότι όσο καλύτερες προβλέψεις κάνει το μοντέλο, τόσο πιο ακριβείς εξηγήσεις παράγει. Σε αυτή την εργασία, εξετάζεται η αποτελεσματικότητα των μοντέλων συνόλων ως μέσου μόχλευσης επεξηγήσεων, υπό την έννοια ότι τα μοντέλα συνόλων έχουν συνδυαστική πληροφόρηση. Εκτός από την ενοποίηση, παρουσιάζεται εδώ μια νέα προσέγγιση για τη συγκέντρωση των χαρτών απόδοσης σπουδαιότητας, σε μια προσπάθεια να εξεταστεί ένας εναλλακτικός τρόπος συνδυασμού των διαφορετικών απόψεων που προσφέρουν αρκετά ικανά μοντέλα.
Ο σκοπός της συγκέντρωσης είναι να μειωθεί το κόστος υπολογισμού, επιτρέποντας ταυτόχρονα τους συνδυασμούς χαρτών διαφόρων προελεύσεων. Μετά από ένα σχέδιο αξιολόγησης του χάρτη εξέχουσας σημασίας, πραγματοποιούνται τέσσερις δοκιμές σε τρία σύνολα δεδομένων, δύο από τα οποία είναι σύνολα δεδομένων ιατρικών εικόνων και η μία είναι γενική. Τα αποτελέσματα υποδεικνύουν ότι η επεξήγηση μπορεί, πράγματι, να ωφεληθεί από το συνδυασμό των πληροφοριών, είτε με τη συγκέντρωση είτε με τη συγκέντρωση. Ακολουθεί συζήτηση, σε μια προσπάθεια να δοθεί μια εικόνα για τους μηχανισμούς που οδήγησαν στα παρεχόμενα αποτελέσματα, καθώς και να δοθούν κατευθυντήριες γραμμές για πιθανές μελλοντικές εργασίες.