Εντοπισμός πλαστογραφίας προσώπου από κανάλια RGB

Author nameΒασίλειος Παπαδόπουλος
Title
Εντοπισμός πλαστογραφίας προσώπου από κανάλια RGB
Year2021-2022
Supervisor

Michael Filippakis

MichaelFilippakis

Summary

Έχουμε εισέλθει σε μια εποχή παραπληροφόρησης, ψευδών ειδήσεων και απομίμησης που ενισχύεται από την Τεχνητή Νοημοσύνη (AI). Το οπτικό περιεχόμενο έχει τεθεί σε κίνδυνο από κακόβουλους φορείς, οι οποίοι προσπαθούν να παραπλανήσουν τα συστήματα ασφαλείας, προσποιούμενοι την ταυτότητα άλλων. Αυτοί οι φορείς συνήθως επιδιώκουν αυξημένη πρόσβαση σε κρίσιμες υποδομές, όπως η διαδικτυακή τραπεζική, οι υπηρεσίες κυβερνητικής διοίκησης και οποιοδήποτε σύστημα KYC (Γνώρισε τον Πελάτη Σου). Ο στόχος ενός συστήματος βιομετρίας είναι να αναπτύξει ελέγχους ασφαλείας και μέτρα για να επαληθεύσει την ταυτότητα και την αυθεντικότητα (ζωντάνια) ενός ατόμου.

Δεδομένου του κοινωνικού αντίκτυπου αυτής της εμπορευματοποίησης της απομίμησης, η έρευνά μας προτείνει μεθόδους βασισμένες στη μάθηση με έμφαση στην εκμάθηση για καλή απόδοση σε σημαντικά διαφορετικές κατανομές στόχου, γνωστές και ως Προσαρμογή Τομέα (Domain Adaptation) και Γενίκευση Τομέα (Domain Generalization). Στην Βαθιά Μάθηση (Deep Learning, DL), η απόδοση του μοντέλου εξαρτάται σε μεγάλο βαθμό από την ύπαρξη υψηλής ποικιλίας στα παραδείγματα εκπαίδευσης και συνήθως οι επαγγελματίες της Μηχανικής Μάθησης επιδιώκουν να συλλέξουν δεδομένα με τρόπο που να καθοδηγεί την ικανότητα του μοντέλου να γενικεύει. Ωστόσο, ακόμη και με τεράστιες ποσότητες δεδομένων, δεν υπάρχει εγγύηση ότι το μοντέλο θα αποδώσει εξίσου καλά σε δεδομένα που δεν έχουν ξαναδεί, στον ίδιο τομέα. Στην έρευνά μας, εξετάζουμε και αξιολογούμε διάφορες μεθόδους βαθιάς και μηχανικής μάθησης προσπαθώντας να μάθουμε διακριτικά χαρακτηριστικά που θα μπορούσαν να γενικεύσουν σε διάφορα ακαδημαϊκά σύνολα δεδομένων και σύνολα δεδομένων στον πραγματικό κόσμο.

Ορίζουμε το κλασικό πρόβλημα δυαδικής ταξινόμησης το οποίο χρησιμοποιείται ως μοντέλο αναφοράς. Χρησιμοποιούμε Βαθιά Συνελικτικά Νευρωνικά Δίκτυα (CNN) και δύο ευρέως χρησιμοποιούμενα υποκείμενα (backbones), το ResNet18 και το EfficientNetb4. Στη συνέχεια, μετατρέπουμε το έργο σε μάθηση πολλαπλών καθηκόντων με βοηθητικά πλήρως συνδεδεμένα κεφάλια και εξετάζουμε την επίδραση στη γενίκευση και την προσαρμογή, χρησιμοποιώντας διαφορετικές βαθιές μετρικές απώλειες, όπως η Απώλεια Κέντρου (Center Loss), η Απώλεια Τριπλέτας (Triplet Loss) και η Ορθογωνιότητα των Γρανάντων (Gradients Orthogonality). Τέλος, ερευνούμε χαρακτηριστικά χειροποίητης εξαγωγής, όπως το Ιστογράφημα Στραμμένων Γρανάντων (HOG) και τα Τοπικά Δυαδικά Μοτίβα (LBP), και εκπαιδεύουμε κλασικούς ταξινομητές μηχανικής μάθησης (π.χ. Υποστηρικτική Μηχανή Διανυσμάτων - Support Vector Machine, SVM).