Η μεταφορά γνώσης στη συνεργασία ανθρώπου-τεχνητής νοημοσύνης

Author nameΔημήτριος Κουτριντζές
Title
Η μεταφορά γνώσης στη συνεργασία ανθρώπου-τεχνητής νοημοσύνης
Year2022-2023
Supervisor

Maria Dagioglou

Maria Dagioglou

Summary

Οι κοινωνικά ευαισθητοποιημένοι πράκτορες τεχνητής νοημοσύνης θα πρέπει να είναι ικανοί, μεταξύ άλλων, να συνεργάζονται με έναν άνθρωπο σε καθήκοντα που απαιτούν αλληλεξαρτώμενες ενέργειες για την επίλυσή τους. Για την ενίσχυση της αμοιβαίας απόδοσης, οι συνεργατικοί πράκτορες τεχνητής νοημοσύνης θα πρέπει να διαθέτουν ικανότητες προσαρμογής και μάθησης. Ωστόσο, η συνεκπαίδευση απαιτεί μεγάλα χρονικά διαστήματα εκπαίδευσης, προκειμένου οι δύο εταίροι να μάθουν και να προσαρμοστούν ο ένας στον άλλον. Για την ανακούφιση από αυτό, θα μπορούσαν να εξεταστούν μέθοδοι μεταφοράς μάθησης προκειμένου να μειωθεί ο χρόνος εκπαίδευσης και να βελτιωθεί η απόδοση. Στην παρούσα διατριβή, μελετήσαμε την εμπειρία και την απόδοση των ομάδων ανθρώπου-πράκτορα σε μια εργασία όπου ένας άνθρωπος και ένας πράκτορας Βαθιάς Ενισχυτικής Μάθησης (Deep Reinforcement Learning, DRL) τύπου Soft-Actor-Critic (SAC) πρέπει να μάθουν σε πραγματικό χρόνο πώς να συνεργάζονται για την επίτευξη ενός κοινού στόχου.

Για να δοκιμαστούν τα οφέλη της μεταφοράς μάθησης, χρησιμοποιήθηκε μια μέθοδος Μάθησης από Επίδειξη (Learning from Demonstration), η οποία χρησιμοποίησε δεδομένα επίδειξης από μια ομάδα ειδικών ανθρώπου-πράκτορα για να διευκολύνει τη διαδικασία συνεκπαίδευσης. Οι προτεινόμενες μέθοδοι αξιολογήθηκαν μέσω μιας μελέτης με 8 διαφορετικές ομάδες ανθρώπου-πράκτορα, εκ των οποίων οι μισές έπαιξαν το παιχνίδι χωρίς μεταφορά μάθησης, ενώ οι υπόλοιπες με μεταφορά μάθησης. Τα αποτελέσματα δείχνουν ότι η εφαρμογή της μεταφοράς μάθησης σε σενάρια όπου ο πράκτορας πρέπει να συνεργαστεί με διαφορετικούς ανθρώπους έχει τη δυνατότητα να μειώσει τη διάρκεια εκπαίδευσης και να βελτιώσει τη συνολική εμπειρία.