Αναγνώριση ανθρώπινης συμπεριφοράς μέσω μιμητικής μάθησης / Prediction of human behaviour using imitation learning

Author nameΜατθαίος Ζηδιανάκης
Title
Αναγνώριση ανθρώπινης συμπεριφοράς μέσω μιμητικής μάθησης / Prediction of human behaviour using imitation learning
Year2020-2021
Supervisor

George Vouros

GeorgeVouros

Summary

This thesis explores the use of the Info-GAIL algorithm, which is based on the generative adversarial imitation learning framework to model modalities of human behaviour towards performing tasks. The goal of this thesis is to use behaviour models learnt through Info-GAIL to predict the modality of executing a specific “object grasping” task. This is done through learning sub-task policies from unsegmented demonstrations of tasks. Specifically, this thesis uses a dataset with trajectories regarding human behaviour towards grasping objects of different sizes in specific . These are pre-processed to correct imperfections and exploited to extract features of trajectory states that are used during training. Then, the implemented method is tested and evaluated utilizing the extracted features. The thesis concludes with a thorough presentation of results and proposals for further work towards using multi-modal imitation learning to predict human behaviour in executing tasks.

Περίληψη

Στην παρούσα εργασία μελετάται η χρήση ενός αλγορίθμου μιμητικής μάθησης ώστε να μοντελοποιηθεί η ανθρώπινη συμπεριφορά για την επίτευξη μιας εργασίας με διαφοροποιημένους στόχους. Στόχος είναι να εξεταστεί η ικανότητα των μοντέλων που δημιουργούνται, στην αναγνώριση του στόχου μιας επιτελούμενης εργασίας, σε πραγματικές συνθήκες. Αυτό επιτυγχάνεται μέσω της μάθησης πολιτικών από μη τμηματοποιημένες επιδείξεις εκτέλεσης εργασιών. Ειδικότερα, η διπλωματική εξετάζει διάφορες τεχνικές μιμητικής μάθησης , υποστηρίζοντας τη χρήση του αλγορίθμου InfoGAIL που βασίζεται στον αλγόριθμο GAIL, και που έχει τη δυνατότητα συσχέτισης τρόπου συμπεριφοράς και επιτέλεσης εργασίας. Ο αλγόριθμος μελετάται στα πλαίσια αναγνώρισης συμπεριφοράς «αρπαγής» αντικειμένων διαφορετικών μεγεθών. Παρέχονται δεδομένα που αφορούν ανθρώπινη συμπεριφορά σε συγκεκριμένες συνθήκες για την αρπαγή αντικειμένων, από τα οποία εξάγονται χαρακτηριστικά και χρησιμοποιούνται για την εκπαίδευση και αποτίμηση της προτεινόμενης μεθόδου. Η διπλωματική παρουσιάζει τα αποτελέσματα και ευρήματα, και προτείνει μελλοντικές δράσεις για την χρήση μεθόδων μιμητικής μάθησης για την αναγνώριση συμπεριφοράς.