Author name | Ηρακλής Ευαγγελινός |
---|---|
Title | Comparison of NeuroSymbolic Programming frameworks in Human Activity Recognition / Σύγκριση Νευροσυμβολικών framework για αναγνώριση ανθρώπινης δραστηριότητας |
Year | 2023-2024 |
Supervisor | Nikolaos Katzouris NikolaosKatzouris |
Human activity recognition (HAR) is a fundamental task in artificial intelligence, with applications in healthcare, smart homes, and surveillance. Traditional deep learning approaches have achieved state-of-the-art performance in HAR tasks, but they often lack interpretability and struggle to capture complex semantic relationships between activities. Neurosymbolic AI, which combines the strengths
of symbolic reasoning and deep learning, offers a promising alternative.
This thesis explores the application of NeuroSymbolic AI to HAR using DeepProbLog, a popular neurosymbolic framework that integrates logic-based probabilistic modeling with deep learning. We focus on DeepProbLog as it is more extensively used in the field and has shown great promise in various applications. Our primary goal is to investigate how well DeepProbLog performs in recognizing human activities and compare its results with traditional deep learning approaches.
We first introduce the DeepProbLog framework and discuss its underlying principles, including the integration of logic-based probabilistic modeling with neural networks. We then present a comprehensive evaluation of DeepProbLog's performance in HAR tasks, highlighting its strengths and limitations. Our experiments demonstrate that DeepProbLog outperforms traditional deep learning methods in terms of accuracy and interpretability, particularly when dealing with complex activity relationships.
Περίληψη
Η αναγνώριση της ανθρώπινης δραστηριότητας (HAR) είναι ένα θεμελιώδες έργο στην τεχνητή νοημοσύνη, με εφαρμογές στην υγειονομική περίθαλψη, τα έξυπνα σπίτια και την επιτήρηση. Οι παραδοσιακές προσεγγίσεις Βαθιάς Μάθησης έχουν επιτύχει κορυφαίες επιδόσεις σε εργασίες HAR, αλλά συχνά στερούνται ερμηνευσιμότητας και δυσκολεύονται να συλλάβουν πολύπλοκες σημασιολογικές σχέσεις μεταξύ δραστηριοτήτων. Η νευρο-συμβολική τεχνητή νοημοσύνη (NeuroSymbolic AI), η οποία συνδυάζει τα πλεονεκτήματα της συμβολικής συλλογιστικής και της βαθιάς μάθησης, προσφέρει μια πολλά υποσχόμενη εναλλακτική λύση.
Η παρούσα διπλωματική εργασία διερευνά την εφαρμογή της νευρο-συμβολικής τεχνητής νοημοσύνης σε αναγνώριση ανθρώπινης δραστηριότητας χρησιμοποιώντας το DeepProbLog, ένα δημοφιλές νευρο-συμβολικό framework που ενσωματώνει πιθανολογική μοντελοποίηση βασισμένη στη λογική με βαθιά μάθηση. Επικεντρωνόμαστε στο DeepProbLog, καθώς χρησιμοποιείται εκτενέστερα στον τομέα και έχει δείξει δυνατότητα να εφαρμοστεί σε διάφορα πεδία. Πρωταρχικός μας στόχος είναι να διερευνήσουμε πόσο καλά αποδίδει το DeepProbLog στην αναγνώριση ανθρώπινων δραστηριοτήτων και να συγκρίνουμε τα αποτελέσματά του λαμβάνουμε με παραδοσιακές προσεγγίσεις βαθιάς μάθησης.
Αρχικά παρουσιάζουμε το DeepProbLog και συζητάμε τις βασικές αρχές του, συμπεριλαμβανομένης της ενσωμάτωσης της λογικής-πιθανοτικής μοντελοποίησης με τα νευρωνικά δίκτυα. Στη συνέχεια παρουσιάζουμε μια ολοκληρωμένη αξιολόγηση των επιδόσεων του DeepProbLog σε εργασίες HAR, επισημαίνοντας τα δυνατά σημεία και τους περιορισμούς του. Τα πειράματά μας καταδεικνύουν ότι το DeepProbLog υπερτερεί έναντι των παραδοσιακών μεθόδων βαθιάς μάθησης όσον αφορά την ακρίβεια και την ερμηνευσιμότητα, ιδίως όταν πρόκειται για συγκριτικά περίπλοκες εφαρμογές.