Αναγνώριση συναισθημάτων σε σκηνές ταινιών βάσει της ομιλίας και της εικόνας

Author nameΕλευθέριος Τζαγκαράκης
Title
Αναγνώριση συναισθημάτων σε σκηνές ταινιών βάσει της ομιλίας και της εικόνας
Year2022-2023
Supervisor

Ilias Maglogiannis

IliasMaglogiannis

Summary

Αυτή η διατριβή εμβαθύνει στον συναρπαστικό τομέα του πειραματισμού και της αξιολόγησης, διερευνώντας μια ποικιλία μοντέλων μηχανικής μάθησης εφαρμοσμένων τόσο στον ακουστικό όσο και στον οπτικό τομέα. Συγκεκριμένα, η έρευνα επικεντρώνεται στην αναγνώριση συναισθημάτων μέσα από δημόσια σύνολα δεδομένων που περιλαμβάνουν φωτογραφίες και αποσπάσματα ομιλίας. Η έρευνα προχωρά στον εντοπισμό βέλτιστων μοντέλων, τα οποία στη συνέχεια εφαρμόζονται σε σκηνές ταινιών με μονολόγους. Αυτό επιτρέπει μια ολοκληρωμένη σύγκριση των αποτελεσμάτων που παράγονται από αυτά τα δύο μοντέλα, εξετάζοντας τη συνέπεια και τη συσχέτιση των προβλέψεών τους.

Ο απώτερος στόχος αυτής της προσπάθειας είναι η δημιουργία ενός "έξυπνου σκηνοθέτη", ο οποίος είναι ενδυναμωμένος από τις δυνατότητες της μηχανικής μάθησης. Αυτή η σκηνοθετική νοημοσύνη υπερβαίνει τα συμβατικά όρια, λαμβάνοντας αποφάσεις για το εάν μια σκηνή απαιτεί επανάληψη, ιδιαίτερα όταν τα αποτελέσματα των δύο μοντέλων εμφανίζουν αποκλίσεις. Η υλοποίηση αυτής της πρωτοποριακής προσέγγισης ενσωματώνει την εκπαίδευση ανοιχτού κώδικα νευρωνικών δικτύων παράλληλα με τη χρήση κλασικών αλγορίθμων μηχανικής μάθησης.

Αυτή η πολυδιάστατη διερεύνηση υπογραμμίζει τη συγχώνευση καινοτόμων τεχνολογιών και παραδοσιακών μεθοδολογιών, δημιουργώντας ένα ισχυρό πλαίσιο για την εξέλιξη της έξυπνης σκηνοθεσίας. Η συνέργεια μεταξύ των ανοιχτού κώδικα νευρωνικών δικτύων και των κλασικών αλγορίθμων μηχανικής μάθησης όχι μόνο συμβάλλει στην εξέλιξη των μεθοδολογιών κινηματογραφικής παραγωγής, αλλά επίσης ανοίγει νέους ορίζοντες στη διασταύρωση της τεχνητής νοημοσύνης με την καλλιτεχνική έκφραση.