Ομαδοποίηση εγγράφων και εξόρυξη θεμάτων / Document Clustering And Topic Mining

Author nameΙωάννης Ατλαμάζογλου
Title
Ομαδοποίηση εγγράφων και εξόρυξη θεμάτων / Document Clustering And Topic Mining
Year2019-2020
Supervisor

George Petasis

GeorgePetasis

Summary

Ο σκοπός αυτής της διατριβής είναι το θέμα της εξόρυξης θεμάτων από κείμενα στα ελληνικά και η ομαδοποίηση εγγράφων σύμφωνα με αυτά τα θέματα, έτσι ώστε τα κείμενα που αναφέρονται στο ίδιο θέμα ή είναι παρόμοια, να βρίσκονται στην ίδια ομάδα. Για την αξιολόγηση του clustering, εφαρμόζονται αρκετές μετρικές οι οποίες είναι ενδεδειγμένες για τέτοιου είδους εργασίες.