| Author name | Ορέστης Βαγγέλης |
|---|---|
| Title | Εκτίμηση 6D στάσης αντικειμένων: βιβλιογραφική ανασκόπηση και ανάπτυξη διαδικασίας δημιουργίας μασκών χωρίς μοντέλο |
| Year | 2024-2025 |
| Supervisor | Theodoros Giannakopoulos TheodorosGiannakopoulos |
Η παρούσα διπλωματική εργασία παρουσιάζει μια τριμερή έρευνα σχετικά με την εκτίμηση 6D στάσης αντικειμένων (6D object pose estimation) για νέα αντικείμενα. Τα δύο πρώτα μέρη αποτελούνται από μια εκτενή επισκόπηση της βιβλιογραφίας και μια ενιαία αξιολόγηση των πλέον σύγχρονων μεθόδων (state-of-the-art) σε σύνολα δεδομένων αναφοράς (benchmark datasets). Η ανάλυση αυτή εντοπίζει ένα κρίσιμο σημείο συμφόρησης στην απόδοση των προσεγγίσεων χωρίς μοντέλο (model-free approaches): την έλλειψη ανθεκτικής και ακριβούς αρχικής τμηματοποίησης αντικειμένων (initial object segmentation).
Με κίνητρο αυτό το εύρημα, η τρίτη και κύρια συνεισφορά αυτής της εργασίας είναι η ανάπτυξη του DiPose, μιας νέας υπολογιστικής διαδικασίας (pipeline) που επικεντρώνεται ειδικά στη δημιουργία υψηλής ποιότητας μασκών τμηματοποίησης για εκτίμηση στάσης χωρίς μοντέλο. Το DiPose μοντελοποιεί ένα νέο αντικείμενο εκτελώντας αρχικά μια ανακατασκευή Δομής από Κίνηση (Structure-from-Motion, SfM) από ένα σύντομο βίντεο εισαγωγής (onboarding video). Το προκύπτον νέφος σημείων (point cloud) χρησιμοποιείται στη συνέχεια για να εκπαιδευτεί μια υψηλής πιστότητας εμφατική αναπαράσταση (implicit representation) μέσω των Fast Dipole Sums (FDS). Αυτό το εμφατικό μοντέλο λειτουργεί ως εικονικό μοντέλο CAD, επιτρέποντας τη δημιουργία συνθετικών δισδιάστατων όψεων (synthetic 2D views) που καθοδηγούν ένα πλαίσιο βασισμένο σε foundation model ώστε να παράγει ακριβείς μάσκες τμηματοποίησης για τις εικόνες δοκιμής.
Η προτεινόμενη υπολογιστική διαδικασία επικυρώνεται στο σύνολο δεδομένων HOPE, όπου υπερτερεί μιας ισχυρής γραμμής βάσης χωρίς μοντέλο (model-free baseline) κατά 8 % στη μέση ακρίβεια (average precision).