Applications of machine learning techniques on graph data / Εφαρμογές τεχνικών μηχανικής μάθησης σε δεδομένα γράφων

Author nameΑλέξανδρος - Ιάσονας Καμπάνης
Title
Applications of machine learning techniques on graph data / Εφαρμογές τεχνικών μηχανικής μάθησης σε δεδομένα γράφων
Year2022-2023
Supervisor

Maria Halkidi

MariaHalkidi

Summary

In recent years advancements in Machine Learning and the massive production of data with the natural occurrence of relations lead organizations and research to seek new methods to exploit them or generalize traditional machine learning technologies for this purpose. The most well known occurrence is social networks. The purpose of this thesis is to present and explain the basic principles and terms related to the domain of Graph Representation Learning.

We present all basic terms needed for the reader to understand all the algorithms explained in the literature and explain the inner workings of those algorithms according to characteristics and taxonomies. In the use case of fraud detection and the learning objective of semi supervised learning we choose the most appropriate algorithms based on the characteristics that are useful for this scenario and we assess their performance based on the selected use case and the dataset chosen. We perform and comment on the results of several experiments designed to test the performance of those algorithms of the GRL domain in those specific data.

Περίληψη

Τα τελευταία χρόνια οι εξελίξεις στον τομέα της Μηχανικής Μάθησης σε συνδυασμό με την παραγωγή δεδομένων μεγάλης κλίμακας με σχέσεις που προκύπτουν μεταξύ των δειγμάτων να παράγονται αυτόματα οδήγησαν τους οργανισμούς και ερευνητές να βρουν καινούργιους τρόπους ή να γενικεύσουν υπάρχοντες ώστε να αξιοποιήσουν αυτά τα δεδομένα. Το πιο χαρακτηριστικό παράδειγμα είναι αυτό των κοινωνικών δικτύων. Σε αυτήν την εργασία σκοπός είναι να περιγράψουμε τις βασικές έννοιες που σχετίζονται με τον τομέα του Graph Representation Learning.

Παρουσιάζουμε όλες τις βασικές έννοιες που απαιτούνται καθώς και τους κύριους αλγορίθμους και ταξινομίες που τους κατατάσουν σε κατηγορίες με βάση τα χαρακτηριστικά τους. Στο σενάριο χρήσης της ανίχνευσης απάτης σε συναλλαγές επιλέγουμε τους πλέον κατάλληλους και αξιολογούμε την επίδοση τους στο σενάριο της ημι επιβλεπόμενης μάθησης. Παρουσιάζουμε και σχολιάζουμε τα αποτελέσματα με βάση πειράματα που αξιολογούν πολλά σενάρια όπως end to end εκπαίδευση αλλά και παραγωγή αναπαραστάσεων με μη επιβλεπόμενο τρόπο.