Federated learning for recommender systems / Συνεργατικές τεχνικές μάθησης σε συστήματα συστάσεων

Author nameΓεώργιος Καραγκούνης
Title
Federated learning for recommender systems / Συνεργατικές τεχνικές μάθησης σε συστήματα συστάσεων
Year2024-2025
Supervisor

Maria Halkidi

MariaHalkidi

Summary

Recommendation systems are central to many digital platforms, enabling personalized content delivery in domains such as e-commerce, streaming services, and social media. However, conventional recommendation models often require centralized access to user data, which raises significant privacy and security concerns, especially under modern data protection regulations such as the GDPR. Federated Learning (FL), a privacy-preserving collaborative training paradigm, addresses these issues by keeping user data localized on client devices while aggregating only model updates on a central server. This makes it highly suitable for personalized recommendation tasks, forming the basis of Federated Recommendation Systems (FedRS) [1].

This thesis explores the application of advanced deep learning models in a federated setting for the task of personalized item recommendation. Multiple federated algorithms are evaluated, including the standard Federated Averaging (FedAvg), the Weighted Federated Averaging (WFedRec), and the proposed clustering-enhanced method, CWFedRec. The proposed CWFedRec introduces client clustering based on semantic user preferences and incorporates personalized bias vectors generated using sentence transformers. These algorithms aim to address challenges specific to FedRS, including data heterogeneity, limited communication bandwidth, and the curse of dimensionality in high-dimensional embedding spaces.

Περίληψη

διευκολύνοντας την παροχή εξατομικευμένου περιεχομένου σε τομείς όπως το ηλεκτρονικό εμπόριο, οι υπηρεσίες streaming και τα μέσα κοινωνικής δικτύωσης. Ωστόσο, τα συμβατικά μοντέλα συστάσεων απαιτούν συχνά κεντρική πρόσβαση σε δεδομένα χρηστών, γεγονός που εγείρει σημαντικά ζητήματα ιδιωτικότητας και ασφάλειας, ιδιαίτερα υπό το πρίσμα σύγχρονων κανονισμών προστασίας δεδομένων όπως ο Γενικός Κανονισμός για την Προστασία Δεδομένων (GDPR). Η Συνεργατική Μάθηση (Federated Learning - FL), ένα συνεργατικό εκπαιδευτικό παράδειγμα που διαφυλάσσει την ιδιωτικότητα, αντιμετωπίζει αυτά τα ζητήματα διατηρώντας τα δεδομένα του χρήστη τοπικά στις συσκευές-πελάτες, ενώ στον κεντρικό διακομιστή συγκεντρώνονται μόνο ενημερώσεις του μοντέλου. Αυτό καθιστά την FL ιδιαίτερα κατάλληλη για εργασίες εξατομικευμένων συστάσεων, αποτελώντας τη βάση των Ομοσπονδιακών Συστημάτων Συστάσεων (Federated Recommendation Systems – FedRS) [1].

Η παρούσα εργασία εξετάζει την εφαρμογή προηγμένων μοντέλων βαθιάς μάθησης σε συνεργατικό πλαίσιο για την εξατομικευμένη σύσταση αντικειμένων. Αξιολογούνται πολλοί αλγόριθμοι συνεργατικής μάθησης, όπως ο βασικός Federated Averaging (FedAvg), ο Σταθμισμένος Federated Averaging (WFedRec) και η προτεινόμενη μέθοδος με ενίσχυση μέσω ομαδοποίησης, CWFedRec. Η προτεινόμενη μέθοδος CWFedRec εισάγει ομαδοποίηση των πελατών με βάση τις σημασιολογικές προτιμήσεις των χρηστών και ενσωματώνει εξατομικευμένους διανυσματικούς όρους προκατάληψης (bias vectors), οι οποίοι παράγονται μέσω sentence transformers. Αυτοί οι αλγόριθμοι αποσκοπούν στην αντιμετώπιση προκλήσεων που είναι ιδιαίτερες για τα FedRS, όπως η ετερογένεια των δεδομένων, οι περιορισμοί στο εύρος ζώνης επικοινωνίας και η κατάρα της διαστασιμότητας σε χώρους ενσωμάτωσης υψηλών διαστάσεων.