Investigation of machine learning-based schemes for the development of coarse-grained force fields for organic molecules / Μελετη μεθοδων με βαση την μηχανικη μαθηση για την αναπτυξη αδροποιημενων δυναμικων αλληλεπιδρασης για οργανικα μορια

Author nameΣπήλιος Δελλής
Title
Investigation of machine learning-based schemes for the development of coarse-grained force fields for organic molecules / Μελετη μεθοδων με βαση την μηχανικη μαθηση για την αναπτυξη αδροποιημενων δυναμικων αλληλεπιδρασης για οργανικα μορια
Year2022-2023
Supervisor

George Giannakopoulos

GeorgeGiannakopoulos

Summary

This master thesis presents the development of an innovative evaluation and ranking protocol that integrates physical insights to assess the performance of models and employs statistical tests for validation. The protocol was applied to address a multi-objective optimization problem related to self-adapting the weights of a Graph Convolutional Neural Network model. Specifically, the Graph Convolutional Neural Network model was designed to simulate a force field for predicting molecular system configurations in a coarse-grained setting. The SchNet architecture, a deep learning framework tailored for atomistic systems and capable of modelling quantum interactions in molecules, served as the foundation for the proposed approach. The training dataset consisted of multiple frames obtained from atomistic simulations of benzene molecules. This research mainly focused on achieving a self-balancing of weights within the dual components of the Graph Convolutional Neural Network model’s loss function. This self-balancing aimed to optimize the trade-off between different objectives in the multi-objective optimization problem, enhancing the model’s performance. To identify the most effective self-balancing method among various alternatives, the developed protocol was employed to evaluate the performance of each approach. The evaluation results revealed the most optimal self-balancing approach for this specific multi-objective optimization problem within the context of simulating a force field for predicting coarce-grained molecular system configurations. The presented methodology offers a valuable contribution to the field of deep learning applied to atomistic systems and multi-objective optimization, paving the way for further advancements in molecular dynamics simulations and related research.

Περίληψη

Στην μεταπτυχιακή διατριβή παρουσιάζεται η ανάπτυξη ενός καινοτόμου πρωτοκόλλου αξιολόγησης και κατάταξης που ενσωματώνει φυσικές γνώσεις για την αξιολόγηση της απόδοσης των μοντέλων και χρησιμοποιεί στατιστικές δοκιμές για επικύρωση. Το πρωτόκολλο εφαρμόστηκε για την αντιμετώπιση ενός προβλήματος βελτιστοποίησης πολλαπλών στόχων που σχετίζονται με την αυτοπροσαρμογή των βαρών ενός μοντέλου Graph Convolutional Neural Network. Συγκεκριμένα, το μοντέλο Graph Convolutional Neural Network σχεδιαστηκ για να προσομοιώνει ένα αδροποιημένων δυναμικό αλληλεπίδρασης για οργανικά μόρια. Η αρχιτεκτονική SchNet, ένα πλαίσιο βαθιάς μάθησης προσαρμοσμένο για ατομικιστικά συστήματα και ικανό να μοντελοποιεί κβαντικές αλληλεπιδράσεις σε μόρια, χρησίμευσε ως βάση για την προτεινόμενη προσέγγιση. Το σύνολο δεδομένων που χρησιμοποιήθηκε κατά την διαδικασία της εκμάθησης αποτελούνταν από πολλαπλά στιγμιότυπα που προέκυψαν από ατομικιστικές προσομοιώσεις μορίων βενζολίου. Αυτή η έρευνα επικεντρώθηκε κυρίως στην επίτευξη μιας αυτοεξισορρόπησης των βαρών των δύο συνιστωσών της συνάρτησης απώλειας του. Για τον εντοπισμό της πιο αποτελεσματικής αυτοεξισορρόπησης μέθοδος μεταξύ των διαφόρων εναλλακτικών λύσεων, χρησιμοποιήθηκε το αναπτυγμένο πρωτόκολλο για την αξιολόγηση της απόδοσης κάθε προσέγγισης. Τα αποτελέσματα της αξιολόγησης αποκάλυψαν την βέλτιστη αυτοεξισορρόπηση προσέγγιση για αυτό το συγκεκριμένο πρόβλημα βελτιστοποίησης πολλαπλών στόχων στο πλαίσιο της προσομοίωσης αδροποιημένων δυναμικών αλληλεπίδρασης για οργανικά μόρια. Η προτεινόμενη μεθοδολογία αξιολόγησης προσφέρει πολύτιμη συμβολή στον τομέα της βαθιάς μάθησης που εφαρμόζεται στα ατομικιστικά συστήματα και στην βελτιστοποίηση πολλαπλών στόχων, ανοίγοντας το δρόμο για περαιτέρω εξελίξεις στις προσομοιώσεις μοριακής δυναμικής και τη σχετική έρευνα.

Keywords:

Molecular dynamics simulation ; Graph Convolutional Neural Network ; SchNet ; Multi-component loss function ; Multi-objective optimization