Skip to ContentSkip to Navigation
Rijksuniversiteit Groningenfounded in 1614  -  top 100 university
Over ons Actueel Evenementen Promoties

Representations of structured biological data and prototype-based machine learning

Promotie:K.S. BohnsackWanneer:08 december 2025 Aanvang:11:00Promotors:prof. dr. K. (Kerstin) Bunte, M. (Michael) Biehl, Prof, prof. dr. T. VillmannWaar:Academiegebouw RUG / Studenten Informatie & AdministratieFaculteit:Science and Engineering
Representations of structured biological data and prototype-based
machine learning

Betrouwbaarder Machine Learning gebruiken voor biologische data 

Biologische gegevens, zoals eiwitstructuren en DNA-sequenties, zijn van nature complex en variëren sterk in vorm en grootte. Deze complexiteit vormt een uitdaging voor standaard machine learning (ML)-tools, die doorgaans eenvoudige invoer van een vaste grootte vereisen. In gevoelige domeinen zoals de biogeneeskunde is het van cruciaal belang dat onze modellen niet alleen nauwkeurig zijn, maar ook interpreteerbaar; we moeten begrijpen waarom een classificatiebeslissing is genomen.

In haar onderzoek richt Katrin Bohnsack zich op twee belangrijke strategieën om die kloof te overbruggen: slimme gegevensrepresentatie en interpreteerbaar classificatieleren in de context van bio-informatica.Voor de gegevensrepresentatie onderzocht Bohnsack methoden om complexe structuren om te zetten in efficiënte numerieke descriptoren. Dit omvat nieuwe sequentiesignaturen op basis van informatietheorie en een nieuwe, op referenties gebaseerde embedding-benadering voor moleculaire gegevens. Deze techniek karakteriseert een complex object op basis van de nabijheid tot een kleine, zorgvuldig geselecteerde groep referentiepunten, waardoor zeer efficiënte en robuuste vergelijkingen mogelijk worden.

Voor de classificatie gebruikt Bohnsack een variant van op prototypes gebaseerde classifiers, namelijk Matrix Learning Vector Quantization. Dit model biedt transparantie in de leer- en voorspellingsprocessen en helpt te identificeren welke gegevenskenmerken daadwerkelijk hebben bijgedragen aan het oplossen van het betreffende classificatieprobleem.

Uiteindelijk draagt dit werk bij aan een betrouwbaarder en beter geïnformeerd gebruik van ML bij de analyse van gestructureerde biologische gegevens.

Katrin Bohnsack voerde haar onderzoek uit bij het Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence, afdeling Intelligente Systemen. Ze vervolgt haar loopbaan als docent in Duitsland. 

View this page in: English