Towards achieving effective traceability management between and within software artifacts

Traceerbaarheid in softwaresystemen met NLP en datagedreven methodes
Moderne softwaresystemen worden steeds complexer, waardoor effectieve traceerbaarheid (het verbinden van vereisten, ontwerp, code en tests) essentieel maar uitdagend is. In zijn proefschrift pakt Ahmad Zaki Bin Mohamad Pauzi deze uitdagingen aan door gebruik te maken van Natural Language Processing (NLP) en datagedreven methoden om traceerbaarheid tussen diverse software-artefacten te verbeteren.
Bin Mohamad Pauzi presenteert allereerst een systematische mappingstudie van 96 publicaties (2013–2021), waarin knelpunten zoals representatiegelijkheid, schaalbaarheid en uitlegbaarheid van NLP-technieken worden geïdentificeerd. Vervolgens introduceert hij een innovatief meta-analyseframework dat Word2Vec-embeddings en ARIMA-tijdreeksmodellering combineert om opkomende onderzoekstrends te voorspellen. Om semantisch begrip te versterken, stelt Bin Mohamad Pauzi een domeinspecifieke benadering voor die conceptuele elementen intelligent koppelt aan toepassingsdomeinen. Daarnaast onderzoekt Bin Mohamad Pauzi de evolutie van ontwerpartefacten, met name UML-klassendiagrammen in langdurige open source-projecten, en onthult gevallen van “UML-dormancy” die wijzen op discrepanties tussen ontwerp en implementatie. Tot slot overbrugt Bin Mohamad Pauzi de kloof tussen theorie en praktijk via een multivocale mappingstudie en een industrieel ervaringsverslag, waarin hij de succesvolle implementatie van end-to-end traceerbaarheid binnen een DevOps-omgeving wordt demonstreert.
Deze bevindingen bieden concrete handvatten voor verbetering van traceerbaarheidsprocessen en toolintegratie in de praktijk. Al met al levert dit proefschrift een veelzijdige bijdrage aan software-engineering door zowel theoretische inzichten als praktische oplossingen te bieden voor duurzame, transparante en goed onderhoudbare softwaresystemen.
Ahmad Zaki Bin Mohamad Pauzi voerde zijn onderzoek uit bij het Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence, afdeling Software Engineering. Hij vervolgt zijn loopbaan als Senior Data Scientist bij BP.