Erfolgreiche Promotion über Data Lakes

Dr. Sven Langenecker hat seine kooperative Promotion an der DHBW Mosbach und der TU Darmstadt erfolgreich abgeschlossen. Seine Dissertation zum Thema „Data Lakes“ leistet einen bedeutenden Beitrag zur Forschung moderner Datenarchitekturen.

Sven Langenecker absolvierte zunächst ein Mechatronik-Studium an der DHBW Mosbach. Später erweiterte er seine Qualifikationen durch ein Informatik-Studium am Center for Advanced Studies (CAS) der DHBW. Diese interdisziplinäre Ausbildung legte die Grundlage für seine Promotion, die er in Kooperation mit der TU Darmstadt durchführte.

In seiner Promotion untersuchte Sven Langenecker die Möglichkeiten und Herausforderungen von „Data Lakes“, insbesondere in Bezug auf die Organisation und Verarbeitung großer Datenmengen. Data Lakes speichern Daten in ihrer Rohform, was deren Komplexität und Vielfalt bewahrt, aber auch zu Problemen bei der Datenentdeckung führt. Um diese Herausforderung zu bewältigen, entwickelte Langenecker ein neues Framework zur semantischen Kennzeichnung von Tabellenspalten, das auf Weak Supervision basiert. Zudem präsentierte er ein neues Modell namens Pythagoras, das mit Hilfe von Graph Neural Networks insbesondere die semantische Typenerkennung von numerischen Spalten in Tabellen verbessert.

Die kooperative Promotion wurde unter der Betreuung von Prof. Dr. Carsten Binnig (TU Darmstadt), Prof. Dr. Christoph Sturm und Prof. Dr. Christian Schalles (beide DHBW Mosbach) durchgeführt.

Die Dissertation ist über den folgenden DOI abrufbar: https://doi.org/10.26083/tuprints-00027469.