Aus Genomen Wissen generieren: Greifswalder Forscherin erhält DFG-Förderung

Forschung

Hoff richtet als Bioinformatikerin ihren Schwerpunkt auf die Verbesserung und Automatisierung der Genomannotation, d. h. sie will computergestützt herausfinden, welche Teile einer DNA-Sequenz welche biologische Funktion aufweisen. Dabei konzentriert sie sich auf die automatisierte Vorhersage von proteinkodierenden Genen in Genomen. Im Rahmen der DFG-Förderung plant sie ihre Vision einer Foundation Model-basierten Revolution umzusetzen. „Im Fokus steht für mich die Entwicklung eines umfassenden Annotationssystems für Millionen eukaryotischer Genome, d. h., wir wollen eine Softwarelösung entwickeln, die nicht nur einzelne DNA-Sequenzen analysiert, sondern Millionen verschiedener Organismen in einem gemeinsamen, standardisierten System verarbeiten kann. Dabei sollen nicht nur die Positionen der Gene in den Genomen, sondern auch deren biologische Funktion sowie die Position und Funktion repetitiver Elemente bestimmt werden. Das wäre ein Durchbruch, denn bisher fehlt oft eine einheitliche und zuverlässige Methode, um aus dieser Datenflut nützliche Erkenntnisse zu gewinnen.“

Neue Methoden für die Analyse von Millionen Genomen
Mit über 1,5 Millionen eukaryotischen Spezies – Organismen wie Pilze, Pflanzen, Tiere und Menschen –, die im Rahmen des internationalen Großforschungsprojekts Earth BioGenome Project (EBP) sequenziert werden sollen, stoßen bisherige Methoden schnell an ihre Grenzen. „Wir haben nicht nur sehr viele, sondern auch sehr komplexe Daten“, sagt Hoff. „Traditionelle Methoden können da vor allem für Spezies, die bisher in den Genomdatenbanken unterrepräsentiert sind, nicht mithalten. Daher setzen wir auf Foundation Modelle, die man sich so ähnlich vorstellen kann, wie die Grundlage populärer ChatBots, nur für Genomdaten statt natürlicher Sprache, und weitere maschinelle Lernverfahren.“ 

Neue Ansätze aus dem Bereich des Deep Learning, wie das an der Universität Greifswald entwickelte Tool „Tiberius“, könnten die Genauigkeit der Genvorhersage deutlich verbessern. Dennoch fehlt für den größten Teil der bislang generierten Genomdaten eine systematische Beschreibung der Inhalte. „Ohne skalierbare neue Methoden bleibt viel Potenzial ungenutzt“, betont die Bioinformatikerin. „Eine verbesserte Genvorhersage hat direkte Auswirkungen auf die Entwicklung neuer Medikamente, die Resistenz von Pflanzen gegenüber Krankheiten oder den Schutz gefährdeter Arten. Wir wollen nicht nur Daten erzeugen, sondern daraus nützliche Erkenntnisse gewinnen – für die Wissenschaft, aber auch für die Gesellschaft.“

Heisenberg-Projekt stärkt die Genomforschung in Greifswald
Als Expertin für die Analyse eukaryotischer Genomdaten hat sich Hoff international einen Namen gemacht. Zu ihren wichtigsten Entwicklungen gehören die Software-Pipelines BRAKER und Galba. So wurde BRAKER bereits über 4400 Mal laut Google Scholar zitiert und mehr als 39 000 Mal als Software-Tool bei Github heruntergeladen. Doch nun geht es um mehr: nicht nur einzelne Gene zu finden, sondern systematisch alle Genstrukturen und ‑funktionen für Millionen von Arten zu identifizieren und auszuwerten. 

Dabei hat sich Hoff für die Heisenberg-Förderung ihres Projekts, die bundesweit umgesetzt werden kann, bewusst für die Universität Greifswald und das Institut für Mikrobiologie entschieden. „Die enge Zusammenarbeit mit experimentellen Mikrobiolog*innen, insbesondere im Bereich der Einzeller, ist für die Validierung und Anwendung der entwickelten Methoden von zentraler Bedeutung“, erklärt sie. In Greifswald sieht sie ein ideales Umfeld für ihre Forschung: „Das interdisziplinäre Forschungsgebäude des Center for Functional Genomics of Microbes und die Nähe zum entstehenden Helmholtz-Institut für One Health schaffen optimale Voraussetzungen für unsere Arbeit. Die moderne Recheninfrastruktur der Universität mit speziellen Grafikprozessoren (GPUs) ermöglicht die rechenintensiven Deep-Learning-Analysen, die wir brauchen. Für mich ist das die Chance, langfristig an der Zukunft der Genomforschung mitzuwirken und gleichzeitig die nächste Generation von Bioinformatiker*innen auszubilden.“

Weitere Informationen
Das Heisenberg-Programm der DFG fördert herausragende Wissenschaftler*innen mit dem Ziel, ihnen die Möglichkeit zu geben, eine eigenständige Forschungsgruppe aufzubauen und ihre wissenschaftliche Karriere langfristig zur Professur zu vertiefen. Die Förderung dauert fünf Jahre und bietet umfangreiche finanzielle und institutionelle Unterstützung für innovative Forschungsprojekte.

Ansprechpartnerin an der Universität Greifswald 
PD Dr. Katharina Hoff
Institut für Mathematik und Informatik
Walther-Rathenau-Straße 47, 17489 Greifswald
Telefon +49 3834 420 4624
katharina.hoffuni-greifswaldde

https://www.linkedin.com/in/pd-dr-katharina-hoff-53283596/
https://bsky.app/profile/katharinahoff.bsky.social
https://fosstodon.org/@KatharinaHoff

 

Medieninformation


Zurück zu allen Meldungen