2D map of gene expression in the metastatic lymph node

Mehr als ChatGPT: Foundation Models für die Forschung

Foundation Models sind komplexe KI-Anwendungen mit enormem Potenzial. Mit Datenschätzen aus Medizin, Klima- oder Materialforschung trainiert, können sie neue Zusammenhänge finden und Vorhersagen ermöglichen. Helmholtz fördert die Pionierarbeit, allein ans Max Delbrück Center fließen 5,55 Millionen Euro.

Verheißungsvoll reist der Begriff „Foundation Model“ durch die Wissenschaftswelt, so verheißungsvoll wie der Hype um ChatGPT rund um den Globus. Die täglich millionenfach genutzte Anwendung ist ein Foundation Model. Doch der Helmholtz-Gemeinschaft geht es um mehr als Sprache. Foundation Models sind deutlich leistungsstärker und flexibler als herkömmliche auf Künstlicher Intelligenz (KI) basierende Modelle und eignen sich somit ebenfalls für die Forschung.

Gezielt mit umfangreichen Daten trainiert und dank generativer KI sind sie in der Lage, komplexe Zusammenhänge auf der Grundlage erlernter Muster zu verstehen, neue Zusammenhänge zu finden sowie Prognosen zu erstellen. „Wir sind davon überzeugt, dass wir mit Foundation Models die Grenzen der Wissenschaft verschieben können. Helmholtz bringt dafür nicht nur herausragende Talente und umfassende Datensätze aus verschiedenen Forschungsbereichen, sondern auch eine einzigartige Computer-Infrastruktur zusammen“, sagt Professor Otmar Wiestler, der Präsident der Helmholtz-Gemeinschaft.

„Gemeinsam können wir wirklich etwas bewegen“

Die Helmholtz-Gemeinschaft fördert in der Helmholtz Foundation Model Initiative (HFMI) seit 2024 sieben Pilotprojekte und die benötigte Infrastruktur mit insgesamt rund 28 Millionen Euro über drei Jahre. Ans Max Delbrück Center fließen davon 5,55 Millionen Euro. An drei Projekten ist das Zentrum maßgeblich beteiligt. Eine Synergy Unit forscht an den übergreifenden Fragen und unterstützt den Wissensaustausch. Hier ist das Max Delbrück Center federführend. 

Auch das High Performance Computing (Helmholtz AI Compute Ressources oder HAICORE) wird für die Initiative ausgebaut, um den Zugang zu der nötigen Rechenkapazität niederschwellig zu ermöglichen. Neben dem Karlsruher Institut für Technologie (KIT) und dem Forschungszentrum Jülich wird das Max Delbrück Center ein neuer Host. 

Die unterstützten Pilotprojekte sollen nicht nur einen klaren Mehrwert für die Wissenschaft bieten, sondern die Ergebnisse auch als Open Source der Gesellschaft zur Verfügung stellen – vom Code über die Trainingsdaten bis hin zu den trainierten Modellen. „Das Ganze basiert auf einer Grassroots-Initiative der Datenwissenschaftler*innen“, sagt Professorin Dagmar Kainmüller, Leiterin der Arbeitsgruppe „Integrative Imaging Data Sciences“ am Max Delbrück Center und Mitglied des vierköpfigen Koordinierungskreises der HFMI. Sie ist eine der Initiator*innen – und ihre Begeisterung ist greifbar. „Wir haben die erforderlichen Datenmengen aus ganz unterschiedlichen Forschungsbereichen, wir haben das Know-how, und wir haben die Rechenpower. Gemeinsam können wir wirklich etwas bewegen. Wir sehen es als unseren Auftrag, die in der Helmholtz-Gemeinschaft erhobenen Daten optimal zu nutzen.“

Synergy Unit: Benchmarking für neue KI-Methoden

Ein Foundation Model wird in mehreren Phasen trainiert. Zunächst wird es mit Unmengen gut aufbereiteter wissenschaftlicher Daten gefüttert, anfangs ohne konkrete Aufgabe. Es geht darum, dass sich das System eigenständig eine extrem leistungsstarke Wissensgrundlage (die Foundation) aneignet. Anschließend kann es mit verhältnismäßig wenig Aufwand in der nächsten Phase auf gezielte Aufgaben, die Down Stream Tasks, trainiert werden. 

Die Synergy Unit, deren Sprecherin Kainmüller ist und die Dr. Eirini Kouskoumvekaki vom Max Delbrück Center als Wissenschaftsmanagerin koordiniert, fokussiert sich dabei auf übergeordnete Fragestellungen, die für alle teilnehmenden Projekte relevant sind. Beispiele sind Fragen zur Skalierbarkeit der Modelle oder das Training mit den Datensätzen. Zentral ist dabei, wie sich die Forschung zu Foundation Models über Disziplingrenzen hinweg möglichst schnell vorantreiben lässt. Somit sichert die Synergy Unit eine langfristige Wirkung der Initiative zum Wohle der Allgemeinheit. 

„Wir sehen ein einzigartiges Potenzial, auf der Grundlage von großen und ungemein diversen Daten neue KI-Methoden zu vergleichen, zu erkennen, was unter welchen Umständen besonders gut funktioniert und die Foundation Models entsprechend in der Helmholtz-Gemeinschaft auszurollen“, sagt Kainmüller. 

An der „Synergy Unit“ beteiligte Forschungszentren: Deutsches Krebsforschungszentrum, Helmholtz Munich, Forschungszentrum Jülich und Max Delbrück Center. 

Pilotprojekt „VirtualCell“: Komplexe zelluläre Prozesse vorhersagen

2D-Karte der Genexpression in einem metastasierten Lymphknoten.

Seit langem gibt es die Vision, eine Zelle – ähnlich eines digitalen Zwillings – digital nachzubilden. Dies würde nicht nur Einblicke in komplexe zelluläre Prozesse ermöglichen, sondern auch Vorhersagen. Wie wirken sich die Veränderungen im Verlauf einer Erkrankung aus? Was bewirkt ein Medikament? Dieser Herausforderung will sich das Projekt „VirtualCell“ stellen. Es baut dabei auf den jüngsten Fortschritten in der Hochdurchsatz-Genomsequenzierung und -bildgebung auf und kombiniert sie mit generativer KI. 

„Zum komplexen Zusammenspiel, das den Verlauf einer Krankheit befeuert, gehören die räumlichen Beziehungen von Zellen in erkranktem Gewebe“, sagt Professor Nikolaus Rajewsky, der Direktor des MDC-BIMSB. Seine Arbeitsgruppe hat eine Plattform namens Open-ST entwickelt, die Gewebeproben von Patient*innen mit subzellulärer Präzision auswertet und virtuelle 3D-Gewebeblöcke entstehen lässt. „Da die Methode kostengünstig und skalierbar ist, können wir damit unterschiedlichste Gewebe einbeziehen und so zum Projekt VirtualCell beitragen“, sagt Rajewsky. 

„VirtualCell“ wird auf umfangreichen Einzelzell-Multiomik- und räumlichen Daten trainiert. So entsteht in dem Grundlagenmodell eine umfassende Darstellung zellulärer Zustände und Interaktionen. Das Modell werden die Forscher*innen auf neuartige klinische Aufgaben anwenden, indem sie es an Krankheitsproben von biomedizinischen Partnern wie der Charité – Universitätsmedizin Berlin anpassen. „VirtualCell“ entwickelt die zelluläre Modellierung so weiter, dass damit Durchbrüche in der klinischen Pathologie, der Arzneimittelentwicklung und der Patient*innenstratifizierung möglich werden. Es ist in der Lage, die biomedizinische Forschung und die Ergebnisse im Gesundheitswesen erheblich zu verbessern.

An „VirtualCell“ beteiligte Zentren: Forschungszentrum Jülich, Helmholtz Munich, Max Delbrück Center. 

Pilotprojekt „Human Radiome Project“: Mit KI die Radiologie auf völlig neue Füße stellen

Gesunde und kranke Knochen: Das Bild zeigt links den Schädel einer gesunden Kontrollmaus (A, C) und rechts einer Maus mit multiplem Myelom (B, D). Solche präklinischen Daten sind entscheidend, um ein KI-Modell für das „Human Radiome Project“ zu entwickeln.

Ein weiteres Beispiel für mögliche Anwendungen ist das „Human Radiome Project“: Es entwickelt ein Modell, das die medizinische Bildgebung grundlegend verändern will. Mit einem Datenschatz von 4,8 Millionen 3D-Bildern – mehr als 500 Terabyte an CT- und MRT-Aufnahmen aus Deutschland und England – trainieren die Wissenschaftler*innen eine künstliche Intelligenz, die medizinische Bilder deutlich schneller und präziser als bisher analysieren soll. „Dieses Projekt könnte für die Radiologie ähnlich bedeutend werden wie das Humangenomprojekt für die Genetik“, sagt Dr. Arnd Heuser vom Max Delbrück Center. 

Das bringt zum einen die Präzisionsmedizin voran: Diagnosen können schneller und genauer gestellt werden – von der Früherkennung von Tumoren bis zur Analyse von Hirnerkrankungen, auch die personalisierte Risikobewertung wird besser. Denn dank des Modells können die Krebsrisiken individueller Patient*innen auf der Grundlage ihrer Daten genauer eingeschätzt werden. Die medizinische Forschung profitiert ebenfalls. Der Fokus am Max Delbrück Center ist, das KI-Modells für präklinische Anwendungen anzupassen. „Die Übertragung des Modells auf Tierversuche eröffnet neue Perspektiven“, erläutert Heuser. „Wenn wir die Auswertung komplexer präklinischer Bilddaten erheblich optimieren, wird nicht nur die Forschung effizienter. Das beschleunigt auch die Translation von wissenschaftlichen Erkenntnissen in die Klinik.“ Das Potenzial solcher KI-Modelle gehe weit über die Diagnostik hinaus. Es könnte die Art und Weise, wie wir Krankheiten erforschen und behandeln, nachhaltig verändern. 

Am „Human Radiome Project“ beteiligte Helmholtz-Zentren: Deutsches Krebsforschungszentrum, Deutsches Zentrum für Neurodegenerative Erkrankungen und Max Delbrück Center. 

Pilotprojekt „AqQua“: Wie Plankton das Klima beeinflusst

Jeden Tag beobachten Forscher*innen das Leben in unseren Ozeanen mit einer Vielzahl von Geräten.

Das Leben im Wasser spielt eine entscheidende Rolle für das Klima der Erde. Besonders das Plankton bindet große Mengen von Kohlenstoff aus der Atmosphäre. Der Klimawandel schädigt die Ökosysteme des Planktons und wirkt sich auf den Kohlenstoffexport und die Nahrungsressourcen im Meer aus. „Ich finde es erschreckend, wie wenig wir über die Verbreitung und Häufigkeit der einzelnen Plankton-Arten wissen und wie unsicher dementsprechend die Schätzungen sind, wieviel Kohlenstoff sie aufnehmen können“, sagt Dagmar Kainmüller, die Co-Sprecherin des interdisziplinären Projekts „AqQua“. 

Jeden Tag nehmen Forscher*innen rund um den Globus mit einer Vielzahl von Geräten Millionen Planktonbilder in den Ozeanen auf. Diese verteilte pelagische Bildgebung ermöglicht eine umfassende Beobachtung des aquatischen Lebens bis hinunter auf den Grund der Tiefsee. „AqQua“ wird Milliarden solcher Bilder kombinieren, um das erste grundlegende pelagische Bildgebungsmodell zu entwickeln. Neben den Helmholtz-Zentren sind 40 Partnerinstitutionen weltweit beteiligt. „Das Projekt ist eine einzigartige Möglichkeit, die Artenvielfalt des Planktons, die Gesundheit des Ökosystems und des Kohlenstoffflusses weltweit zu überwachen“, sagt Kainmüller. „Ich freue mich sehr auf diese konzertierte Anstrengung, die wir mit diesem fantastischen interdisziplinären Konsortium vorantreiben können.“ AqQua werde die Entscheidungsfindung in Zeiten des globalen Wandels unterstützen, insbesondere im Hinblick auf neue Technologien zur Entfernung von Kohlendioxid aus der Atmosphäre.

An „AqQua“ beteiligte Zentren: Forschungszentrum Jülich, GEOMAR, HEREON, Max Delbrück Center. 

 

Weiterführende Informationen