Haghverdi Lab

Neue Gruppenleiterin schlägt Brücke zwischen Mathematik und Biologie

Dr. Laleh Haghverdi leitet ab 1. Juli die neue MDC-Arbeitsgruppe „Berechnungsmethoden und Omic Analytik“. Sie sucht und findet mathematische Ansätze, die die Analyse und Integration von Einzelzell- und Multi-Omics-Daten verbessern.

Laleh Haghverdi leitet die MDC-Arbeitsgruppe "Berechnungsmethoden und Omic Analytik".

Die Schnittstellen zwischen Mathematik und Biologie faszinieren Dr. Laleh Haghverdi. „Ich befinde mich sozusagen in der Mitte“, sagt Haghverdi. „Diese Überschneidung macht alles noch spannender und dynamischer.“

Besonders freut sie sich darauf, am Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) mit anderen Forscherinnen und Forschern aus beiden Bereichen zusammenzuarbeiten. Haghverdis neue Gruppe ist Teil eines Einzelzell-Clusters am Berliner Institut für Medizinische Systemsbiologie (BIMSB) des MDC. Die Gruppe will vor allem die Integration und Analyse verschiedener Arten von Einzelzelldaten verbessern, die teilweise auch aus verschiedenen Quellen stammen.

Daten anders sehen

Bei der Sequenzierung einzelner Zellen entstehen riesige Datensätze. Um diese zu analysieren, brauchen Forschende Computer-Algorithmen. Haghverdi verfolgt jedoch einen anderen Ansatz: Dank ihres Hintergrunds in Mathematik und Physik kann sie nach mathematischen Ideen suchen und diese an die biologischen Fragestellungen anpassen.

Als Mathematik-Doktorandin an der Technischen Universität München sah sie sich zum Beispiel RNA-Sequenzen einzelner Zellen an und dachte darüber nach, wie sich Stammzellen Schritt für Schritt differenzieren und so etwa zu einer Muskel- oder Herzzelle werden. Dieser Prozess der Differenzierung, bei dem es einige wichtige Verzweigungen gibt, erinnerte sie sehr an zufällige Irrfahrten („random Walks“) und „Diffusionen“ – zwei mathematische Modelle, die mithilfe von Gleichungen definiert werden. Sie erkannte, dass die Gleichungen für „Diffusionskarten“ für solche Transkriptomik-Daten aus der Einzelzellanalyse optimiert werden können: Anstelle des Abstands zwischen Punkten im Raum kann die Pseudo-Zeit zwischen den Phasen der Zelldifferenzierung gemessen werden. Das Ergebnis: bunte Visualisierungen, die Zellen an verschiedenen Punkten des Differenzierungsprozesses veranschaulichen.

Haghverdi vergleicht diesen Ansatz mit dem Zeichnen einer Straßenkarte. Sie beobachtet sozusagen, in welche Richtung Autos fahren, bewertet dann die beliebtesten Routen und kann so anhand der Karte vorhersagen, wo ein Auto – oder in diesem Fall eine Zelle – seine bzw. ihre Reise beginnt und beendet. Ähnlich wie beim Autofahren gibt es jedoch auch hier mehr als eine mögliche Route. Die Diffusionskarte bewertet alle möglichen Routen zwischen den Phasen der Differenzierung. „Das macht die Karte widerstandsfähig gegenüber Rauschen. Das ist besonders bei Einzelzelldaten wichtig, denn da gibt es sehr viele Nullen und viel Rauschen“, erklärt Haghverdi.

Seit der Veröffentlichung dieses Ansatzes, der 2017 mit dem Erwin-Schrödinger-Preis für interdisziplinäre Forschung ausgezeichnet wurde, sind die Datenberge aus der Sequenzierung exponentiell gewachsen. Ganze Organismen, wie der Zebrafisch, wurden über den gesamten Entwicklungsprozess hinweg auf Einzelzellebene sequenziert. Mit der neuen MDC-Gruppe möchte Haghverdi das Konzept der Diffusionskarte ausbauen, um diesem komplexeren Umfeld gerecht zu werden. Außerdem möchte sie die Auflösung von „Zellstammbäumen“ verbessern, die die Geschichte einer Zelle bis zu ihrer ursprünglichen Stammzellgruppe zurückverfolgen können.

Mehrdimensionale Multi-Omics-Daten

Haghverdi hat zudem eine weitere mathematische Methode angepasst, um Daten aus verschiedenen Datensätzen zu integrieren: die Methode des „gemeinsamen nächsten Nachbars“. Dabei werden Zelltypen abhängig von ihrer Gruppenbildung identifiziert. Muskelzellen befinden sich höchstwahrscheinlich in der Nähe anderer Muskelzellen und Gehirnzellen bilden Gruppen mit anderen Gehirnzellen. Haghverdi reiht anschließend mehrere Datenschichten auf parallelen Hyperebenen auf. Übereinstimmende Teile liegen hier übereinander aufgereiht. So sind Benutzer in der Lage, Datensätze aus mehreren Experimenten zu einem kalibrierten Satz zusammenzufassen. Sie können zudem einen Datensatz mit vorgekennzeichneten Zelltypen verwenden, um Kennzeichnungen auf einen neuen Datensatz zu übertragen.

Nachdem Haghverdi und ihre Kolleg*innen ein R-Programmpaket für den gemeinsamen nächsten Nachbarn veröffentlicht hatten, wurde dies schnell von anderen Labors aufgegriffen und erweitert. „Das ist wirklich ermutigend. Man hat das Gefühl, dass man etwas Nützliches auf dem Gebiet beitragen kann“, sagt Haghverdi.

Sie will das Konzept erweitern, um verschiedene Arten von Daten zu kombinieren, die möglicherweise nicht unmittelbar miteinander korrelieren, wie Transkriptomik, Mutationen und Metabolomik, und damit ermöglichen, dass sie gemeinsam analysiert werden können. Dies ist ein wichtiger Teil ihrer Arbeit im neuen Junior-Konsortium des Bundesministeriums für Forschung und Bildung (BMBF ). Die Kooperationspartner*innen hatte Haghverdi als Postdoktorandin am Europäischen Laboratorium für Molekularbiologie (EMBL) in Heidelberg kennen gelernt. Das Konsortium, dem das BIH /Charité in Berlin, das Centre for Genomic Regulation in Barcelona und das Universitätsklinikum Heidelberg angehören, untersucht Leukämie-Stammzellen mithilfe von Multi-Omics-Daten. Um diese Erkrankung besser zu verstehen, „möchten wir das Problem lösen, wie alle diese Daten zusammen interpretiert werden können“, sagt Haghverdi.

Erste Liebe: Physik

In der Physik geht es darum, die Theorie mit der Praxis zu verbinden.
Laleh Haghverdi
Dr. Laleh Haghverdi Neue Leiterin der Arbeitsgruppe "Berechnungsmethoden und Omic Analytik"

Haghverdi wuchs in der iranischen Großstadt Karadsch rund 40 Kilometer außerhalb von Teheran auf und besuchte ein Gymnasium mit den Schwerpunkten Wissenschaft und Technik. Die Schüler*innen mussten eine Aufnahmeprüfung ablegen und die Gebühren waren je nach Zahlungsfähigkeit gestaffelt. Ihr machten alle naturwissenschaftlichen Fächer Spaß, aber die Physik war ihr absoluter Favorit. „In der Physik geht es darum, die Theorie mit der Praxis zu verbinden“, sagt sie. „Man versucht, für die Dinge, die man um sich herum sieht, ein grundlegendes Verständnis zu entwickeln. Normalerweise hängt das mit der Mathematik zusammen. Genau das versuche ich gerade auch.“

Nach dem Bachelor-Studium im Iran beschloss Haghverdi, nach Europa zu gehen und dort ihre berufliche Laufbahn in der Forschung starten. Für ihren Master studierte sie an der Universität zu Köln Physik. Aber schon damals entschied sie sich für die Analyse von Populationsgenetik, weil sie mehr über die Evolution wissen wollte. Seitdem weiß sie, wie sehr sich Mathematik und Biologie gegenseitig befruchten können. „Ich glaube, es gibt viele Möglichkeiten für ein Zusammenwirken beider Disziplinen“, sagt sie. „Aus diesem Austausch können neue Ideen sehr effizient aufgebaut werden.“

Autorin: Laura Petersen

Weiterführende Informationen

Einzelzellforschung am MDC