Dr. Altuna Akalin

Neues Lehrbuch für computergestützte Genomik

„Computergestützte Genomik mit R“ heißt das neue Lehrbuch von MDC-Forscher Altuna Akalin. Der Bioinformatiker liefert darin nicht nur eine Einführung in die Genomik. Biolog*innen erfahren darin auch Schritt für Schritt, wie sie ihre eigenen Datensätze analysieren können.

Ob Anfänger*innen oder fortgeschrittene Nutzer*innen von R, einer der führenden Programmiersprachen zur Analyse großer Datensätze, die bei verschiedenen Arten von Gensequenzierung entstehen – „Computergestützte Genomik mit R“ bietet jedem etwas. Das Buch ist zugänglich und praxisorientiert, unabhängig vom wissenschaftlichen Hintergrund seiner Leserschaft.

Cover-Darstellung von "Computational Genomics With R" (Chapman & Hall/CRC Computational Biology)

„Für uns war sehr wichtig, dass Leser*innen mit der Analyse eigener Daten so früh wie möglich beginnen können“, sagt Autor Dr. Altuna Akalin, der Leiter der Plattform für Bioinformatik und Omik-Datenwissenschaft am Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) ist. „Wir stellen Beispielcode zur Verfügung. Er erlaubt, sofort loszulegen und dann zu erweitern.“

Das Buch erscheint am 29. Dezember bei Chapman & Hall/CRC. Es beginnt mit einer Übersicht zu Genomik, Genregulation und Hochdurchsatz-Sequenzierung, was vor allem für Programmierer*innen ohne Hintergrund in Biologie nützlich sein dürfte. Der Rest des Buchs deckt Grundlegendes dazu ab, wie man verschiedene Arten Sequenzierungsdaten mit Hilfe von R analysiert, von der Darstellung der Daten in wissenschaftlichen Grafiken bis zu komplexeren Analysen, die mehrere Datenarten und unüberwachte Algorithmen integrieren. Je nach Erfahrungsgrad kann man entweder das gesamte Buch durcharbeiten oder zu einer bestimmten Art der Analyse springen und den dortigen Angaben folgen.

Ein interdisziplinäres Feld

Wir müssen mehr Wissenschaftler*innen ausbilden, die diese Art der Analyse beherrschen.
Dr. Altuna Akalin
Altuna Akalin Leiter der Technologie-Plattform "Bioinformatics and Omics Data Science"

Computergestützte Genomik ist ein höchst interdisziplinäres Feld, das Forschende aus Physik und Mathematik ebenso anzieht wie aus Biologie und Medizin. Dank jahrelanger Lehrerfahrung weiß Akalin, wo bei welchem Teil seines Publikums jeweils die Wissenslücken liegen. Er hat bereits dazu geschrieben – soviel, dass es ein ganzes Buch für seine Studierenden und Arbeitsgruppenmitglieder am Berliner Institut für Medizinische Systembiologie (BIMSB) des MDC füllen konnte. So war er gut gerüstet, als ihn der Verlag mit dem Lehrbuch beauftragte. Während der letzten zwei Jahre hat er das Manuskript überarbeitet, sichergestellt, dass Erklärungen so verständlich wie möglich sind und der gesamte Code auf dem neuesten Stand ist. Mitglieder seiner Arbeitsgruppe, Vedran Franke, Bora Uyar und Jonathan Ronen, haben drei neue Kapitel beigesteuert.

Seit fast zwei Jahrzehnten entwickelt Akalin computergestützte Methoden zur Analyse und Integration umfangreicher Genomikdaten. Sequenzierungsdaten werden immer umfangreicher und komplexer, sagt er. Computergestützte Herangehensweisen mache das zunehmend unvermeidbar. Er findet jedoch, dass zu wenige Forschende wissen, wie man sie nutzt. „Wir müssen mehr Wissenschaftler*innen ausbilden, die diese Art der Analyse beherrschen“, sagt Akalin. „Das Lehrbuch kann helfen, die Lücken zu schließen und Forschende auszubilden.“

Text: Laura Petersen

 

Weiterführende Informationen