Mit statistischen Methoden den Krankheitsverlauf vorhersehen

Von den synthetischen Daten in die klinische Realität

Marx hat mit diesen Methoden und mit Unterstützung von künstlicher Intelligenz unter anderem anhand von simulierten Daten untersucht, wie die Aktivitäten von etwa 500 selektierten Genen in einer menschlichen Zelle zusammenhängen. Im Idealfall kann man diese Verfahren in Zukunft so skalieren, sodass sie alle rund 25'000 Gene einer Zelle miteinbeziehen können.
Derartige Computer-​Analysen von Gennetzwerken würden der biologischen und der medizinischen Forschung einfach und schnell ein umfassendes Verständnis der Vorgänge in einer Zelle eröffnen. Um das Gleiche mit Laborexperimenten zu erreichen, wäre ein enormer Aufwand nötig. Es müsste nämlich jedes Gen einzeln mit gentechnologischen Werkzeugen abgeschaltet und dann die Auswirkungen auf die Aktivität aller anderen Gene gemessen werden.

“Wir stossen mit unserem Projekt in Bereiche vor, die wir mit den zur Verfügung stehenden Methoden bisher noch nicht beherrschen.„
Alexander Marx

Für die Projekte, die Marx am AI Center in Angriff nimmt, muss er die Causal-​Discovery-Methoden auf ein neues Komplexitätsniveau heben. Anstelle von vollständigen Beobachtungsdatensätzen oder synthetischen Daten, wie bei der Genexpression, arbeitet er jetzt mit echten Daten aus der klinischen Praxis. Das macht die Aufgabenstellung markant schwieriger, wie der Informatiker schon bald festgestellt hat: «In der Realität fehlen häufig einzelne Informationen, Messwerte oder ganze Datensätze und die Erhebung unterscheidet sich auch immer von Spital zu Spital und manchmal sogar von Arzt zu Arzt.»

Nicht-​relevante Korrelationen eliminieren

Die klinischen Daten, die Marx für sein Vorhersagemodell in Zusammenarbeit mit Ärztinnen und Ärzten des Universitäts-​Kinderspital beider Basel (UKBB) auswertet, enthalten unter anderem Zeitreihen der Pulsfrequenz und des Blutzuckerspiegels sowie Informationen zu physischen Aktivitäten, zur Kalorienaufnahme, zu Insulininjektionen und zur Schlafqualität. In einem ersten Schritt geht es nun darum, die Daten zu filtern und allfällige Korrelationen, die nicht mit der Fragestellung zusammenhängen, aus dem Modell auszuschliessen.
Um künftig robuste und für einen behandelnden Arzt auch nachvollziehbare Prognosen abgeben zu können, muss die Anzahl der Faktoren nämlich möglichst tiefgehalten werden. So oder so lässt sich heute noch nicht vorhersagen, ob das Modell in der Praxis erfolgreich sein wird: «Wir stossen mit unserem Projekt in Bereiche vor, die wir mit den zur Verfügung stehenden Methoden bisher noch nicht beherrschen.»

Autor(in) Daniel Meierhans, ETH-News



Das könnte Sie auch interessieren