Wie KI die Wissenschaft verändert

Wenn die Maschine mitforscht

4. Juni 2024 von Sebastian Deiber
Revolutioniert künstliche Intelligenz die Wissenschaft? Vom Universum im Supercomputer zu alten Reiseberichten aus dem Orient: Vier Forscher*innen der Uni Wien berichten, wie sie KI einsetzen und wo derzeit noch die Grenzen liegen.
In der Wissenschaft ist KI in Form von Machine Learning zwar nichts Neues, doch die Methode entwickelt sich rasant. Auch Chatbots und Bildgeneratoren (hier ein Bild, das wir mit der KI Adobe Firefly erstellt haben) werden ihre Arbeit verändern, sind sich unsere Forscher*innen einig. © Sebastian Deiber via Adobe Firefly

Es war ein KI-System, das Anfang der 2020er für Jubelstürme in der Wissenschaft sorgte. Das Unternehmen DeepMind lancierte eine neue Version der Deep Learning-Software AlphaFold, die mit bisher unerreichter Genauigkeit die Form von Proteinen vorhersagt: Das Programm hat gelernt, aus der Abfolge von Aminosäuren – das sind die Bausteine von Proteinen – abzuleiten, wie sie miteinander wechselwirken und sich zur komplexen dreidimensionalen Struktur des Proteins falten.

Durchbruch in Medizin und Biologie

Für Grundlagenforschung und Medizin ist diese Fähigkeit Gold wert. Kennt man nämlich die Struktur eines Proteins, ist das ein erster Schritt, seine Funktion in der Zelle zu verstehen. AlphaFold gibt Forscher*innen einen Wissensvorsprung, etwa bei der Entwicklung von Designer-Proteinen für Impfstoffe oder Krebstherapien. Anstatt alle möglichen Proteinvarianten im Labor auszuprobieren, filtert die Software die besten Kandidaten heraus, die dann getestet werden. Eine weitere mögliche Anwendung: die KI kann vorhersagen, wie sich genetische Mutationen auf ein Protein auswirken – ein Schlüssel zum Verständnis von Krankheiten wie Alzheimer.

Trainiert wurde AlphaFold mit hunderttausenden bereits bekannten Proteinstrukturen, die Biochemiker*innen in jahrzehntelanger Arbeit entschlüsselt haben. Mittels KI ist es nun möglich, aus dieser Unmenge an Informationen Regeln abzuleiten, um präzise Vorhersagen zu treffen.

Dieses Leuchtturmprojekt zeigt, wie Forscher*innen mithilfe von KI neue Hypothesen aufstellen und Methoden verbessern. Überall dort, wo der technische Fortschritt in der Wissenschaft große Datens(ch)ätze angehäuft hat, nährt KI Hoffnungen auf Durchbrüche in hinreichend kurzer Zeit. Was kann die Technologie derzeit für die Forschung leisten? Und wohin geht die Reise?

"Die" KI gibt es nicht

"Künstlicher Intelligenz" ist keine klar abgrenzbare Technologie. Auch wenn in diesem Beitrag der Überbegriff verwendet wird, sind je nach Beispiel unterschiedliche Systeme gemeint. Datenanalyse-Methoden stützen sich auf Machine Learning. Das ist ein Forschungsbereich, aus dem Begriffe wie Deep Learning und künstliche neuronale Netze hervorgingen. Chatbots hingegen basieren auf sogenannten großen Sprachmodellen (Large Language Models). Mehr KI-Wissen

KI in den Naturwissenschaften: Vom Innenleben der Zelle…

Antworten auf diese Fragen kann man an der Uni Wien finden, wo Wissenschafter*innen das Potenzial von KI bereits in den verschiedensten Disziplinen nutzen. Einer von ihnen ist Jonas Ries, Leiter der Forschungsgruppe Superresolution Microscopy for Structural Cell Biology an den Max Perutz Labs – benannt nach dem Nobelpreisträger Max Perutz, der als erster die Proteinstruktur des Blutfarbstoffs Hämoglobin aufklärte.

Auch Ries und sein Team wollen die Geheimnisse der Zellbiologie lüften und entwickeln dafür innovative Mikroskopieverfahren, die sie mit Machine Learning kombinieren: "Diese Technologien erlauben es uns, Zellen in Nanometer-Auflösung zu sehen und Proteine sozusagen bei der Arbeit zu beobachten", schwärmt der Biophysiker.

Als erstes wollen die Forscher*innen den Ablauf der Endozytose entschlüsseln: Das ist der Prozess, bei dem die Zelle Stoffe von außen aufnimmt, indem sie diese in Mulden auf der Zelloberfläche sammelt, in kleine Bläschen packt und ins Zellinnere transportiert. Dabei treten unzählige Proteine in Aktion. Ein wichtiger biologischer Vorgang, über den neben Nährstoffen etwa auch Medikamente oder Viren in die Zelle gelangen können. Um ihn besser zu verstehen, möchten Ries und sein Team die Endozytose-Proteine "in flagranti" erwischen und in der lebenden Zelle beobachten.

Das Ziel dabei ist, aus hunderttausenden hochauflösenden Mikroskopie-Bildern einen Film zu erstellen, der die Endozytose möglichst detailreich zeigt. "Dank Machine Learning können wir nun zehnmal mehr Bilder pro Sekunde aufnehmen als vorher." So kann die Forschungsgruppe das Geschehen in der Zelle mit bislang unerreichter Genauigkeit dokumentieren. "Ohne die KI wäre die erforderliche Datenmenge nicht zu verarbeiten", erklärt Ries.

Mehr über die Forschung von Jonas Ries

Wissen wir, was KI wissen wird? Jonas Ries spricht im Video über die Zukunft der Künstlichen Intelligenz in der Wissenschaft. Zwar werde Maschinenintelligenz schon seit Jahren für die Datenanalyse verwendet, doch neue Vorhersage- und Sprachmodelle könnten die Forschungswelt umkrempeln, so der Biophysiker. © Petra Schiefer

… zum Universum in der Computersimulation

Am Beispiel der modernen Mikroskopie wird deutlich: Wo früher ein Mangel an Daten das Problem war, ist es heute oft ein Überfluss. KI weckt die Hoffnung, Datenberge schneller zu verarbeiten, um aussagekräftige Muster darin zu finden.

Geradezu astronomische Mengen an Daten liefert das Weltraumteleskop Euclid. Seit 2023 beobachtet es mehr als 30 Millionen Objekte in Entfernungen von mehr als zehn Milliarden Lichtjahren. Was kann man aus diesen Bildern über die Naturgesetze lernen, die die Entstehung des Kosmos bestimmen? Oliver Hahn von der Forschungsgruppe Data Science in Astrophysics & Cosmology an der Uni Wien geht dieser Frage mithilfe von Simulationen im Supercomputer auf den Grund. Zusammen mit seinem Team will er das Universum modellieren: von der Entstehung der ersten Dichtefluktuationen nach dem Urknall bis zur heutigen Verteilung der Galaxien.

Die Astrophysiker*innen vergleichen diese Simulationen dann mit Beobachtungen aus dem Weltraum: Sagt der Computer die tatsächliche Verteilung der Materie im Universum voraus? Oder ist das theoretische Modell unvollständig und es gibt noch unbekannte physikalische Prozesse? Möglicherweise sind sie die fehlenden Puzzleteile um zu verstehen, was nach dem Urknall geschah und wie sich Galaxien und Galaxienhaufen formten.

Hier kommt wieder KI ins Spiel: "Unsere Simulationen sind langwierig und kostspielig", erklärt der Physiker: "Machine Learning kann die zugrundeliegenden mathematischen Modelle vereinfachen." Das funktioniert so: "Die KI gibt ein Ersatzmodell aus, mit dem die Berechnungen schneller laufen, ohne stark an Qualität einzubüßen. Oder man kann einzelne Simulationsschritte einsparen. Oft gibt man dadurch zwar ein bisschen Genauigkeit auf, kommt dafür aber schneller ins Ziel."

Mehr über die Forschung von Oliver Hahn

Die großräumige Struktur des Kosmos spiegelt die grundlegenden Gesetze der Astrophysik wider. Kosmolog*innen versuchen, diese zu verstehen. In einer neuen Publikation im Fachjournal Physical Review Letters beschreiben Oliver Hahn und seine Kollegen einen neuen, verbesserten mathematischen Ansatz für schnelle und konsistente Simulationen des Universums.

Das Universum im Supercomputer nachbauen: Auch hier kommt KI zum Zug. "Machine Learning wird in meiner Forschung immer wichtiger, wenn auch in kleinen Schritten", sagt der Astrophysiker, "nicht nur, um Simulationen zu beschleunigen, sondern auch, um interessante und neue Muster in Beobachtungsdaten zu entdecken." Erfahren Sie mehr über Oliver Hahns Forschung im Video. © Magdalena Reichinger

Knackpunkt KI-Training

Während es Jonas Ries und Oliver Hahn also mit Unmengen an Daten zu tun haben, denen sie mit Hilfe von KI zu Leibe rücken, fehlt es in anderen Bereichen wie der Medizin an genügend Trainingsdaten in hoher Qualität. Die brauche es aber, damit Vorhersagen mit Machine Learning gelingen können, erläutert Claudia Plant, Professorin für Data Mining an der Fakultät für Informatik. "Insbesondere gefragt sind solche Daten, die den nötigen Wissenskontext mitliefern."

Ein Beispiel: Eine KI soll auf Basis von Internetbildern Hunde- von Katzenfotos unterscheiden. Fürs Training muss jedes Foto mit dem Label "Hund" bzw. "Katze" versehen sein. Dieses "Wissen" verknüpft die KI mit den entsprechenden hunde- oder katzentypischen Mustern in den Bilddaten.

In der Medizin könnte man auf die subtilen Unterschiede zwischen Bildern von gesundem und krankem Gewebe trainieren. Wegen der DSGVO sind gelabelte Daten von Patient*innen aber schwer zu bekommen. "Sie wären aber wichtig, wenn KI anhand von Gehirnscans zwischen Alzheimer oder kein Alzheimer unterscheiden soll. In anderen Fällen wiederum gibt es zu wenig Daten, weil die betreffende Krankheit zu selten ist", erläutert die Informatikern, die Machine Learning-Methoden für effizientere Therapien gegen Depression entwickelt.

Lesen Sie das ausführliche Interview mit Claudia Plant
Data Mining und Machine Learning
Warum Künstliche Intelligenz gar nicht so intelligent ist, die meisten Daten ungenutzt herum liegen und wie man bei all diesen rasanten Entwicklungen am Ball bleibt, darüber spricht die Datenexpertin Claudia Plant im Interview mit Rudolphina.

KI als Blackbox

Eine weitere Problematik: Viele KI-Anwendungen sind intransparent. Wie und warum sie zu einem Ergebnis gekommen sind, verraten sie nicht. Gerade in der Medizin kann es dann heikel werden. So kam es bereits zu falschen Klassifizierungen von Röntgenbildern der Lunge bei dem Versuch, eine Covid-Infektion mit Machine Learning nachzuweisen. Das Modell hatte minimale Unterschiede im Bildhintergrund gelernt anstelle klinisch relevanter Merkmale des Gewebes. Damit war es medizinisch nutzlos. Sofern sich KI bei den wichtigen Merkmalen der Interpretier- und Erklärbarkeit nicht verbessert, bleibt ihr Nutzen dort eingeschränkt, wo viel auf dem Spiel steht.

Dass KI eine "Blackbox" sein kann, sei aber nicht immer ein Problem, meint der Physiker Oliver Hahn: "Es kommt auf mein Ziel an. Wenn die KI ein Modell findet, das meine Berechnungen beschleunigt, kann ich damit leben. Wenn sie mir aber eine Vorhersage für eine konkrete physikalische Fragestellung gibt, ist es wichtig zu verstehen, wie sie darauf gekommen ist."

Auch wenn es mehr und mehr Lösungsansätze für "Explainable AI" geben wird: Kein*e Forscher*in wird sich je blind auf KI verlassen können. "Wissenschafter*innen sind darauf trainiert, ihren Daten nicht sofort zu vertrauen", gibt Jonas Ries zu bedenken. Für den Biophysiker vom Department für Strukturbiologie und Computational Biology der Uni Wien ändert sich daran auch mit KI nichts: "In der Molekularbiologie gibt es immer eine Blackbox. Jedes Experiment hat unbekannte Parameter." Gerade bei KI-Ergebnissen müsse man genau hinschauen. "Aber vielleicht macht das irgendwann eine andere KI", schmunzelt Ries.

Stärken und Schwächen der Technologie hängen also von der wissenschaftlichen Fragestellung ab. Dabei werden die Forschungsfelder, für die ein KI-Einsatz infrage kommt, immer mehr. Die Digitalisierung eröffnet neue Möglichkeiten auch dort, wo man eher weniger an große Datensätze denkt.

Eventtipps

Strg-F für alte Texte

Zum Beispiel in der Österreichischen Nationalbibliothek. Die teils KI-gestützte Digitalisierung von bereits mehr als 3,5 Millionen Objekten verwandelt das gewaltige Wissensarchiv nach und nach in Bits und Bytes. Was früher dem Blick der Menschen vorbehalten war, wird jetzt eine für Computer lesbare Datenressource.

Diese machen sich die Digital Humanities zunutze. Das Forschungsgebiet zwischen Geistes- und Computerwissenschaften ist das Metier von Michela Vignoli, Doktorandin an der Historisch-Kulturwissenschaftlichen Fakultät der Uni Wien. In ihrem Projekt entwickelt sie KI-Methoden für die Auswertung großer Textsammlungen, sogenannter Korpora. "Ich forsche an der Schnittstelle zwischen traditioneller Geschichtswissenschaft und Data Science", erklärt die Historikerin. Im Fokus stehen Erfahrungsberichte von Reisenden ins Osmanische Reich aus den Jahren 1501-1850.

Die Texte zeigen, wie westeuropäische Gelehrte die ansässige Bevölkerung und Naturlandschaft wahrnahmen. "Es geht um Darstellungen von Land und Leuten auf Pilgerfahrten oder diplomatischen Reisen. Wir untersuchen, wie sich diese im Lauf der Zeit veränderten", berichtet Vignoli. Sie entwickelt ein Deep Learning-Modell, das Abbildungen und Textstellen automatisch nach bestimmten Naturdarstellungen durchsuchbar macht – vergleichbar mit der Suchfunktion in einem digitalen Dokument.

Mehr über die Forschung von Michela Vignoli

"Doctor it!" ist der Podcast der PhD-Kandidat*innen in den Geistes- und Sozialwissenschaften an der Uni Wien. In Episode 13 sprechen Michela Vignoli und Marvin Stecker vom Computational Communication Lab über Ihre Forschung und KI in den Sozial- und Geisteswissenschaften (Podcast in englischer Sprache).

Videoempfehlung: Michela Vignoli - Impact of AI: Gamechanger for Image Classification in Historical Research?

Gamechanger KI?

Für die historische Forschung ist das ein mächtiges Tool, das neue Perspektiven ermöglicht. "Bisher lag der Forschungsfokus stark auf dem Text. Computergestützte Bildanalyse im großen Stil einbeziehen zu können, bringt die Geschichtswissenschaft weiter", so die Historikerin. Dass die traditionelle Forschung am Text durch die zunehmende Automatisierung ausgedient hat, denkt sie aber nicht: "Die digitalen Methoden sind mehr als Ergänzung zu sehen und nützlich bei großen Datenpools. Es ist aber sehr wichtig, die Quellen unter verschiedenen Gesichtspunkten kritisch zu interpretieren." KI-Automatisierung könne das noch nicht bieten.

Auch die Naturwissenschaften hat die KI noch nicht grundlegend verändert. "Ich sehe derzeit mehr einen schrittweisen Wandel als eine plötzliche Revolution", findet Oliver Hahn. Ins selbe Horn stößt Jonas Ries: "KI macht unsere Methode zwar schneller und effizienter, aber deswegen entdecken wir noch keine komplett neuen Prozesse oder Proteine."

Für manche Arbeitsschritte werde KI aber einen großen Unterschied machen. "Ein Chatbot mit Zugriff auf die wissenschaftliche Literatur, der die Recherche und das Zusammenfassen erleichtert, vielleicht sogar neue Fragestellungen sichtbar macht, wäre ein Traum für jede*n Forscher*in", erklärt Oliver Hahn. Bis dahin sei es nur eine Frage der Zeit. Schon heute erleichtern KI-Assistenten das Schreiben von Forschungsanträgen und Papers. Auch das Programmieren von neuen Algorithmen werde immer zugänglicher, sind sich die beiden Forscher einig.

Sorge vor KI-Fakes in der Wissenschaft

Auch die Wissenschaft ist vor den Schattenseiten generativer KI nicht gefeit. Unbedachte und intransparente Chatbot-Nutzung könnte die Qualität wissenschaftlicher Aufsätze beeinträchtigen. Schlimmstenfalls werden Chatbots missbraucht, um Fake-Daten und -Forschungsartikel zu erzeugen. Immer bessere Bildgeneratoren verschlimmern das Problem mit gefälschten Fotos und Abbildungen, besonders in der Biologie und Medizin. Wasserzeichen und Detektor-Systeme könnten Abhilfe schaffen. Letztlich müsse man aber das Reproduzieren von wichtigen Resultaten stärker fördern, um Betrug aufzudecken, sagt Bernd Pulverer vom Journal EMBO Reports zu nature.com.

KI-Kompetenz früh vermitteln

Text- und Bildgeneratoren wie ChatGPT und Midjourney könnten allerdings die Glaubwürdigkeit der Wissenschaft untergraben (siehe Infobox), wenn sie für Daten-Fakes missbraucht werden. Auch vor einer sogenannten "Reproduzierbarkeitskrise" wird gewarnt, wenn Forscher*innen Machine Learning nutzen, ohne sich seiner Tücken bewusst zu sein. Die Historikerin Michela Vignoli ist aber optimistisch, dass ein sinnvoller Einsatz von KI möglich ist: "Ich denke, dass sich ein Umgang mit KI-Tools etablieren wird, der mit wissenschaftlichen Standards vereinbar ist. Diese Kompetenz sollte bereits im Studium geschult werden."

Außerdem sollte früh vermittelt werden, wie wertvoll interdisziplinäre Zusammenarbeit gerade bei KI-gestützten Projekten ist, meint die Informatikerin Claudia Plant. "Es ist wichtig, zu verstehen, was die Möglichkeiten und Stolpersteine der Technologie in meinem Projekt sind. Wenn Forscher*innen eng mit KI-Expert*innen und Datenwissenschafter*innen zusammenarbeiten, ist ein Prozess in der Forschung möglich, der den Fortschritt beschleunigt. AlphaFold ist ein gutes Beispiel dafür."

Wo ist die Grenze des Möglichen? Wird die KI eines Tages über die Rolle des Prozessbeschleunigers hinauswachsen und eigenständig neue Konzepte entwickeln? "Wir beginnen erst zu verstehen, was möglich sein wird", sagt Oliver Hahn, "aber im Moment ist KI ein Werkzeug und keine aktive Kraft." Auch wenn so manche KI bereits autonom experimentiert – ohne den kritisch denkenden Menschen, der plant, priorisiert und interpretiert, werde sie so bald nicht auskommen, so die Uni Wien-Expert*innen: Die Fragen stellen am Ende die Wissenschafter*innen.

In Zukunft werden Interpretation und Strukturierung von Beobachtungsdaten sowie die Entdeckung von interessanten Mustern in Datensätzen immer mehr an KI gehen.
Oliver Hahn
© Magdalena Reichinger
© Magdalena Reichinger
Oliver Hahn ist Professor für Data Science in der Astrophysik an der Fakultät für Geowissenschaften, Geographie und Astronomie und der Fakultät für Mathematik der Universität Wien. Sein Forschungsschwerpunkt ist die numerische Simulation der Strukturbildung im Universum.
Immer, wenn man sehr viele Möglichkeiten ausprobieren muss in kurzer Zeit, dann kann der Computer das viel besser als der Mensch. KI beschleunigt jetzt schon die Life Sciences.
Claudia Plant
© Barbara Mair
© Barbara Mair
Claudia Plant ist Professorin für Data Mining und Leiterin der Forschungsgruppe Data Mining und Machine Learning an der Fakultät für Informatik. Zu ihren Forschungsschwerpunkten zählen u.a. parameterfreies Data Mining auf informationstheoretischer Basis, integratives Data Mining von heterogenen Datenbeständen und anwendungsorientiertes Data Mining in der Biomedizin, in den Neurowissenschaften und den Umweltwissenschaften.
KI ist schon jetzt gut darin, Programme zu schreiben. Vielleicht wird sie bald die Datenanalyse-Software für uns erstellen oder neue Algorithmen entwickeln.
Jonas Ries
© Max Kropitz / Max Perutz Labs
© Max Kropitz / Max Perutz Labs
Jonas Ries ist seit 2023 Professor für Advanced Microscopy an den Max Perutz Labs der Uni Wien und der Meduni Wien. Sein Team ist spezialisiert auf die Entwicklung neuer hochauflösender Mikroskopieverfahren, die die Struktur und die Dynamik molekularer Maschinen in lebenden Zellen in Nanometer-Auflösung sichtbar zu machen.
KI wird auch die Geschichtswissenschaften weiterbringen. Schon jetzt erleichtert sie die kombinierte Analyse von Text und Bild.
Michela Vignoli
© Christian Lendl
© Christian Lendl
Michela Vignoli ist Doktorandin an der Historisch-Kulturwissenschaftlichen Fakultät der Uni Wien und Data Scientist am Austrian Institute of Technology (AIT). Sie forscht an einem interdisziplinären methodischen Konzept für die KI-gestützte Analyse von Text-Bild-Beziehungen in digitalisierten historischen Datensammlungen.