Entmystifizierung von Algorithmen
Kontaktieren Sie uns

In letzter Zeit gab es viel Hype und Hoffnung rund um Algorithmen. Aber was können sie wirklich und was nicht? Wie funktionieren sie? Können sie wie Menschen fühlen? Kasia Barczewska, Leiterin des Bereichs Forschung & Entwicklung bei Cardiomatics, nimmt uns mit auf eine aufschlussreiche Reise durch künstliche Intelligenz, Algorithmen und maschinelles Lernen.

Wie erklärt man einem Kind, was ein Algorithmus und was KI ist?

Ein Algorithmus ist eine Art Rezept, das beschreibt, wie man ein Problem löst oder ein Ziel erreicht. Entscheidend ist das Ziel – was wollen wir genau machen. Wenn wir einen Kuchen backen, ist ein Kuchenrezept ein Algorithmus, der definiert, wie dies zu tun ist, angefangen von der Liste mit den Zutaten, die wir dafür haben müssen, über die Temperatur des Ofens bis hin zur Backzeit. Wenn wir dem Algorithmus folgen, erhalten wir als Ergebnis einen gebackenen Kuchen. Wenn wir eine Burg aus Klötzchen bauen wollen, dann stellt die Anleitung dazu, wie das geht, auch einen Algorithmus dar, der uns dieses Ziel erreichen lässt und dabei sicherstellt, dass wir das gleiche Gebäude erstellen, das auf der Abbildung auf der Schachtel mit den Klötzchen dargestellt ist.

Was ist KI? Ein geläufiger Begriff auf sehr hohem Abstraktionsniveau. Er bezieht sich auf die Fähigkeit von Computern zu lernen, zu verallgemeinern, Wissen in der Praxis anzuwenden und Entscheidungen zu treffen. Hinter diesem populären Begriff verstecken sich allerdings lediglich Statistiken und mathematische Modelle. Wie kann man das einem Kind erklären? Ich würde sagen: „KI ist die Art und Weise, wie mein Laptop Dinge lernen kann, wie Du sie tust, mein liebes Kind. Er lernt jedoch viel langsamer und braucht viel mehr Beispiele als Du.“

Wie sieht der Prozess der Erstellung eines Algorithmus aus?

Sie fragen also nach dem Algorithmus eines Algorithmus. Im Grunde ist das ein sehr kreativer Prozess, bei dem ein Algorithmus-Designer in gewissem Sinne das Kind ist, das mit all den Klötzchen der Welt dasitzt und dabei versucht herauszufinden, wie man ein Schloss baut. Der Designer muss entscheiden, welche Klötzchen verwendet, und welche Schritte unternommen werden sollen, um dieses Gebäude zu erstellen. Das Ergebnis ihrer oder seiner Arbeit ist schließlich sowohl ein wunderschönes Schloss als auch ein Buch mit Anleitungen für andere Menschen, die es auf die gleiche Weise bauen möchten.

Als ein weiteres Beispiel kann ein japanischer Origami-Meister dienen, der sich fragt, wie er denn aus einem quadratischen Stück Karton einen Kranich machen könnte. Der Effekt seiner Bemühungen ist eine Anleitung für andere Origami-Bastler, die den Karton auf die gleiche Weise falten können.

Im Allgemeinen gibt es einige Schritte, die in diesem Prozess enorm wichtig sind. Der Algorithmus-Designer muss:

  • das Ziel festlegen. Zum Beispiel „Ich möchte eine Burg bauen/einen Kuchen backen“, „Ich möchte einen Kran bauen“, „Ich möchte Vorhofflimmern erkennen.“
  • den Satz von Annahmen/Instrumenten definieren, die verwendet werden können: „Ich habe 200 Klötzchen mit bestimmten Formen und Farben/Eier, Mehl und Äpfel“, „Ich habe ein quadratisches Stück Karton“, „Ich habe eine Datenbank mit 24-Stunden-Aufzeichnungen von 100 Patienten.“
  • genau definieren, was das Ergebnis des Algorithmus sein soll: „Ich werde das Wandelnde Schloss aus Klötzchen bauen/Ich werde einen Apfelkuchen backen“, „Ich werde einen Origami-Kranich machen“, „Das Ergebnis wäre 0 oder 1, je nachdem, ob in einem 24-Stunden-EKG-Signal Vorhofflimmern erkannt wurde oder nicht.
  • recherchieren: Wie machen das andere?
  • die Schritte auflisten, die zum Erreichen des Ziels unternommen werden sollten. Zum Beispiel: das Rezept aufschreiben; Pseudocode notieren, wie das Signal ablaufen wird; welche Modelle verwendet werden; welche Methoden des maschinellen Lernens zum Einsatz kommen, um den Modellen die richtigen Statistiken beizubringen; welche Metriken im Bewertungsprozess angewendet werden.
  • bestimmen, wie diese Schritte auszuführen sind. „Ich werde mein Schloss in meinem Zimmer bauen, dabei Musik hören/wo ist das Backblech?“, „Ich werde das Papier mit der Hand falten“, „Ich werde Code in Python schreiben, Modelle auf einer GPU trainieren und das beste Modell in einer hdf5-Datei abspeichern.“
  • den gesamten Prozess bewerten/überprüfen. „Oje, das Schloss ist eingestürzt“, „Ich muss den Entwurf ändern“, „Ich habe vergessen, Zucker hinzuzugeben!“ „Das ist ein Kranich, der wie ein Pinguin aussieht.“
  • das Modell mit neuen Daten testen und die Bewertungsmetriken berechnen. Er oder sie analysiert die neuen Parameter und versucht zu verstehen, was sie bedeuten. Anschließend müssen sie mit anderen Modellen bzw. mit modernsten Methoden verglichen werden.

 

Wenn der Algorithmus fertig ist, dann füttern Sie ihn mit Daten. Aber was passiert als nächstes?

Der Computer kann mit dem Lernen beginnen. Computer verarbeiten Datenbytes, um Muster zu finden und statistische Parameter zu erhalten, in denen ihr Wissen gespeichert wird. Ich kann den Lernprozess beobachten, indem ich mir Lernkurven anschaue, mich bei einem Kaffee entspanne und warte, bis er fertig ist. Manchmal ist das Modell fertig, bevor die Kaffeemaschine den Kaffee fertig gemahlen hat. Doch in manchen Fällen sorgen Gigabytes an Daten und komplizierte Lernstrategien dafür, dass der Lernprozess mehrere Tage oder gar Wochen in Anspruch nimmt.

Wenn das Modell fertig ist, muss es anhand von Daten evaluiert werden, die nicht im Trainingsprozess verwendet wurden. Ich muss beurteilen, ob es das tut, wofür es entwickelt wurde. Falls das nicht der Fall ist, muss ich den gesamten Lernprozess überprüfen.

Wissen wir Schritt für Schritt, wie der Algorithmus Schlussfolgerungen zieht oder Daten transformiert?

Ja, das wissen wir. Alles hängt von unseren Entscheidungen ab: von den Daten, die wir zur Einspeisung vorbereitet haben; von dem Modell, das wir gewählt haben; und von der Lernstrategie, für die wir uns zu Beginn des Prozesses entschieden haben. Das Wissen des Computers wird in statistischen Parametern gespeichert, die wir bei jedem Schritt des Lernprozesses visualisieren können. Je einfacher die Algorithmen sind, desto einfacher ist das natürlich. Je ausgefeilter die Algorithmen, desto komplizierter wird die Sache.

Was ist maschinelles Lernen?

Dabei handelt es sich um bewährte Verfahren zum Trainieren von Modellen, um in realen Fällen effektive Vorhersagen treffen zu können. Man kann sich maschinelles Lernen wie eine Reihe von Instrumenten vorstellen, die Ingenieure einem Computer beibringen und mit denen sie seinen Lernprozess evaluieren müssen. Diese Instrumente werden in mehreren Schritten verwendet: Zu Beginn betrifft dies die Vorbereitung des Materials, das beim Lernen verwendet wird, anschließend geht es dann um das Trainieren eines Algorithmus und die Evaluation. Unter den „Vorverarbeitungsinstrumenten“ verfügt ein Ingenieur über Methoden zur Datenexploration, Methoden zur Datenerweiterung, eine Aufteilung von Daten in Trainings- und Testsätze, Auswahlmethoden für das Anzeigen/Hervorheben nur der wesentlichsten Merkmale in den Daten des Algorithmus und zu einer Erleichterung des Lernprozesses. Als nächstes kann sie oder er aus einer Vielzahl von Modellen oder Modellarchitekturen wählen, die den zentralen Teil des Algorithmus bilden. Je nach Modell sollte eine geeignete Lernstrategie gewählt werden: Was soll während des Lernprozesses durch den Algorithmus minimiert oder maximiert werden? Wie schnell sollte ein Algorithmus lernen? Ein Ingenieur kann mehrere verschiedene Modelle verwenden und ihre Ergebnisse anhand von Bewertungsmetriken vergleichen. Die Grundlage all dieser Instrumente bilden Statistik und Mathematik. Sie sind alle in Open-Source-Bibliotheken und Tutorials gespeichert, sodass jeder Ingenieur auf der Welt sie verwenden kann, um sein Modell zu trainieren oder es zu verbessern.

Wenn Maschinen lernen, multiplizieren sie dann die Fehler in den von ihnen verwendeten Daten? 

Algorithmen sind nur so gut wie die Daten, die sie im Lernprozess verwenden. Wenn es systematische Fehler bei der Kennzeichnung der Daten gibt, dann wird sie der Algorithmus lernen und anschließend die gleichen Fehler in der Realität machen. Deshalb ist es gerade in medizinischen Anwendungen unerlässlich, mit vielen Spezialisten die richtigen Kennzeichnungen (Diagnose) zu konsultieren und sich vielfältiges Wissen aus Schulungsunterlagen anzueignen.

Das Problem der Transparenz ist ein Problem mit vielen Abstraktionsebenen. Auf der höheren Ebene können Menschen „KI-Algorithmen“ personifizieren, ohne dabei zu wissen, was sie wirklich sind, obwohl sie doch einfach nur eine Sammlung statistischer und mathematischer Modelle darstellen. Auf der unteren Ebene werden die beliebtesten Algorithmen derzeit einerseits wegen der mangelnden Transparenz kritisiert, die sich aus den Millionen von Parametern ergibt, die sie besitzen; andererseits zieht ihr vollständig datengetriebener Lernansatz Argwohn auf sich, weil er ganz ohne die Anwendung expliziter Regeln oder Gesetze auskommt, wodurch er sich grundlegend von der Herangehensweise der Menschen an das Lernen unterscheidet. Diese Kritik ist gut, weil sie die Forscher dazu zwingt, noch mehr zu erforschen und andere Methoden zu entwickeln.

Kann KI Dinge außerhalb unsere Kontrolle tun, die für Patienten gefährlich sein könnten?

Die KI ist nur ein Werkzeug in Menschenhand. Solange sie in gutem Glauben verwendet wird, kann sie die Arbeit von Medizinern unterstützen. Natürlich besteht auch in gutem Glauben stets die Möglichkeit für menschliche Fehler: zum Beispiel in schlecht aufbereiteten Daten, die einem Algorithmus für sein Training eingespeist werden. Glücklicherweise sehen bewährte Verfahren als abschließenden Punkt der Entwicklung eines Modells/eines Algorithmus eine Evaluation vor, die sehr sorgfältig durchgeführt werden sollte. In diesem Stadium können wir beurteilen, ob unsere Methode so funktioniert, wie sie es sollte – falls dies nicht so ist, dann müssen wir den gesamten Prozess überprüfen.

Wie genau sind Algorithmen? Können sie Dinge vergessen, wie das Menschen mitunter passiert?

Die Rolle des Ingenieurs besteht darin, die Daten genau aufzubereiten und die besten maschinellen Lernwerkzeuge für das modellierte Phänomen auszuwählen. Wenn sie/er im Lernprozess etwas vergisst, sind die im Training verwendeten Daten nicht repräsentativ für die Phänomene und der Algorithmus wird in der Realität nicht gut funktionieren. Er wird nichts vergessen, aber zugleich wird er nicht wissen, dass es andere Verbreitungen desselben Phänomens gibt. Algorithmen modellieren das Wissen nur so, wie es ihnen im Lernprozess vorgeführt wurde.

Was werden Algorithmen niemals können?

Lieben, eine Familie gründen, Freunde treffen, neugierig sein und Hobbies verfolgen, sich entspannen und Kaffee trinken. Aber dank der Algorithmen wird der Mensch eben mehr Zeit für genau diese schönen Dinge haben.

Wie werden Algorithmen die Medizin verändern?

Auf dramatische Weise! Sie werden Ärzten die Möglichkeit geben, auf der Grundlage von automatisch verarbeiteten Daten aus verschiedenen Untersuchungen eine ganzheitliche Diagnose zu stellen. Sie werden Zusammenhänge zwischen Patientendaten entdecken und die Aufmerksamkeit der behandelnden Ärzte auf diese lenken. Sie werden die Zeit zwischen Untersuchung und Diagnose verkürzen. Sie werden dem Arzt mehr Zeit für das Gespräch mit dem Patienten und für die Erstellung des Behandlungskonzepts verschaffen. Sie werden die Wartezeiten für Termine bei Spezialisten verkürzen. Durch die schnelle Analyse von Langzeitsignalen werden sie dazu beitragen, die Zahl der erkannten Fälle einer bestimmten Krankheit zu erhöhen. Sie werden Untersuchungen an Orten der Welt ermöglichen, an denen es an Ärzten mangelt.

Wie werden Daten für im Gesundheitswesen zum Einsatz kommende Algorithmen aufbereitet?

Die Aufbereitung von Daten ist ein kritischer Schritt, insbesondere bei medizinischen Anwendungen, daher muss sie äußerst sorgfältig durchgeführt werden. Ein Modell ist nur so gut wie die Daten, mit denen es trainiert wurde. Paare von Probedaten mit richtig zugewiesenen Kennzeichnungen (korrekte Diagnose) sind der Schlüssel zum Erfolg. Idealerweise sollten sie von mehreren unabhängigen Spezialisten überprüft werden. In dieser Phase ist eine sehr enge Zusammenarbeit mit Ärzten erforderlich.

Kann KI etwas ohne unsere Erlaubnis oder Kontrolle tun?

Wenn der gesamte Prozess der Entwicklung eines Algorithmus sauber durchgeführt wurde und der Algorithmus auf einem repräsentativen Datensatz getestet wurde, dann wissen wir genau, was wir von diesem Algorithmus erwarten können und wie er in der Realität funktionieren wird. Wenn wir jedoch den Tests nicht genügend Aufmerksamkeit geschenkt haben, dann können während seiner realen Anwendung verschiedene Dinge passieren, und wir werden nicht verstehen, warum sie passiert sind.

Wenn Sie mich als Ingenieur fragen, ob ein gut entworfener und getesteter KI-Algorithmus etwas selbst, also ohne unsere Erlaubnis oder Kontrolle, tun kann, lautet die Antwort „Nein“. Wenn wir ihn selbst Operationen ausführen lassen, dann ja. Aber in diesem Fall ist er unter unserer Kontrolle, weil wir ja dieses Ergebnis erwartet haben. 

Ist es möglich, ein KI-System zu bauen, das menschliche Gefühle wie Empathie, Mitgefühl, Sympathie usw. erlernen kann?

Emotionen zu erkennen, sollte definitiv möglich sein. Aber Emotionen so wie Menschen zu fühlen? Was bedeutet ein „Gefühl im Kontext eines Computers“? Entscheidungen auf eine bestimmte Art und Weise zu treffen, abhängig von den gesammelten Daten? Das Auslösen chemischer Prozesse an irgendeinem Ort? Oder das Simulieren von Gesichtsausdrücken? Die Frage ist: Wenn wir menschliche Emotionen so verstehen, könnten wir sie dem Algorithmus beschreiben? Aber sogar wenn dies gelänge, hätten wir es trotzdem wieder nur mit mathematischen Modellen von Emotionen zu tun.

Kann KI intelligenter werden als es Menschen sind?

Was heißt denn eigentlich „intelligenter“? Es gibt verschiedene Arten von Intelligenz und verschiedene Aufgaben, bei denen wir Menschen und Computer vergleichen können. Und natürlich gibt es einige Fälle, in denen Ingenieure Algorithmen entwickelt haben, die Menschen übertrafen. Solche Beispiele sind alte Brettspiele wie „Go“ und Schach, bei denen Algorithmen menschliche Meister schlagen können. Beim Schach bewundert der ehemalige Schachweltmeister Kasparov die ungewöhnliche Art, wie der Algorithmus spielt, und bemerkte sogar, dass Menschen von den neuen Strategien lernen können, die der Computer vorschlägt.

Natürlich haben Algorithmen derartige Niveaus nur erreichen können, weil sie Millionen von Trainingsbeispielen verarbeitet haben, die aus Spielen zwischen Menschen stammten. Es sind auch Publikationen erschienen, in denen Forscher gezeigt haben, dass Algorithmen einzelne Ärzte im Vergleich zu Diagnosen, die von einer Gruppe von Fachärzten entwickelt wurden, übertreffen. Das lag u. a. daran, dass der Algorithmus aus Millionen richtig aufbereiteter Trainingsbeispiele gelernt hat.

Der Mensch wiederum braucht nur wenige Trainingsbeispiele, um sich ausreichend Wissen für das Verständnis eines neuen Phänomens anzueignen. Menschen können ihr Fachwissen viel besser verallgemeinern oder aus einer kurzen Definition eines neuen Begriffs auf Wissen schließen. Sie können Fakten aus vielen verschiedenen Bereichen verknüpfen, ohne dafür so viele Trainingsbeispiele zur Verfügung zu haben, wie aktuelle Algorithmen sie benötigen, um einen Schachmeister zu besiegen.

Anmerkung der Autorin: Kasia (Doktor der Biomedizintechnik and Medizintechnik) hat eine außergewöhnliche Fähigkeit, selbst die kompliziertesten Dinge zu erklären. Nach dem Interview mit ihr habe ich endlich einige Themen verstanden, die mich schon lange beschäftigen. Sie ist eine leidenschaftliche Forscherin bei Cardiomatics – einem cloudbasierten KI-Instrument für die EKG-Analyse.

 

Kontaktieren Sie uns