Das Getriebe: Wie funktioniert Künstliche Intelligenz?

Du weißt jetzt, was KI ist und woher sie kommt. Aber wie funktioniert das Ganze eigentlich unter der Haube? Keine Sorge – wir erklären die Technik so, dass sie jeder versteht. Versprochen.

1. Machine Learning – Das Prinzip von Versuch und Irrtum

Maschinelles Lernen (englisch: Machine Learning) ist das Herzstück moderner KI. Statt einem Computer exakte Regeln zu geben („Wenn die E-Mail das Wort Gewinnspiel enthält, verschiebe sie in den Spam“), zeigen wir ihm tausende Beispiele und lassen ihn die Regeln selbst finden.

Stell dir einen Lehrling vor, der im Restaurant arbeitet. Am ersten Tag rät er bei jeder Bestellung, welche Beilage der Gast wohl möchte – und liegt meistens daneben. Aber nach hunderten Bestellungen merkt er: „Wer Fisch bestellt, nimmt fast immer Reis.“ Niemand hat ihm diese Regel diktiert; er hat sie aus den Daten gelernt. Genau so funktioniert Machine Learning.

Die Maschine startet mit zufälligen Annahmen, vergleicht ihre Ergebnisse mit der Realität, misst den Fehler und korrigiert sich – milliardenfach. Am Ende steht ein „Modell“, das für neue, unbekannte Daten erstaunlich gute Vorhersagen treffen kann.

2. Neuronale Netze – Die Gehirn-Analogie

Der Name „Neuronales Netz“ klingt biologisch – und das ist Absicht. Die Idee ist von unserem Gehirn inspiriert: Dort kommunizieren Milliarden von Nervenzellen (Neuronen) über elektrische Signale miteinander. Je öfter ein bestimmter Pfad benutzt wird, desto stärker wird die Verbindung – so lernen wir.

Ein künstliches Neuronales Netz funktioniert ähnlich. Es besteht aus vielen kleinen Recheneinheiten („Neuronen“), die in Schichten (Layers) angeordnet sind:

Eingabeschicht: Hier kommen die Rohdaten rein – z.B. die Pixel eines Bildes.
Verdeckte Schichten: Hier passiert die eigentliche Magie. Jedes Neuron nimmt die Signale der vorherigen Schicht, gewichtet sie und gibt ein Ergebnis weiter.
Ausgabeschicht: Hier kommt die Antwort – z.B. „Das ist eine Katze“ oder „Die E-Mail ist Spam“.

Die „Gewichte“ an den Verbindungen sind die Stellschrauben, die beim Training justiert werden. Stell sie dir wie Lautstärkeregler an einem Mischpult vor: Durch Feintuning tausender Regler entsteht am Ende ein klares Signal aus dem Rauschen.

3. Deep Learning – Viele Schichten, großes Wissen

Deep Learningist im Grunde „Machine Learning mit vielen Schichten“. Das „Deep“ bezieht sich auf die Tiefe des Netzwerks – also die Anzahl der verdeckten Schichten. Ein simples Netzwerk hat vielleicht drei Schichten; moderne Sprachmodelle wie GPT haben Milliarden von Parametern, verteilt über hunderte Schichten.

Warum sind mehr Schichten besser? Jede Schicht lernt etwas anderes:

Die ersten Schichten erkennen einfache Muster – Kanten, Farben, Formen.
Mittlere Schichten kombinieren diese zu komplexeren Strukturen – Augen, Nasen, Räder.
Die letzten Schichten erkennen ganze Konzepte – „Das ist ein Gesicht“ oder „Dieser Satz drückt Freude aus“.

Es ist wie ein Detektiv-Team: Der erste findet Fingerabdrücke, der zweite ordnet sie zu, der dritte löst den Fall. Je mehr Detektive (Schichten) zusammenarbeiten, desto komplexere Fälle können sie lösen.

4. Training: Daten rein, Muster raus, Vorhersage

Das Training eines KI-Modells läuft in drei Phasen ab:

Phase 1: Daten sammeln

Riesige Mengen an Daten werden gesammelt – Texte aus dem Internet, Millionen von Bildern, Audiodateien. Die Qualität und Vielfalt der Daten bestimmt maßgeblich, wie gut das Modell wird.

Phase 2: Muster erkennen

Das Modell verarbeitet die Daten und passt seine internen Gewichte an. Bei jedem Durchlauf wird der Fehler gemessen und minimiert – ein Prozess, der „Backpropagation“ heißt. Stell dir vor, du wirfst einen Ball auf eine Zielscheibe: Nach jedem Wurf korrigierst du deinen Winkel ein kleines Stück.

Phase 3: Vorhersage

Nach dem Training kann das Modell auf völlig neue Daten angewendet werden. Es hat gelernt, allgemeine Muster zu erkennen – nicht einzelne Beispiele auswendig. Deshalb kann ChatGPT auf Fragen antworten, die es im Training nie gesehen hat.

5. Überwachtes vs. unüberwachtes Lernen

	Überwachtes Lernen	Unüberwachtes Lernen
Prinzip	Lernen mit „Lehrer“ – für jedes Beispiel gibt es die richtige Antwort	Lernen ohne Lehrer – die KI sucht selbst nach Strukturen
Analogie	Wie Vokabeln lernen mit Karteikarten	Wie ein Kind, das Spielzeug nach Farbe sortiert
Beispiel	Spam-Filter (tausende markierte E-Mails als Training)	Kundensegmentierung (Gruppen automatisch erkennen)
Stärke	Sehr präzise bei klaren Aufgaben	Findet versteckte Muster, die Menschen übersehen

Daneben gibt es noch das Reinforcement Learning (Bestärkendes Lernen), bei dem die KI wie ein Spieler agiert: Sie probiert verschiedene Aktionen aus und bekommt Belohnungen oder Strafen. Genau so hat AlphaGo gelernt, den legendären Zug 37 zu spielen.

6. Warum GPUs so wichtig sind

Vielleicht hast du schon von GPUs(Graphics Processing Units) gehört – ursprünglich Grafikchips für Computerspiele. Warum sind ausgerechnet die für KI so entscheidend?

Ein normaler Prozessor (CPU) ist wie ein brillanter Einzelkämpfer: Er löst Aufgaben Schritt für Schritt, aber immer nur eine auf einmal. Eine GPU hingegen ist wie ein riesiges Team aus tausenden einfachen Arbeitern: Jeder einzelne ist weniger spezialisiert, aber sie arbeiten alle gleichzeitig.

KI-Training besteht aus Milliarden simpler Rechenoperationen, die parallel ablaufen können. Genau hier spielt die GPU ihre Stärke aus. Ohne GPUs würde das Training eines modernen Sprachmodells statt Wochen Jahrhunderte dauern. Unternehmen wie NVIDIA sind deshalb zu den wichtigsten Akteuren der KI-Revolution geworden.

7. Praxisbeispiel: Bilderkennung Schritt für Schritt

Lass uns das Ganze an einem konkreten Beispiel zusammenführen: Eine KI soll lernen, Hunde von Katzen zu unterscheiden.

Daten sammeln

10.000 Bilder von Hunden und 10.000 Bilder von Katzen, jeweils mit dem Label „Hund“ oder „Katze“.

Bilder in Zahlen umwandeln

Jedes Pixel wird zu einer Zahl (Helligkeit/Farbwert). Ein Bild mit 224 × 224 Pixeln ergibt ca. 150.000 Eingabewerte.

Durch das Netzwerk schicken

Die Zahlen fließen durch die Schichten. Erste Schichten erkennen Kanten, mittlere erkennen Formen (spitze Ohren? Schnauze?), letzte Schichten treffen die Entscheidung.

Fehler messen & korrigieren

Sagt das Modell „Hund“, obwohl es eine Katze ist? Der Fehler wird berechnet und die Gewichte werden angepasst. Dieser Schritt wird millionenfach wiederholt.

Fertig: Neue Bilder erkennen

Das trainierte Modell kann jetzt ein Bild analysieren, das es nie zuvor gesehen hat, und mit hoher Wahrscheinlichkeit sagen: „Das ist ein Hund.“

Genau dieses Prinzip – nur mit viel mehr Schichten und viel mehr Daten – steckt hinter Gesichtserkennung, autonomem Fahren und auch hinter den Sprachmodellen, mit denen du chattest.