Neuronale Netze

Neuronale Netze

Informationssysteme - Sommersemester 2026

Prof. Dr. Christian Drumm

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Notwendiges Vorwissen

Bereits bekannt sollten folgende Begriffe / Konzepte

  • Überwachtes Lernen, unüberwachtes Lernen
  • Trainingsdaten
  • Confusion Matrix
  • Accuracy, Precision, Recall, F-Measure
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Lernziele

Nach dieser Vorlesung können Sie...

  • den Aufbau und die Funktionsweise eines künstlichen Neurons (Perzeptron) mathematisch und konzeptionell erklären.
  • die Grenzen eines einzelnen Perzeptrons (z.B. am XOR-Problem) aufzeigen und die Notwendigkeit von Multi-Layer Perzeptrons (MLP) begründen.
  • die Architektur eines künstlichen neuronalen Netzes (Input, Hidden und Output Layer) beschreiben.
  • den grundlegenden Lernprozess (Backpropagation) und die Rolle der Fehlerfunktion (Loss Function) erläutern.
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Agenda

  1. Einordnung und Geschichte der KI
  2. Das Perzeptron: Grundlagen und Berechnung
  3. Grenzen des Perzeptrons und Multi-Layer Architekturen
  4. Der Lernprozess: Backpropagation und Fehlerfunktionen
  5. Ausblick
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Einordnung der neuronalen Netze

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Geschichte der KI

sehr kurz und unvollständig...

  1. 1943 - yMcCulloch & Pitts: Perceptron
  2. 1950 - Alan Turing: Turingtest
  3. 1956 - Dartmouth Workshop: Ursprung der KI-Forschung
  4. 1965 - ELIZA: erster Chatbot
  5. 1969 - Perzeptrons
  6. 1974 - 1985: KI Winter
  7. 1986 - Backpropagation Paper
  8. 1991 & 1997: Hochreiter & Schmidhuber: LSTM
  9. 1997 - Deep Blue
  10. 2024 - ChatGPT
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

KI ist mehr als LLMs

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Agenda

  1. Einordnung und Geschichte der KI
  2. Das Perzeptron: Grundlagen und Berechnung
  3. Grenzen des Perzeptrons und Multi-Layer Architekturen
  4. Der Lernprozess: Backpropagation und Fehlerfunktionen
  5. Ausblick
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Das Perzeptron - Struktur des künstlichen Neurons

Grundlagen: McCulloch & Pitts (1943)

  • Eingabewerte ()
    Vektor von Features oder Datenpunkte
  • Gewichte ()
    Vektor von Gewichten
  • Bias (b)
  • Aktivierungsfunktion (): z.B.





Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Das Perzeptron - Berechnung der Ausgabe

Die Berechnung der Ausgabe des Perzeptrons besteht aus zwei Schritten:

  1. Summation
  2. Aktivierung

Formal

Das Skalarprodukt aus Gewichtsvektor und Eingabevektor bestimmt den Output.




Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Beispiel: Logisches Oder

Mögliche Konfiguration:

  • Gewichte: ,
  • Bias
A () B () Summe Ergebnis
0 0 -1 0
0 1 1 1
1 0 1 1
1 1 3 1

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Beispiel: Logisches Oder

Mögliche Konfiguration:

  • Gewichte: ,
  • Bias
A () B () Summe Ergebnis
0 0 -1 0
0 1 1 1
1 0 1 1
1 1 3 1

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Agenda

  1. Einordnung und Geschichte der KI
  2. Das Perzeptron: Grundlagen und Berechnung
  3. Grenzen des Perzeptrons und Multi-Layer Architekturen
  4. Der Lernprozess: Backpropagation und Fehlerfunktionen
  5. Ausblick
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Das XOR-Problem

A () B () Ergebnis
0 0 0
0 1 1
1 0 1
1 1 0

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Multi-Layer Perzeptron

Ein einzelnes Perzeptron fungiert als linearer Klassifikator.

  • Es kann nur Probleme lösen, bei denen die Klassen durch eine Gerade (2D) oder Hyperebene (nD) voneinander getrennt werden können.
  • Die Entweder-Oder Funktion (XOR) kann mit einem Perzeptron nicht dargestellt werden!

Lösung

  • Durch das Hintereinanderschalten von Neuronen können komplexere Probleme gelöst werden.

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Neuronale Netze

Ein Multi-Layer Perzeptron (MLP) mit einer Vielzahl von künstlichen Neuronen, die in mehreren Schichten organisiert sind, bezeichnet man als (künstliches) Neuronales Netz (KNN / ANN).

Die grundlegende Architektur besteht aus drei Arten von Schichten (Layers):

  • Input Layer (Eingabeschicht)
  • Hidden Layer(s) (Verborgene Schichten)
  • Output Layer (Ausgabeschicht)

Im Zusammenhang mit LLM ist of von Parametern die Rede. Jede Linie in dieser Graphik ist einen Parameter ().

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Agenda

  1. Einordnung und Geschichte der KI
  2. Das Perzeptron: Grundlagen und Berechnung
  3. Grenzen des Perzeptrons und Multi-Layer Architekturen
  4. Der Lernprozess: Backpropagation und Fehlerfunktionen
  5. Ausblick
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Lernprozess: Gewichte anpassen

Damit das KNN korrekte Vorhersage machen kann, müssen die richtigen Werte für verschiedenen Matrizen gefunden werden.

Vorgehen (Backpropagation)

  1. Initialisierung: Gewichte werden mit zufälligen Werten initialisiert.

  2. Forward Propagation: Mit aktuellen Gewichten wird für Trainingsdaten eine Vorhersage berechnet.
  3. Fehler-Berechnung: Berechnung der Abweichung der Vorhersage vom tatsächlichem Label.
  4. Update: Anpassung der Gewichte damit Vorhersage sich dem tatsächlichen Label annähert.
  5. Wiederholung der Schritte 1 -3 bis Abbruchkriterium erreicht ist.

Ziel: Minimierung der Fehlerfunktion (Loss Function).

Interaktives Tutorial zu neuronalen Netzen

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Die Fehlerfunktion (Loss Function)

Die Fehlerfunktion misst, wie weit die Vorhersage des Netzes () vom tatsächlichen Zielwert () entfernt ist.

Typische Fehlerfunktionen

  • Mean Squared Error (MSE): Standard für Regressionsprobleme (Vorhersage von Werten).

  • Cross-Entropy: Standard für Klassifikationsprobleme. Bestraft falsche Vorhersagen, bei denen sich das Netz sehr sicher war, besonders stark.
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Update der Gewichte: Gradientenabstieg

Geometrische Interpretation

  • Die Fehlerfunktion spannt einen mehrdimensionalen Raum (Fehlerlandschaft) auf. Ziel ist das Finden eines Minimums.

Anpasssung der Gewichtsmatrizen zur Minimierung der Fehlerfunktion :

  • Der Gradient (): Partiellen Ableitungen der Fehlerfunktion nach allen den (z.B. )
  • Gewichtsadaption (): Die Änderung der Gewichte ergibt sich aus dem negativen Gradienten skaliert mit der Lernrate .

  • Angepasste Gewichtsmatrizen:

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Der Einfluss der Lernrate ()

Die Lernrate ist ein zentraler Parameter, der die Schrittweite der Gewichtsadaption pro Iteration des Gradientenabstiegs skaliert.

  • Zu geringe Lernrate:
    • Führt zu langsamer Konvergenz (hoher Rechenaufwand)
    • Erhöht das Risiko, in suboptimalen lokalen Minima zu verharren
  • Zu hohe Lernrate:
    • Verursacht instabiles Verhalten (Oszillationen) um das Minimum herum
    • führt zur Divergenz (Zunahme des Fehlers), da das Minimum übersprungen wird.

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Der Einfluss der Lernrate ()

Interaktive Demo zur Lernrate in KNN: https://playground.tensorflow.org

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Agenda

  1. Einordnung und Geschichte der KI
  2. Das Perzeptron: Grundlagen und Berechnung
  3. Grenzen des Perzeptrons und Multi-Layer Architekturen
  4. Der Lernprozess: Backpropagation und Fehlerfunktionen
  5. Ausblick
Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Ausblick & Demo: Komplexere Architekturen

Neuronale Netze können weitaus komplexere Strukturen annehmen als die einfachen gezeigten KNN. Ein prominentes Beispiel hierfür sind Autoencoder.

  • Encoder: Komprimiert hochdimensionale Eingabedaten (z. B. Bilder) auf die wesentlichen Merkmale in eine kompakte Repräsentation (den latenten Raum).
  • Decoder: Rekonstruiert aus dieser komprimierten Repräsentation wieder die ursprünglichen Daten.

Prof. Dr. Christian Drumm - FH Aachen
Neuronale Netze

Referenzen

[1] S. J. Russell and P. Norvig, Artificial intelligence: a modern approach, Fourth edition. in Pearson series in artificial intelligence. Hoboken: Pearson, 2021.

Prof. Dr. Christian Drumm - FH Aachen