gerichteter Baum zur Darstellung von Entscheidungsregeln
Struktur:
Charakteristik:
Beispiel: Soll ich heute Fahrradfahren gehen?

Problemstellung: Soll ein Kredit gewährt werden?
| Kunde | Kreditwürdigkeit | Einkommen | Besicherung | Kredit gewährt? |
|---|---|---|---|---|
| 1 | Hoch | Hoch | Nein | Ja |
| 2 | Hoch | Niedrig | Ja | Ja |
| 3 | Hoch | Niedrig | Nein | Ja |
| 4 | Niedrig | Hoch | Ja | Ja |
| 5 | Niedrig | Niedrig | Ja | Nein |
| 6 | Niedrig | Niedrig | Nein | Nein |
Was ist der (beste) Entscheidungsbaum auf Basis des Daten?
Der Iterative Dichotomiser 3 (ID3)[5] baut einen Entscheidungsbaum rekursiv auf.
Eingabe: Menge
Ausgabe: Ein Entscheidungsbaum
ID3-Algorithmus
Die Entropie
Interpretation: Wir benötigen exakt 3 Bit an Information (bzw. genau 3 optimale Ja/Nein-Fragen), um das Ergebnis eines Wurfs eindeutig zu bestimmen.
Der Informationsgewinn (Information Gain) gibt an, wie stark die Entropie sinkt, wenn wir den Datensatz nach einem Attribut
Problemstellung: Soll ein Kredit gewährt werden?
Datensatz:
| Kunde | Kreditwürdigkeit | Einkommen | Besicherung | Kredit gewährt? |
|---|---|---|---|---|
| 1 | Hoch | Hoch | Nein | Ja |
| 2 | Hoch | Niedrig | Ja | Ja |
| 3 | Hoch | Niedrig | Nein | Ja |
| 4 | Niedrig | Hoch | Ja | Ja |
| 5 | Niedrig | Niedrig | Ja | Nein |
| 6 | Niedrig | Niedrig | Nein | Nein |
Entropie berechnen
Informationsgewinn (IG) für alle Attribute berechnen
Die Daten werden nun anhand des neuen Wurzelknotens in Teilmengen aufgeteilt.
(Kreditwürdigkeit)
├── Hoch ─────> [Ja]
└── Niedrig ──> (Nächste Entscheidung?)
Baum für Teilmenge
Entropie der Teilmenge berechnen
Informationsgewinn für die verbleibenden Attribute
Das Attribut Einkommen liefert den maximalen Informationsgewinn (
Die finalen Zweige für den Knoten Einkommen werden erzeugt:
(Kreditwürdigkeit)
├── Hoch ────────────────────────> [Ja]
└── Niedrig ──> (Einkommen)
├── Hoch ────> [Ja]
└── Niedrig ─> [Nein]
Ein mögliches Maß zur Bewertung ist die Accuracy (Genauigkeit)
| Vorhersage: Pos | Vorhersage: Neg | |
|---|---|---|
| Ist: Pos | True Positive (TP) | False Negative (FN) |
| Ist: Neg | False Positive (FP) | True Negative (TN) |
Auf Basis der Confusion Matrix lassen sich spezifischere Metriken berechnen:
Accuracy (Genauigkeit):
Precision (Relevanz):
Recall (Sensitivität):
F-Measure (harmonisches Mittel aus Precision und Recall):
Precision und Recall lassen sich oft nur auf Kosten des jeweils anderen optimieren. Welcher Wert wichtiger ist, hängt vom Anwendungsfall ab.
Wir haben 100 kranke (Pos) und 100 gesunde (Neg) Patienten.
Sagt nur bei extremer Sicherheit "krank" (Pos) voraus.
Sagt bei geringstem Verdacht "krank" (Pos) voraus.
Ein besonderer Dank gilt Prof. Dr. Ingo Elsen für seinen wertvollen Input und den fachlichen Austausch.
Einige der in diesem Foliensatz verwendeten Ideen, Konzepte und didaktischen Beispiele basieren auf seinen Vorlesungsmaterialien zur Künstlichen Intelligenz.
[1] R. Sternberg and D. Detterman, What is intelligence? contemporary viewpoints on its nature and definition, 3. print. Norwood, N.J: Ablex, 1993. ⏎
[2] T. Nakagaki, H. Yamada, and Á. Tóth, “Maze-solving by an amoeboid organism,” Nature, vol. 407, no. 6803, pp. 470–470, Sep. 2000, doi: 10.1038/35035159. ⏎
[3] S. Legg and M. Hutter, “A Collection of Definitions of Intelligence,” 2007, doi: 10.48550/ARXIV.0706.3639. ⏎
[4] S. Legg and M. Hutter, “Universal Intelligence: A Definition of Machine Intelligence,” Minds & Machines, vol. 17, no. 4, pp. 391–444, Nov. 2007, doi: 10.1007/s11023-007-9079-x. ⏎
[5] S. J. Russell and P. Norvig, Artificial intelligence: a modern approach, Fourth edition. in Pearson series in artificial intelligence. Hoboken: Pearson, 2021. ⏎