Methoden zur Validierung und Verifizierung eines Datenanalyse UseCases

05. April 2024

Abstract

Ein wichtiger Bestandteil der Cross Industry Standard Process for Data Mining (CRISP-DM) Methode ist das iterative Prüfen der entwickelten Software. Es muss wiederholt getestet werden, ob der entwickelte Code und die Datenaufbereitung den Ansprüchen des Projekts entsprechen. Für eine verlässliche Prüfung muss der Vailidierungs- und Verifizierungsprozess strukturiert und reproduzierbar sein.

Im Projekt Supply Chain Artificial Intelligence (SCAI) der Mercedes-Benz AG fehlt genau diese Struktur und Methodik, daher wird in dieser Arbeit eine im Projekt SCAI erarbeitete Methode zur Validierung und Verifizierung von Data-Analyse-Use-cases in PowerBI vorgestellt.

Es wird die Relevanz von gutformulierten Akzeptanzkriterien und Regressionstest im Bereich der Verifizierung beschrieben, so wie die dringliche Einführung von automatisierten Tests. Für die Validierung wurde eine Methode auf Basis von Flussdiagrammen und Experteninterviews entwickelt, um Logiken zu prüfen und eine grobe Risikoabschätzung zu ermöglichen. Ebenso wurde mit Histogrammen, Durchschnitten und Median dargestellt, wie die Datenbasis geprüft werden kann und Ausreißer beseitigt werden können.

Schlussendlich gibt es noch eine einfache Risikoanalyse, um die Relevanz der vorgestellten Methoden zu untermauern.

Volltext

Verfügbar auf Anfrage.