Vor einigen Jahren schrieb ich meinen ersten Artikel über Data Science und Projektmanagement. Seitdem habe ich mehrere Data-Science-Projekte durchgeführt, meistens als der Data Scientist selbst. Als Data Scientist verbringen Sie jedoch nicht nur Ihre Zeit mit dem Erstellen von Modellen. Tatsächlich werden Sie die meiste Zeit damit verbringen, die Geschäftsanforderungen zu verstehen.
IBM’s Watson TV-Werbungen haben die Erwartung geschürt, dass künstliche Intelligenz etwas ist, das leicht installiert und auf eine Vielzahl von Problemen angewendet werden kann, unabhängig von der Branche. In Wirklichkeit sind jedoch nicht alle Watson-Projekte erfolgreich. Und das ist nicht nur ein Problem von IBM. KI-Projekte oder sogar Machine-Learning-Projekte als Teilmenge der KI stellen für viele Unternehmen eine Herausforderung dar.
Wenn wir uns die PMBOK-Definition eines Projekts ansehen, ist das Schaffen von etwas Neuem ein wesentlicher Bestandteil eines Projekts. Bei traditionellen Projekten in anderen Bereichen haben Kunden, Projektmanager und Projektteammitglieder oft bereits Erfahrungen in Bezug auf die Branche. Wenn Sie schon einmal ein Haus gebaut haben, dann ist es einfacher für Sie, das zweite Haus zu bauen. Je mehr Häuser Sie bauen, desto einfacher wird es, auch wenn diese neuen Häuser neue Anforderungen haben, die Sie zuvor noch nicht gesehen haben. Auch Kunden haben eine Vorstellung davon, wie ein Haus aussieht, weil sie andere Häuser gesehen haben. Sie verstehen auch, warum manche Dinge länger dauern als andere, weil sie sich auf die physische Welt beziehen können.
Data-Science-Projekte sind anders, weil Kunden normalerweise keine Erfahrung in diesem Bereich haben. Und es gibt nicht allzu viele erfahrene Projektteams oder Projektmanager, die mehrere Projekte in einer Branche durchgeführt haben, um Ergebnisse für jede mögliche Frage zu reproduzieren. Ein Data-Science-Projekt wird höchstwahrscheinlich nicht in einer Anwendung resultieren, die automatisch menschliche Sprache versteht und wie ein Mensch denkt, nur ohne die Fehler und eine Million Mal schneller. Aber wie können wir die Erwartungen unserer Kunden managen und gleichzeitig verstehen, was er wirklich braucht?
Es gibt einen weiteren Unterschied: Häuser bestehen aus bekannten Materialien. Data-Science-Projekte basieren in der Regel auf Daten, und oft genug sind die benötigten Daten nicht verfügbar und müssen erst gesammelt werden, oder sie sind nicht in der benötigten Menge oder Qualität verfügbar. Außerdem gibt es keinen bewährten Weg, ein Data-Science-Projekt erfolgreich zu machen. In einigen Fällen sind die Ergebnisse möglicherweise nicht wie erwartet, sei es aufgrund mangelnder ausreichender Daten oder weil die Algorithmen einfach nichts Brauchbares produzieren können. Manchmal müssen wir mit den verschiedenen Datenattributen („Features“) herumspielen, um zu verstehen, welche von ihnen tatsächlich eine Maschine dazu befähigen, nutzbare Muster zu finden. Wir bauen seit Jahrhunderten Häuser, aber nur wenige Jahrzehnte wurden für die Durchführung von KI- oder ML-Projekten aufgewendet.
Wenn das Verständnis des Geschäfts die Voraussetzung für den Erfolg ist, dann ist es von größter Wichtigkeit, dass das Geschäft bereit ist, genügend Zeit für das Onboarding des Projektteams zu investieren und mit dem Team zusammenzuarbeiten, um die Anforderungen zu sammeln und frühe Prototypen zu testen. Wenn das Ziel darin besteht, die Produktivität zu steigern, dann bedeutet ein Data-Science-Projekt während der Projektphase eine verringerte Produktivität. Dies muss sehr früh klar gemacht werden, und dies kann auf Widerstand stoßen.
Eine der besten Praktiken, um den Erfolg eines Data-Science-Projekts zu gewährleisten, besteht darin, den Erfolg sehr früh im Projekt zu definieren. Die Hauptfrage hier ist: „Wann würden Sie dieses Projekt als erfolgreich abgeschlossen betrachten?“ Oft wird diese Frage mit KPIs beantwortet, die nicht messbar sind. Aber das ist der Punkt: Wenn es nicht messbar ist, dann können Sie es nicht verbessern. Als Konsequenz ist es zwingend notwendig, diese Phase zu durchlaufen und messbare KPIs zu erarbeiten.
KPIs sind leider in den meisten Fällen nicht ausreichend. Ein Modell kann die besten Ergebnisse der Welt liefern, aber die Geschäftsauswirkungen spielen eine wichtigere Rolle als die Modellleistung. Ein Machine-Learning-Modell kann die beste Leistung der Welt haben, aber möglicherweise überhaupt keinen Geschäftseinfluss haben.
Data Science ist daher viel mehr als nur das Erstellen von Machine-Learning-Modellen. Es geht darum, Geschäftswert zu schaffen, indem die KPIs identifiziert werden, die wirklich den Ausschlag geben.
Schreibe einen Kommentar