was ist eigentlich data science?

Wir definieren den Begriff Data Science und grenzen diesen zu einigen anderen ab.

Roman Wolkow

Von Roman Wolkow

1. Definition: was ist data science? Schon wieder ein Buzzword…

Data Science und KI sind in aller Munde. Die Grundlage, um Data Science oder KI betreiben bzw. anwenden zu können, sind Daten. Denn dass Daten das Öl des 21. Jahrhundert sind, hat sich mittlerweile bis in die letzten Chefetagen in jeder Branche herumherumgesprochen. In der Praxis stellt man allerdings schnell fest, dass sowohl die Anwendungen als auch Begrifflichkeiten vielen nicht ganz klar sind. So ist es auch kein Wunder, dass zwar die Anwendung von KI und Data Science Methoden als enorm wichtig angesehen werden, aber die genaue Umsetzung fraglich bleibt. Deshalb wollen wir ein wenig Licht ins Dunkel bringen und uns zunächst mit dem Begriff der Data Science auseinandersetzen.

Data Science ist im Grunde eine Ansammlung von Methoden, die helfen aus strukturierten Daten (historische Verkaufszahlen/Transaktionen, Kundeneinträge…) und unstrukturierten Daten (Videos, Bildern…) neue Erkenntnisse zu gewinnen. Die Methoden reichen dabei von statistischen Analysen bis hin zum maschinellen Lernen (Machine Learning). In den meisten Unternehmen wird Data Science eingesetzt, um Wert in Form von Umsatzsteigerung, Kostensenkung, Geschäftsagilität, verbessertem Kundenerlebnis, Entwicklung neuer Produkte und dergleichen zu schaffen.

Was bringen all diese Daten, wenn man sie nicht nutzt? Alles zu digitalisieren, anstatt es auf Papier zu haben, und in einem geeigneten System zu speichern, wie z.B. einem ERP- oder CRM-System, ist der erste Schritt. 

Heutzutage fallen bei jedem Unternehmen enorm viele Daten an. Nehmen wir einmal einen Online Händler: Transaktionen/Beiträge/Google Analytics etc. im Webshop, Social Media Daten, An- und Auslieferung, Kundenrezensionen, Daten von Partnern und Drittanbietern etc. Oder einen Zulieferer in der Lebensmittelindustrie: An- und Auslieferungsdaten, Qualitätskontrollen, Kundeninteraktionen, historische Lieferdaten etc.
Doch was bringen all diese Daten, wenn man sie nicht nutzt? Alles zu digitalisieren, anstatt es auf Papier zu haben, und in einem geeigneten System zu speichern, wie z.B. einem ERP- oder CRM-System, ist der erste Schritt. In der Datenwissenschaft (Data Science) geht es darum, diesen Daten einen Zweck zu geben.

2. Data Science vs. Analytics

Analytics bzw. Data Analytics ist ein Teil von Data Science oder in zeitlicher Reihenfolge betrachtet einer der ersten Schritte im Prozess des Data Science und der Gewinnung neuer Erkenntnisse. Wenn man anfängt mit einem Datensatz zu arbeiten, z.B. den historischen Verkaufsdaten der letzten 5 Jahre eines Online Shops, müssen diese Daten zunächst einmal aufbereitet werden. Je nachdem in welcher Form die Daten vorliegen, müssen Sie also zunächst bereinigt, z.B. fehlende Werte ersetzt werden, und in die richtige Struktur gebracht werden. Anschließend, werden diese Daten visualisiert und analysiert. Datenanalyse hilft zu verstehen, wie die Daten eines Unternehmens aussehen. Data Science hingegen nutzt die Ergebnisse dieser Analysen, um Probleme zu lösen.

Data Science hilft also, eine Lösung für ein Problem zu finden. Wenn man kein Problem löst und die Daten nur betrachtet, handelt es sich um Datenanalyse. Beispielsweise: „wie viel Umsatz haben wir letzten Monat gemacht?“, „Wie viele Nutzer sind auf unsere Seite über Facebook gekommen?“, „Welcher Monat war der Umsatzschwächste letztes Jahr?“, „An welchen Tagen haben wir die meisten Anlieferungen?“…

Der Unterschied zwischen Datenanalyse bzw. Analytics und Data Science liegt auch im zeitlichen Horizont. Analyse beschreibt den Ist-Zustand oder was in der Vergangenheit passiert ist. Data Science hingegen beschäftigt sich mit der Zukunft und versucht diese vorherzusagen und/oder zu verstehen.

3. Data Science vs. Big Data

Data Science und Big Data gehören oft zusammen. Denn je mehr Daten verfügbar sind, desto mehr Parameter können Sie in ein bestimmtes Modell aufnehmen. Allerdings kann Data Science Wert aus allen Datengrößen extrahieren, egal ob diese strukturiert, unstrukturiert oder semi-strukturiert sind.

Mit vielen Daten hat man natürlich weniger Restriktionen als mit kleinen Datenmengen. Aber mehr Daten sind nicht immer besser. Würde man versuchen den gesamten Aktienmarkt zu erfassen und Prognosen zu treffen, würde man schnell feststellen, dass es eine zu komplexe Aufgabe ist. Wenn man sich allerdings einige Indizes für einen begrenzten Zeitraum anschaut, ist es möglich, sehr gute Prognoseergebnisse zu erzielen.

4. Der Mehrwert für Unternehmen

Der Mehrwert den Data Science einem Unternehmen bringen kann, hängt davon ab, um welche Branche es sich handelt und welche Ziele und Probleme das Unternehmen hat. Data Science kann z.B. vorhersagen welche Produkte bei Kunden besonders beliebt sein werden und deshalb im Regal stehen sollten. Data Science kann auch helfen, Fehlfunktionen bei Maschinen frühzeitig vorherzusagen und so Ausfälle und unnötige Wartungskosten vermeiden.

“Der größte Wert, den ein Data Science-Team bringen kann, ist in Verbindung mit dem Business Team. Fast per Definition wird eine Person, die nach Neuheiten sucht und wirklich innovativ ist, einen Wert oder einen Wertverlust finden, der nicht den Erwartungen der Menschen entspricht “, sagt Ted Dunning, Chief Application Architect bei MapR Technologies. “Oft werden Sie überrascht sein. Der Wert war nicht dort, wo man ihn zuerst vermutet hat.”

5. Data Science Prozess und Ziele

Gerade am Anfang arbeiten Data Science Teams anders als Produktentwicklungsteams oder Entwicklerteams, die feste zeitliche Meilensteine oder Sprints haben. Das ist für Data Science Teams schwierig, weil v.a. am Anfang viel Zeit benötigt wird, um festzustellen ob die Frage überhaupt beantwortet werden kann und für die Datenaufbereitung. Gerade in den ersten Wochen müssen die Daten gesammelt und aufbereitet werden. Und dann geht es darum Fragen zu beantworten, wie „Können wir das Problem lösen? Können wir es effizient lösen?“

Nun, es heißt ja auch DatenWISSENSCHAFT. Echte Wissenschaft braucht ihre Zeit, v.a. wenn es sich um ein neuartiges Problem oder Fragestellung handelt. Man muss eben etwas mehr Zeit damit verbringen Hypothesen aufzustellen und dann diese zu bestätigen oder zu widerlegen.

In gewinnorientierten Unternehmen ist diese Zeit oftmals nicht gegeben oder man möchte sich diese Zeit nicht nehmen, um tief genug in die Daten einzusteigen und die Hypothesen zu validieren. Deshalb sind die meisten Fragen, die man beantwortet eher kurzfristiger Natur. Die Folge ist, dass die Antworten, die gefunden werden „gut genug“ sind aber nicht optimal. Die Gefahr ist dann, dass diese Antworten von einem Bias beeinflusst wurden oder einfach nur fehlerbehaftet sind.

Wenn es nicht wirklich Wissenschaft ist, was bedeutet, dass Sie eine Hypothese mit einer wissenschaftlichen Methode bestätigen, dann werfen Sie einfach Daten in einige Algorithmen, um Ihre eigenen Annahmen zu bestätigen.

Ziel der Datenwissenschaft ist es Erkenntnisse aus Daten eines Unternehmens zu extrahieren und so geschäftsorientierte Mehrwerte zu schaffen. Das heißt auch, man muss verstehen, wie die Prozesse in diesem Unternehmen aussehen und wie Informationen im Unternehmen fließen. Dieses Wissen kann man dann nutzen, um Möglichkeiten zur Verbesserung zu identifizieren und Probleme zu lösen. In der Regel versuchen Data Science Teams verschiedene Datenquellen, die erforderlich für die Lösung sind, einzubinden und eine langfristige Verbindung und nutzbare Tools bzw. Anwendungen zu programmieren. Idealerweise werden diese Lösungen in die bestehende Systemlandschaft des Unternehmens nahtlos eingebettet und können dauerhaft genutzt werden.

Wir helfen Unternehmen mit Hilfe von KI & Customer Analytics zu einem umfassenden Kundenverständnis und programmieren Software zur Marketing Automatisierung

Haben Sie Fragen zu diesen Themen oder wie wir Ihnen helfen können? Erfahren Sie mehr über unsere Services.

Adresse

Social Networks

Alp.Stars GmbH

We help companies to improve their sales through better customer understanding and marketing automation.

© Copyright – 2020 All Rights Reserved.

Social media & sharing icons powered by UltimatelySocial