Junokai Tipp der Woche KW 13

Datenauswertung und -Aufbereitung: Alles Excel, oder?


Wenn in der heutigen Geschäftswelt von Datenaufbereitung gesprochen wird, denken viele nach wie vor an Excel. Nicht ohne Grund, denn seit der Entwicklung von Excel im Jahr 1985 ist das allseits beliebte Tabellen Tool aus Unternehmen nicht mehr wegzudenken. Schnell ein paar Zahlen in die Reihen und Spalten eingetippt, eine mehr oder minder aussagekräftige Spaltenüberschrift gewählt und schon lässt sich mittels Grafiktool farbenfroh ausdrücken, was zahlentechnisch in der letzten Zeit passiert ist. Seit 1985 hat sich besonders die IT-Welt jedoch „etwas“ weiterentwickelt und neue Tools auf den Markt gebracht, die dem geneigten Mitarbeiter mehr Möglichkeiten bei der Analyse und Aufbereitung seiner Daten bieten. Im Folgenden sollen einige dieser Tools kurz beispielhaft dargestellt werden. Hierbei sollen nur einige der Funktionen herausgehoben werden.

Power Query

Der Nutzer braucht sich gar nicht so weit von Excel zu entfernen, um bereits ein erstes, sehr nützliches Tool an der Hand zu haben, welches die Aufbereitung von Daten erheblich vereinfacht. Um genau zu sein muss Excel hierfür gar nicht geschlossen werden. Power Query wird von Microsoft als Datentransformations- und Datenaufbereitungs-Engine beschrieben. Hier werden dem Nutzer mehr Funktionen an die Hand gegeben, um ETL-Operationen (Extrahieren, Transformieren und Laden) an bestehenden Daten durchzuführen.

Über den Reiter „Daten“ lassen sich in Excel verschiedene Daten aus Quellen zusammenführen und in Power Query bearbeiten, bevor diese dann in einem neuen oder bestehenden Spreadsheet ausgegeben werden. Der Vorteil für den Benutzer liegt darin, dass Power Query exakt für diesen Zweck entwickelt wurde. So lassen sich Schritte, mit denen Daten verändert wurden, einfach nachvollziehen und vorherige Bearbeitungsstände per Mausklick betrachten. Darüber hinaus bietet Power Query dem Nutzer eine Reihe an Operationen, die Daten für eine weitere Verarbeitung in Excel oder in einem BI Tool vorzubereiten. Fehlende oder fehlerhafte Daten lassen sich einfacher identifizieren und die Datenformate vereinheitlichen.

Power BI 

Power BI von Microsoft fällt unter die Kategorie der Business Intelligence bzw. Daten-Visualisierungs-Programme. Der Fokus des Tools liegt auf der Aufbereitung und Bereitstellung der Daten innerhalb eines Unternehmens. Hierfür lässt sich aus einer Vielzahl von Visualisierungen wählen, die jeweils einen unterschiedlichen Blickwinkel auf die Daten zulassen. Es lassen sich damit auch mehrere verschiedene Visualisierungen (Kuchendiagramm, Analysebaum etc.) auf einem Dashboard darstellen. Mittels Auswahlkriterien können Nutzer diese Visualisierungen interaktiv verändern und so den Zeitraum oder andere Kriterien auf ihren Bedarf anpassen.

Die Datenbereitstellung läuft in Power BI mittels Importen aus Excel, SQL, CSV oder einigen anderen Quellen, was einen breiten Einsatz des Tools ermöglicht. Der Analyst hat die Möglichkeit, die Daten innerhalb von Power BI vor- und aufzubereiten und kann mittels einer Sammlung von Funktionen und Operatoren, genannt DAX („Data Analysis Expression“), auch komplexe Berechnungen an den Daten vornehmen.  Ein weiterer Vorteil liegt in der Option, Inhalte der Quelldaten weiterbearbeiten zu können. Mithilfe der Aktualisierungsfunktion können diese Inhalte in ein bestehendes Dashboard überführt werden.

Neben Power BI existieren auf dem Markt noch weitere Tools, die ähnliche Funktionen anbieten so bspw. Tableau, Zoho Analytics oder Sisense.

Python

Möchte man noch tiefer in die Datenanalyse und -Aufbereitung einsteigen, bietet sich die Programmiersprache Python an. Die Einarbeitung gestaltet sich in dem Fall etwas umfassender als für Power Query oder Power BI, bietet jedoch auch die umfassendsten Funktionen für den Nutzer. Jede Verarbeitung und Veränderung kann mit Python individuell durchgeführt werden. Des Weiteren bietet es eine Vielzahl von Bibliotheken mit speziellen Tools für die Ver- und Aufbereitung von Daten. Zudem offeriert Python mithilfe der Bibliothek Matplotlib, Datenvisualisierungen zu erstellen und einzubinden.

Der Vorteil von Python besteht vor allem darin, dass große Datenmengen bearbeitet werden können. Erstellte Skripte, die eine Reihe von Operationen auf Daten aufwenden, können immer wieder aufgerufen werden. Zudem lassen sich Skripte in andere Programme, bspw. Power BI, integrieren. Python bietet deutlich mehr als nur Datenanalyse; so wird dieses Tool auch in den Bereichen Machine Learning, AI und Automatisierung verwendet, um nur einige Anwendungsbereiche zu nennen.

Fazit

Neben Excel werden dem Analysten heute eine Vielzahl weiterer Tools geboten, mit denen die Datenanalyse und grafische Aufbereitung auf ein neues Level gehoben wird. Welche Tools eingesetzt werden, hängt stark von der Menge der Daten und deren Struktur ab. Auch erfordern die hier dargestellten Tools einen unterschiedlichen Aufwand, was die Einarbeitung anbetrifft. Power Query verlangt dem geneigten Excel-Nutzer nicht viel Anpassung ab. Python hingegen befindet sich für viele außerhalb ihrer Comfort Zone. Dennoch lohnt es sich zu prüfen, ob im Unternehmen Fähigkeiten in diesen Bereichen bestehen oder gefördert werden sollten, da sich dadurch bereits bestehende Daten deutlich besser nutzen lassen.

Dominikus Leicht  – Junior Consultant

junokai

Verschlagwortet mit , , , , .