Berufsprofil des Datenexperten

Data Scientist: Was macht der professionelle Datenauswerter?

Daten sind Gold wert. Aber nur, wenn man sie richtig auswertet. Hier kommt der Data Scientist ins Spiel. Er muss nicht nur Ahnung von Statistik haben, sondern auch von der Materie, die er untersucht. Sonst kann es schnell zu Scheinkorrelationen kommen.

Big Data steht auf einer weißen Tastaturtaste, aus der Balken eines Diagramms hervorragen

Data Scientists analysieren nicht nur Daten, sie treffen auch Prognosen anhand von modellierten Daten.

Foto: panthermedia.net/Kheng Ho Toh

Wenn Händler gegen Saisonende ihre Waren loswerden möchten, fangen sie an, sie zu reduzieren. „Im Fachjargon spricht man von Abschriften“, erklärt David Krings, Data Scientist und Mitgründer der KI-Plattform Aifora GmbH. Dabei gelten bestimmte Regeln: Ein einmal abgeschriebener Artikel wird nie wieder im Preis erhöht, sondern wenn dann nur weiter reduziert. Aus diesem Grund ist es sehr wichtig, den passenden Zeitpunkt und die richtige Höhe der Reduktion zu wählen. „Wenn ich an einem zu frühen Zeitpunkt zu stark reduziere, habe ich das Produkt möglicherweise schon vor Saisonende und nicht zum bestmöglichen Preis verkauft. Wenn ich aber zu spät und zu schwach reduziere, werde ich die Ware vielleicht nicht mehr los“, so Krings.

Was macht ein Data Scientist?

Die Aufgabe des Data Scientist ist es nun, Modelle zu entwickeln, die den perfekten Zeitpunkt und die richtige Höhe der Reduzierung berechnen. „Um eine gewisse Regelmäßigkeit erkennen zu können, sollte dafür mindestens auf Daten der vergangenen drei Jahre zurückgegriffen werden“, erklärt Krings. Die historischen Daten müssen jedoch zuvor bereinigt und in das entsprechende Format überführt werden. Im Speziellen bedeutet das, dass Daten zueinander gemappt und von fehlerhaften und inkonsistenten Daten bereinigt werden müssen.

Auf Basis dieser Informationen entwickelt der Data Scientist ein mathematisches Modell, das die relevanten Einflussfaktoren für Kaufverhalten beinhaltet und gewichtet. Diese Modelle können verwendet werden, um auf Vergangenheitsdaten Simulationen durchzuführen, die das Potenzial einer intelligenten und automatisierten Abschriftensteuerung zeigen. „Wichtig ist, dass die Modelle über Tests und Trainings validiert werden, damit das Ergebnis aussagekräftig ist und der Realität entspricht“, erläutert Data Scientist Krings.

Programmierkenntnisse sind für den Data Scientist ist ein Muss

Ein Data Scientist sollte über solide Kenntnisse in Statistik und Stochastik sowie über Programmierkenntnisse verfügen. Wichtige Programmiersprachen sind in diesem Zusammenhang

  • „R“
  • Python
  • Matlab
  • Julia
  • Scala

Die ersten beiden sind grundlegend, die anderen können je nach Branche dazukommen. Krings hat einen Bachelor in „Scientific Programming“ und einen Masterabschluss in „Technomathematik“ gemacht (mittlerweile heißt der Studiengang „Angewandte Mathematik“). Nebenbei hat Krings als studentische Hilfskraft am Supercomputing Centre Jülich gejobbt. Dort hat er sich mit der Programmierung auf Hochleistungsrechnern befasst. Dabei handelt es sich um Computer, die in der Lage sind, extrem große Datenmengen zu verarbeiten.

Der Job war eine gute Vorbereitung für seine spätere Tätigkeit. Denn auch ein Data Scientist muss in der Lage sein, mit sehr großen Datenmengen umzugehen.

Data Analyst: Mit Ingenieurswissen Scheinkorrelation verhindern

„Mittlerweile gibt es Anwendungen, die Algorithmen vorschlagen, sodass nicht mehr alles händisch programmiert werden muss. Nichtsdestotrotz muss ein Data Scientist natürlich verstehen, wie diese Modelle und die zugrunde liegenden Algorithmen funktionieren“, sagt Tom Becker, Geschäftsführer des auf Produkte im Bereich Data Science und Analytics spezialisierten Unternehmens Alteryx. An dieser Stelle überschneidet sich das Berufsbild des Data Scientist mit dem des Data Analyst. Letzterer sieht sich ebenso Daten an und durchforstet Datenmengen nach Trends und Zusammenhängen. Aber nur letzterer programmiert und modelliert die Daten zu einer Aussage.

Für Becker sind Ingenieure die idealen Kandidaten für den Beruf des Data Scientist. „Ingenieure können gut mit Zahlen umgehen. Gleichzeitig verfügen sie über ein breites Fachwissen zum Beispiel im Automobilbau“. Dadurch könnten sie beurteilen, welche Daten für die Analyse notwendig sind und welche Sensoren verbaut werden müssen, um diese Daten zu sammeln. Darüber hinaus versetzt sie ihr Fachwissen in die Lage, Sinn von Unsinn zu unterscheiden.

Denn es kann immer wieder vorkommen, dass Sachverhalte, die nichts miteinander zu tun haben, sich zufällig parallel zueinander entwickeln und daher in einen falschen Zusammenhang gebracht werden. Das bekannteste Beispiel für eine solche Scheinkorrelation ist der Zusammenhang zwischen Storchpopulation und Geburtenrate. Tatsächlich ist die Geburtenrate auf dem Land höher als in der Stadt. Ebenso gibt es in ländlichen Gebieten mehr Störche, was aber nicht zwangsläufig bedeutet, dass die Vögel die Babys bringen. Ein Data Scientist muss also in der Lage sein, die statistischen Modelle interpretieren zu können, bzw. sie so zu bauen, dass ein solcher Unsinn erst gar nicht herauskommt.

Wie wird man Data Scientist?

Zusammenfassend kann man sagen: Master und MOOCs machen den Data Meister. Es gibt allerdings zwei grundlegende Möglichkeiten, auf den Beruf Data Scientist hinzuarbeiten. Der klassische Weg führt über ein Hochschulstudium. Deutschlandweit gibt es über 25 spezialisierte Studiengänge und weitere Kombinationsangebote. Als grundständiges Studium mit dem Abschluss Bachelor of Science bieten folgende Hochschulen die Fachrichtung Data Science:

Bachelorstudiengänge zu Data Science
Angewandte Data Science Uni Göttingen Teilzeit, Vollzeit
Data Science HS Aalen Vollzeit
Data Science HS Otwestfalen-Lippe in Lemgo dual, Vollzeit
Data Science Uni Marburg Vollzeit
Data Science HAW XU Exponential in Potsdam Vollzeit
Data Science AKAD Hochschule Stuttgart berufsbegleitend, Fernstudium, Teilzeit
Data Science Uni Stuttgart Vollzeit
Data Science Westsächsische Hochschule Zwickau Teilzeit, Vollzeit
Data Science and Artificial Intelligence Universität des Saarlandes Teilzeit, Vollzeit
Data Science in der Medizin TU Ulm Vollzeit
Digital Business & Data Science HAW Europa in Berlin Vollzeit
Digital Business & Data Science HAW Europa in Hamburg Vollzeit
Mathematical Data Science Uni Göttingen Teilzeit, Vollzeit
Medical Engineerung and Data Science TH Aschaffenburg Vollzeit
Wirtschaftsinformatik – Data Science Duale HS Baden-Württemberg dual, Vollzeit
Quelle: Hochschulkompass der Hochschulrektorenkonferenz

Daneben können sich Ingenieure auf mittels sogenannten Massive Open Online Courses bei Udacity, der Decar-Academy oder der Plattform Unit-Me weiterbilden. „Mittlerweile arbeiten viele deutsche Unternehmen, insbesondere im Automotive-Bereich, bereits mit solchen Plattformen“, erklärt Becker. Den Aufwand, um intern einen Experten mittels Schulungen auszubilden, beziffert er mit etwa 600 Stunden.

„Auf diesen Plattformen gibt es auch kostenlose Inhalte. Diese bieten eine gute Möglichkeit, um zu testen, ob das Berufsumfeld prinzipiell zu einem passen könnte“, rät Becker.

Wie viel verdient ein Data Scientist?

Das Einstiegsgehalt eines Data Scientist beträgt zwischen 44.000 Euro und 68.000 Euro brutto im Jahr. Damit verdient ein Junior Data Scientist im Schnitt ein Jahresgehalt von 56.000 Euro. Der Verdienst beträgt damit rund 4.666 Euro im Monat. Zu dem Ergebnis kommt sowohl Stepstone als auch Alphajump.

Berufserfahrene Data Scientists können ein deutlich höheres Jahresgehalt erzielen. Abhängig ist das vor allem von der Ausbildung, dem Standort, der Branche und den Inhalten. Kennt sich der Data Scientist nicht nur mit Big Data, sondern auch mit dem zu analysierenden Produkt aus, hat er gleich eine bessere Verhandlungsposition.

 

Weitere E-Learning-Kurse für Ingenieure

Jobs für Data Scientists gibt es in unserer Jobbörse

Stellenangebote im Bereich IT-Consulting

Siemens Management Consulting (SMC)-Firmenlogo
Siemens Management Consulting (SMC) Experienced Consultant CRM Innovation/ Digital Transformation (w/m/d) München
Siemens Management Consulting (SMC)-Firmenlogo
Siemens Management Consulting (SMC) Consultant PLM und R&D Exzellenz (w/m/d) Erlangen, München
Siemens Management Consulting (SMC)-Firmenlogo
Siemens Management Consulting (SMC) Experienced Consultant PLM and R&D Design to Value (w/m/d) Erlangen, München
Siemens Management Consulting (SMC)-Firmenlogo
Siemens Management Consulting (SMC) Experienced Consultant PLM and R&D System Engineering (w/m/d) Erlangen, München
Siemens Management Consulting (SMC)-Firmenlogo
Siemens Management Consulting (SMC) Project Manager CRM Service Business (w/m/d) Erlangen, München
VDI Technologiezentrum GmbH-Firmenlogo
VDI Technologiezentrum GmbH Technologieberater (m/w/d) Künstliche Intelligenz Düsseldorf, Berlin

Alle IT-Consulting Jobs

Top 5 Berufsprofile