Fraunhofer-Personenzertifizierungsstelle

Data Scientist Specialized in Big Data Analytics

Zertifizierung nach ISO 17024 | Nicht-akkreditierter Bereich

Diese Prüfung schließt an die Angebote »Data Scientist Basic Level« und »Data Scientist Specialized in Data Analytics« an. 

Das Zertifikat bescheinigt den Absolventen relevantes innovatives Praxiswissen und nachgewiesene Kompetenz.

Zielgruppe: Analysten, die ihre Fähigkeiten zur Auswertung von großen Datenbeständen ausweiten möchten.Softwareentwickler/-architekten, die Systeme mit analytischen Fragestellungen entwickeln.

Prüfungsinhalte

  • Einbettung von Modellerstellung- und Anwendung in eine Big Data Architektur
    • Herausforderungen von Big Data für die Datenanalyse
    • Aufbau eines Empfehlungssystems
    • Data Understanding und Feature-Erzeugung für die Analyse großer Datenmengen 
    • Modellentwicklung und -anwendung in Big-Data-Umgebungen
    • Analyse von Datenströmen
  • Datenanalyse mit Spark
    • Spark und PySpark
    • Lineare Regression mit Spark
    • Die Spark Maschine Learning Library
    • Datenanalyse mit Spark und Python
    • Graphische Workflows zur Datenanalyse mit Spark
    • Big Data Algorithmen: Locality Sensitive Hashing und Anwendungen
  • Fortgeschrittene Methoden, Werkzeuge und Deployment
    • Deployment: Abspeichern, Laden von Modellen in PMML und Spark
    • Einsatz von Spark Feature-Generation, Spark Pipelines und Spark Streaming
    • Fortgeschrittene Analystetechniken in Spark (Training-Test Dataset, Optimization, Cross-Validation, Ensemble Methods, Pipelines)
    • Erkennung komplexer Ereignisse für die Betrugserkennung komplex Event Processing
    • Massiv Parallele Datenbanken
  • Praktische Anwendung fortgeschrittener Analysemethoden mit PySpark
    • Data verstehen, aufbereiten
    • Erzeugen von Features 
    • Spark Machine Learning Library Pipelines
    • Big Data Algorithmen