PräsenzNicht BerufsbegleitendPreis: 16.200,00 €
Datenwissenschaftler: Datenoptimierung und Ensemble-Methoden
neuefische GmbH Ritterstraße 12-14, 10969 Berlin
Beschreibung
Datenwissenschaftler: Datenoptimierung und Ensemble-Methoden
Diese Schulung soll ein tiefgreifendes Verständnis der grundlegenden Konzepte und fortgeschrittenen Techniken vermitteln, die für Datenwissenschaft und -analyse erforderlich sind. Sie vermittelt Kenntnisse in Datenwissenschaft, maschinellem Lernen (ML), Deep Learning, Python, Datenmodellierung und Datenvisualisierung.
Einführung in die Datenwissenschaft und Python:
-Überblick über Datenwissenschaft und die Bedeutung von Optimierungstechniken bei der Erstellung effizienter Modelle
-Einführung in Python und wichtige Bibliotheken wie Scikit-Learn und NumPy zur Implementierung von Optimierungs- und Regularisierungstechniken
-Verstehen, wie Modelle des maschinellen Lernens optimiert werden können, um die Leistung zu verbessern und Überanpassung zu reduzieren
-Einrichten von Python-Umgebungen zur Anwendung von Optimierungsstrategien bei realen Datenwissenschaftsproblemen
Optimierungstechniken im maschinellen Lernen:
-Verständnis der Grundlagen der Optimierung in Machine Learning-Modellen, einschließlich Verlust- und Kostenfunktionen
-Einführung in Optimierungsalgorithmen wie Gradientenabstieg und stochastischer Gradientenabstieg
-Anpassung von Modellparametern zur Minimierung von Fehlern und Verbesserung der Vorhersagegenauigkeit
-Verwendung von Python-Bibliotheken zur Implementierung von Optimierungstechniken und zur Bewertung der Modellleistung
Regulierung zur Vermeidung von Überanpassung:
-Einführung in Regulierungsmethoden wie Lasso und Ridge zur Bekämpfung von Überanpassung in Machine Learning-Modellen
-Implementierung der L1- und L2-Regulierung in Python zur besseren Modellverallgemeinerung
-Verständnis des Kompromisses zwischen Verzerrung und Varianz beim Modelltraining
-Bewährte Verfahren zur Auswahl und Anwendung von Regularisierungstechniken zur Verbesserung der Modellrobustheit
Ensemblemethoden für eine verbesserte Modellleistung:
-Einführung in Methoden des Ensemble Learning wie Bagging, Boosting und Random Forests
-Verständnis des Konzepts der Modellaggregation zur Verbesserung der Genauigkeit und Reduzierung der Varianz
-Implementierung von Ensemble-Techniken in Python zur Kombination mehrerer Modelle für eine bessere Leistung
-Bewertung der Effektivität von Ensemblemethoden in realen Data Science-Projekten