PräsenzBerufsbegleitend
Komplettüberblick Python-Bibliotheken für Machine Learning und Data Science
infofeld GmbH infofeld GmbH Wiesenstraße 1, 91757 Treuchtlingen
Beschreibung
Modul 01: Einstieg in das Python-Ökosystem
- Überblick: Python für Data Science – Stack und Architektur
- Wichtige Tools: Anaconda, JupyterLab, VS Code, pip, conda
- Einführung in notebook, script, virtualenv
- Praxis: Umgebung aufsetzen & erstes Beispielprojekt
Modul 02: Datenanalyse mit pandas, NumPy und polars - Daten laden, bereinigen und transformieren (pandas) - High-Performance-Tabellen mit polars - Mathematische Operationen und Arrays mit NumPy - Praxis: Vergleich von pandas und polars an einem Datensatz
Modul 03: Datenvisualisierung mit Matplotlib, Seaborn, Plotly und Altair - Grundlagen statischer vs. interaktiver Visualisierung - Komplexe Diagramme mit Seaborn und Matplotlib - Interaktive Dashboards mit Plotly, deklarative Plots mit Altair - Praxis: Visual Analytics zu einem explorativen Datensatz
Modul 04: Feature Engineering & Datenvorbereitung - Feature-Auswahl mit sklearn.feature_selection - Datenaufbereitung mit sklearn.preprocessing, category_encoders - Pipeline-Building mit sklearn.pipeline - Praxis: Vorbereitung eines Datensatzes für ML
Modul 05: Klassifikation & Regression mit Scikit-learn - Klassifikation mit RandomForestClassifier, SVC, LogisticRegression - Regression mit LinearRegression, GradientBoostingRegressor - Modellvergleich mit cross_val_score und GridSearchCV - Praxis: Klassifikator für Kundensegmentierung
Modul 06: Modellinterpretation & Explainable AI - Modellmetriken: confusion_matrix, roc_auc_score, precision_recall - Interpretierbarkeit mit SHAP, LIME, eli5 - Visualisierung der Entscheidungslogik - Praxis: Interpretation eines Black-Box-Modells
Modul 07: Clustering, Dimensionalität & Anomalieerkennung - Clustering mit KMeans, DBSCAN aus Scikit-learn - Dimensionsreduktion mit PCA, UMAP, t-SNE - Anomalieerkennung mit IsolationForest, OneClassSVM - Praxis: Analyse von Kundendaten
Modul 08: Zeitreihenanalyse mit statsmodels, Prophet und tsfresh - Klassische Zeitreihenmodelle (ARIMA, SARIMA, Exponential Smoothing) - Forecasting mit Facebook Prophet - Feature-Engineering für Zeitreihen mit tsfresh - Praxis: Prognose von Energie- oder Verkaufsdaten
Modul 09: Einstieg in Deep Learning mit TensorFlow, Keras & PyTorch - Überblick über neuronale Netze & Frameworks - Modellierung in Keras (Sequential API) - Erste Schritte in PyTorch – Tensors, Modelle, Training - Praxis: Hands-on mit Bild- oder Textdaten
Modul 02: Datenanalyse mit pandas, NumPy und polars - Daten laden, bereinigen und transformieren (pandas) - High-Performance-Tabellen mit polars - Mathematische Operationen und Arrays mit NumPy - Praxis: Vergleich von pandas und polars an einem Datensatz
Modul 03: Datenvisualisierung mit Matplotlib, Seaborn, Plotly und Altair - Grundlagen statischer vs. interaktiver Visualisierung - Komplexe Diagramme mit Seaborn und Matplotlib - Interaktive Dashboards mit Plotly, deklarative Plots mit Altair - Praxis: Visual Analytics zu einem explorativen Datensatz
Modul 04: Feature Engineering & Datenvorbereitung - Feature-Auswahl mit sklearn.feature_selection - Datenaufbereitung mit sklearn.preprocessing, category_encoders - Pipeline-Building mit sklearn.pipeline - Praxis: Vorbereitung eines Datensatzes für ML
Modul 05: Klassifikation & Regression mit Scikit-learn - Klassifikation mit RandomForestClassifier, SVC, LogisticRegression - Regression mit LinearRegression, GradientBoostingRegressor - Modellvergleich mit cross_val_score und GridSearchCV - Praxis: Klassifikator für Kundensegmentierung
Modul 06: Modellinterpretation & Explainable AI - Modellmetriken: confusion_matrix, roc_auc_score, precision_recall - Interpretierbarkeit mit SHAP, LIME, eli5 - Visualisierung der Entscheidungslogik - Praxis: Interpretation eines Black-Box-Modells
Modul 07: Clustering, Dimensionalität & Anomalieerkennung - Clustering mit KMeans, DBSCAN aus Scikit-learn - Dimensionsreduktion mit PCA, UMAP, t-SNE - Anomalieerkennung mit IsolationForest, OneClassSVM - Praxis: Analyse von Kundendaten
Modul 08: Zeitreihenanalyse mit statsmodels, Prophet und tsfresh - Klassische Zeitreihenmodelle (ARIMA, SARIMA, Exponential Smoothing) - Forecasting mit Facebook Prophet - Feature-Engineering für Zeitreihen mit tsfresh - Praxis: Prognose von Energie- oder Verkaufsdaten
Modul 09: Einstieg in Deep Learning mit TensorFlow, Keras & PyTorch - Überblick über neuronale Netze & Frameworks - Modellierung in Keras (Sequential API) - Erste Schritte in PyTorch – Tensors, Modelle, Training - Praxis: Hands-on mit Bild- oder Textdaten