PräsenzBerufsbegleitend

Komplettüberblick Python-Bibliotheken für Machine Learning und Data Science

infofeld GmbH infofeld GmbH Wiesenstraße 1, 91757 Treuchtlingen

Beschreibung

Modul 01: Einstieg in das Python-Ökosystem - Überblick: Python für Data Science – Stack und Architektur - Wichtige Tools: Anaconda, JupyterLab, VS Code, pip, conda - Einführung in notebook, script, virtualenv - Praxis: Umgebung aufsetzen & erstes Beispielprojekt
Modul 02: Datenanalyse mit pandas, NumPy und polars - Daten laden, bereinigen und transformieren (pandas) - High-Performance-Tabellen mit polars - Mathematische Operationen und Arrays mit NumPy - Praxis: Vergleich von pandas und polars an einem Datensatz
Modul 03: Datenvisualisierung mit Matplotlib, Seaborn, Plotly und Altair - Grundlagen statischer vs. interaktiver Visualisierung - Komplexe Diagramme mit Seaborn und Matplotlib - Interaktive Dashboards mit Plotly, deklarative Plots mit Altair - Praxis: Visual Analytics zu einem explorativen Datensatz
Modul 04: Feature Engineering & Datenvorbereitung - Feature-Auswahl mit sklearn.feature_selection - Datenaufbereitung mit sklearn.preprocessing, category_encoders - Pipeline-Building mit sklearn.pipeline - Praxis: Vorbereitung eines Datensatzes für ML
Modul 05: Klassifikation & Regression mit Scikit-learn - Klassifikation mit RandomForestClassifier, SVC, LogisticRegression - Regression mit LinearRegression, GradientBoostingRegressor - Modellvergleich mit cross_val_score und GridSearchCV - Praxis: Klassifikator für Kundensegmentierung
Modul 06: Modellinterpretation & Explainable AI - Modellmetriken: confusion_matrix, roc_auc_score, precision_recall - Interpretierbarkeit mit SHAP, LIME, eli5 - Visualisierung der Entscheidungslogik - Praxis: Interpretation eines Black-Box-Modells
Modul 07: Clustering, Dimensionalität & Anomalieerkennung - Clustering mit KMeans, DBSCAN aus Scikit-learn - Dimensionsreduktion mit PCA, UMAP, t-SNE - Anomalieerkennung mit IsolationForest, OneClassSVM - Praxis: Analyse von Kundendaten
Modul 08: Zeitreihenanalyse mit statsmodels, Prophet und tsfresh - Klassische Zeitreihenmodelle (ARIMA, SARIMA, Exponential Smoothing) - Forecasting mit Facebook Prophet - Feature-Engineering für Zeitreihen mit tsfresh - Praxis: Prognose von Energie- oder Verkaufsdaten
Modul 09: Einstieg in Deep Learning mit TensorFlow, Keras & PyTorch - Überblick über neuronale Netze & Frameworks - Modellierung in Keras (Sequential API) - Erste Schritte in PyTorch – Tensors, Modelle, Training - Praxis: Hands-on mit Bild- oder Textdaten

Hinweis zum Ablauf

Trainer: Diplom-Informatiker (Univ.) mit Schwerpunkt KI, langjähriger Branchen- und Projekterfahrung

Zielgruppe

Die Schulung richtet sich an Datenanalyst:innen, Data Scientists, Machine Learning Engineers, Softwareentwickler:innen und technisch versierte Fachkräfte, die sich einen fundierten Überblick über die wichtigsten Python-Bibliotheken für Machine Learning und Data Science verschaffen möchten.

Hinweise zur Prüfung und Zertifikat/Abschluss

Teilnahmezertifikat und digitales Badge

Förderungsmöglichkeiten

Teilnahmevorraussetzungen

Grundkenntnisse in Python und grundlegendes Verständnis von Statistik und maschinellem Lernen werden vorausgesetzt. Erfahrungen mit Jupyter Notebooks und der Arbeit mit Daten (z. B. aus Excel, SQL oder CSV) sind hilfreich, aber nicht zwingend erforderlich.

Preishinweis

Durchführungskosten abhängig von der Anzahl der Teilnehmer