OnlineBerufsbegleitend
Python & Machine Learning Masterclass – konzipieren, implementieren, von Grund auf verstehen
infofeld GmbH
Beschreibung
Modul 01: Python Crashkurs
- Syntax, Datentypen, Schleifen, Bedingungen
- Funktionen, Listen, Dictionaries
- List Comprehension & Lambda-Funktionen
- Übung: Erste kleine Tools in Python
Modul 02: Python für Datenanalysen
- Einführung in pandas, numpy, datetime
- Indexing, Grouping, Aggregation
- Fehlende Werte erkennen und behandeln
- Übung: Statistische Auswertung von CSV-Daten
Modul 03: Visualisierung mit matplotlib & seaborn
- Plot-Typen und Designoptionen
- Heatmaps, Pairplots, Boxplots
- Visualisierung für Storytelling
- Übung: Visuelle Exploration eines Datensatzes
Modul 04: Datenimport & -export
- Lesen und Schreiben: CSV, Excel, JSON, SQL
- Datenbanken mit sqlite3 und SQLAlchemy
- Web Scraping mit requests und BeautifulSoup
- Übung: Webdaten abrufen und strukturieren
Modul 05: Statistik & Wahrscheinlichkeiten
- Deskriptive Statistik: Mittelwert, Median, Varianz
- Wahrscheinlichkeitsverteilungen
- Hypothesentests (t-Test, Chi²-Test)
- Übung: Statistische Analyse realer Daten
Modul 06: Einführung in Machine Learning
- Überwachtes vs. unüberwachtes Lernen
- Modellierungsprozess (Train-Test-Split, Evaluation)
- Scikit-Learn-Struktur verstehen
- Übung: Erstes Klassifikationsmodell bauen
Modul 07: Feature Engineering & Datenvorbereitung
- Feature Scaling (StandardScaler, MinMaxScaler)
- One-Hot-Encoding, Label-Encoding
- Umgang mit Ausreißern & Kategorisierung
- Übung: Vorbereitung eines Rohdatensatzes
Modul 08: Klassifikation mit scikit-learn
- k-Nearest Neighbors, Entscheidungsbaum, Naive Bayes
- Hyperparameter-Tuning mit GridSearchCV
- Cross-Validation & Pipelines
- Übung: Modellvergleich anhand eines Anwendungsfalls
Modul 09: Regressionsverfahren in der Praxis
- Lineare Regression, Ridge, Lasso
- Polynomial Regression
- Modellgüte beurteilen (R², RMSE, MAE)
- Übung: Vorhersage von Hauspreisen
Modul 10: Clustering & Segmentierung
- K-Means, DBSCAN, Hierarchisches Clustering
- Silhouettenwert, Elbow-Methode
- Visualisierung mit PCA
- Übung: Kundensegmentierung für Marketing
Modul 11: Entscheidungsbäume & Random Forests
- Baumstrukturen, Overfitting erkennen
- Random Forest: Ensembles verstehen
- Feature-Importances interpretieren
- Übung: Entscheidungsbaum mit Visualisierung
Modul 12: Neuronale Netze mit keras & tensorflow
- Einführung in Keras-API
- Aufbau eines MLP (Multi-Layer-Perceptron)
- Aktivierungsfunktionen, Optimizer
- Übung: Klassifikation von handschriftlichen Ziffern (MNIST)
Modul 13: Zeitreihenanalyse
- Zeitstempel-Daten analysieren
- Trends, Saisonalität, Moving Averages
- Prophet & ARIMA-Modelle
- Übung: Prognose von Verkaufszahlen
Modul 14: Natural Language Processing (NLP)
- Textdaten vorbereiten (Tokenisierung, Stemming)
- TF-IDF, Bag-of-Words
- Textklassifikation (z. B. Spamfilter)
- Übung: Sentiment-Analyse von Kundenfeedback
Modul 15: Abschlussprojekt & Best Practices
- Von Rohdaten bis Deployment (End-to-End-Projekt)
- Versionskontrolle mit Git, Modellexport mit joblib
- Fehlervermeidung, Fairness & Ethik in ML
- Präsentation der Projektideen im Plenum