PräsenzBerufsbegleitendFörderfähigPreis: 2.415,70 €*

Web Scraping mittels Python und Scrapy-Selenium (Online)

GFU Cyrus AG

Beschreibung

Web Scraping ist der Prozess des Sammelns von Informationen aus dem Internet. Der Begriff "Web Scraping" bezieht sich in der Regel auf einen Prozess, der Automatisierung beinhaltet. Manche Websites mögen es nicht, wenn automatische Scraper ihre Daten sammeln, während es anderen nichts ausmacht. Python ist vor allem als die beste Web-Scraper-Sprache bekannt. Sie ist ein Allrounder und kann die meisten Prozesse im Zusammenhang mit dem Crawling von Webseiten reibungslos abwickeln. Beautiful Soup ist eines der am weitesten verbreiteten Frameworks, das auf Python basiert und das Scrapen mit dieser Sprache zu einem einfachen Weg macht. Im Allgemeinen ist Selenium als Open-Source-Testframework für Webanwendungen bekannt. Es ermöglicht QA-Spezialisten die Durchführung automatisierter Tests, die Ausführung von Playbacks und die Implementierung von Fernsteuerungsfunktionen (die viele Browserinstanzen für Lasttests und mehrere Browsertypen ermöglichen). Es gibt eine Selenium-Bibliothek für Python. Dies ermöglicht, einen "Browser" - Chrome, Firefox, IE, etc. zu instanziieren. Scrapy ist ein Python-Framework, das es Ihnen ermöglicht, HTML-Seiten  zu crawlen. Es ist zwar schnell, effizient und einfach zu bedienen, aber es erlaubt Ihnen nicht, JavaScript-lastige Websites zu crawlen, die Frameworks wie React verwenden. Selenium hingegen ist ein Tool für automatisierte Tests, das nicht für das Scraping entwickelt wurde, aber es kann das Scraping von Websites erleichtern, bei denen Scrapy versagt. Daher ist eine Zusammenlegung der beiden eine Option, die man in Betracht ziehen sollte. Buchtipp:https://yanfei.site/docs/dpsa/references/PyWebScrapingBook.pdf [https://yanfei.site/docs/dpsa/references/PyWebScrapingBook.pdf] [https://yanfei.site/docs/dpsa/references/PyWebScrapingBook.pdf]
Hinweis zum Ablauf
Garantierte Durchführung ab 1 Teilnehmenden
Zielgruppe
Marketingleute, die fremde Seiten analysieren und evtl. eigene Seiten gegen Bots schützen wollen.
Zielsetzung
Nach Abschluss dieses Workshops verfügen Sie über ein solides Modell der HTML-Struktur, sind in der Lage, Tools zum Parsen von HTML-Code und zum Abrufen der gewünschten Informationen zu entwickeln und einen einfachen Scrapy-Spider zu erstellen, um das Web oder einzelne URLs in großem Umfang zu crawlen.
Hinweis für Menschen mit Behinderungen
Das Schulungszentrum ist barrierefrei, die Schulungen werden auch als Online-Schulung angeboten.
Hinweise zur Prüfung und Zertifikat/Abschluss
Teilnahmebescheinigung und digitales Badge nach dem Kurs
Förderungsmöglichkeiten
Bildungsscheck NRW
Preishinweis
Preis inkl. MwSt. Preisvorteil 3=2: Der Dritte Mitarbeitende nimmt kostenfrei teil.
Top