PräsenzBerufsbegleitendFörderfähigPreis: 2.415,70 €*
Web Scraping mittels Python und Scrapy-Selenium (Online)
GFU Cyrus AG
Beschreibung
Web Scraping ist der Prozess des Sammelns von Informationen aus dem
Internet. Der Begriff "Web Scraping" bezieht sich in der Regel auf einen
Prozess, der Automatisierung beinhaltet. Manche Websites mögen es nicht,
wenn automatische Scraper ihre Daten sammeln, während es anderen nichts
ausmacht.
Python ist vor allem als die beste Web-Scraper-Sprache bekannt. Sie ist ein
Allrounder und kann die meisten Prozesse im Zusammenhang mit dem Crawling
von Webseiten reibungslos abwickeln. Beautiful Soup ist eines der am
weitesten verbreiteten Frameworks, das auf Python basiert und das Scrapen
mit dieser Sprache zu einem einfachen Weg macht.
Im Allgemeinen ist Selenium als Open-Source-Testframework für
Webanwendungen bekannt. Es ermöglicht QA-Spezialisten die Durchführung
automatisierter Tests, die Ausführung von Playbacks und die Implementierung
von Fernsteuerungsfunktionen (die viele Browserinstanzen für Lasttests und
mehrere Browsertypen ermöglichen). Es gibt eine Selenium-Bibliothek für
Python. Dies ermöglicht, einen "Browser" - Chrome, Firefox, IE, etc. zu
instanziieren.
Scrapy ist ein Python-Framework, das es Ihnen ermöglicht, HTML-Seiten zu
crawlen. Es ist zwar schnell, effizient und einfach zu bedienen, aber es
erlaubt Ihnen nicht, JavaScript-lastige Websites zu crawlen, die Frameworks
wie React verwenden. Selenium hingegen ist ein Tool für automatisierte
Tests, das nicht für das Scraping entwickelt wurde, aber es kann das
Scraping von Websites erleichtern, bei denen Scrapy versagt. Daher ist eine
Zusammenlegung der beiden eine Option, die man in Betracht ziehen sollte.
Buchtipp:https://yanfei.site/docs/dpsa/references/PyWebScrapingBook.pdf
[https://yanfei.site/docs/dpsa/references/PyWebScrapingBook.pdf]
[https://yanfei.site/docs/dpsa/references/PyWebScrapingBook.pdf]