Tuto scraping avec Chromium headless + Puppeteer ou Python

Je viens de tomber sur cet article sympa, pour ceux maîtrisant Javascript et Nodejs, et qui souhaitent s’initier au Headless Scraping:

9 « J'aime »

Un second tuto, utilisant exactement les mêmes technos/libs, mais d’un niveau nettement plus débutant et accessible:

https://codeburst.io/a-guide-to-automating-scraping-the-web-with-javascript-chrome-puppeteer-node-js-b18efb9e9921

2 « J'aime »

Une petite entorse au titre de ce post, pour les adeptes de Python, j’ai trouvé ce tuto:

https://hackernoon.com/30-minute-python-web-scraper-39d6d038e5da

2 « J'aime »

Re-ouverture de ce post , avec à nouveau un tuto scraping avec Python:

3 « J'aime »

Merci je vais allez voir ca !

Pour ceux souhaitant s’initier au dev scraping (non headless), de nouveaux articles trouvés:

https://blog.bitsrc.io/https-blog-bitsrc-io-how-to-perform-web-scraping-using-node-js-5a96203cb7cb

https://towardsdatascience.com/how-to-web-scrape-with-python-in-4-minutes-bc49186a8460

Attention toutefois aux titres du genre « blabla…en 4 minutes », évidemment ça prend beaucoup plus de temps :slight_smile:

1 « J'aime »

Un tuto Scraping avec Nodejs + Puppeteer, vraiment concis, clair, et en FRANCAIS :slight_smile:

(Merci @corgan56, je me permets d’inclure ce tuto à la liste dans ce topic)

2 « J'aime »

Bonjour, merci à vous

Parmis ceux ci est ce quil y en a un pour scrape Google maps ? sinon vous en connaissez bon, gratuit ou payant ?

Je suggère que tu poses ta question dans un sujet à part, dédié à ta problématique, car là c’est mélangé avec un post consacré aux tutoriaux de scraping avec Python ou Puppeteer :slight_smile:

J’ai sans doute mal formulé ma question désolé. Je nai pas encore trouve ce que je cherchais, mais jai lu les tutos et je suis tombé sur qui me sera autant utile.

Une introduction au Web Scraping avec Puppeteer:

Un petit tuto scraping de Youtube avec Nodejs + Puppeteer et Google Cloud Vision API pour extraire du texte à partir de screenshots de vidéos:

Un petit résumé concis de plusieurs techniques de scraping, pour un public dev:

Autre tuto pour du scraping avec Python:

1 « J'aime »

Un article récent pour ceux qui souhaitent s’initier au scraping avec Node.js + Headless Chrome via Puppeteer:

2 « J'aime »

Merci @ScrapingExpert !

1 « J'aime »

Un article vraiment sympa sur comment automatiser la génération de factures à partir d’une interface web, avec Puppeteer:

Dans la même veine que l’article précédent:

Puppeteer dans le contexte AWS Lambda