Scrapping annuaire/fédération de professionnel

Hello tout le monde, je me forme depuis peu au web scrapping via Octoparse principalement.

Je m’entraîne principalement sur des sites de foires, annuaires ou fédérations qui regroupent un grand nombre de pros avec pas mal de données de contacts. Tout se passe relativement bien pour la plupart des sites mais je suis tombé sur un sacré morceau et je n’arrive pas à en venir à bout. Je me tourne vers vous pour voir si vous avez des idées ou même si vous savez s’il est simplement faisable de le scrap en no-code.

Voici la bête : Annuaire des artisans, des sociétés et des entreprises du bâtiment et des TP : FFB

Merci pour votre aide précieuse ! A bientôt :slight_smile:

2 « J'aime »

Salut !

Est-ce que tu as trouvé un moyen de scrapper cette bdd ?

À plus :blush:

Salut HenriB
Avec octoparse je ne sais pas, mais ma boite l’a scrapé avec puppeteer stealth, il n’y a pas de difficulté.

Si tu veux commencer encore plus simple tu as celui ci :

y’a le sitemap , c’est du gateau, 5 min chrono

1 « J'aime »

Bonjour !
J’ai fait un petit essai avec octoparse, ça marche bien avec moi

1 « J'aime »

Bonjour Arnaud,
intéressé pour mettre en place ce scraping via octoparse sur l’annuaire des artisans, des sociétés FFB

1 « J'aime »

Bonjour Arnaud,
intéressé pour mettre en place ce scraping via octoparse sur l’annuaire des artisans, des sociétés FFB

1 « J'aime »

Sur Octoparse ce que je fais dans des cas comme celui-là c’est que je prends la base de l’url et je CONCAT avec un google sheet pour simuler par exemple :

  • url pour chaque ville
  • url pour chaque métier

et j’envoi cela dans Octoparse pour scraper