Je viens de tester rapidement et en mode « bourrin », tu peux faire via Google un « site: » avec l’URL du site jusqu’a « resultat-de-recherche » + « Mail : », Scrapper le title, l’URL & la description , ouvrir le résultat dans un spreadsheet puis mettre des règles pour exporter le nom (facile, c’est dans le title), et exporter le mail et le téléphone (dans la description) via des formules.
Si tu ne vois pas tous les liens à l’écran c’est juste que c’est masqué et paginé par JavaScript, mais du coup tu pourras très facilement gérer ce site avec WebScraper, sans prise de tête !
google ne sort pas tout les résultats, il y a 45000 non rge et 74000 rge à peut près et le sitemap ne contiens pas les urls des fiches artisant. Le plus simple c’est de récupérer les corps de métiers de qualibat et de scrappé par code postal
il sont mis en noindex les résultats de recherche et sortie de leur sitemap XML les pages concernées… faut donc maintenant crawler le site je pense, il ont peut etre refait une versiond e site ausii