J’essaye en vain de scraper les fiches du site : SENACS | Liste des Centres sociaux qui regroupe les fiches d’identité des centres sociaux et culturels.
Il y en a plus de 2.000 et en mano, c’est pas faisable …
Il te faudra un peu retravailler la donnée dans un .csv ensuite car le parsing n’est pas parfait mais ça te sort bien les téléphones/contacts/emails et ça prend seulement quelques secondes !
Je l’ai essayé avec octoparse (vous pouvez aussi try webscraper), voici les données que j’ai recueillies(951 pour 5 mins):
Je lance le scraping pendant 5 mins et les exporte via excel et CSV. Si c’est ce que vous voulez, alors essayer la version gratuite de logiciels de web scraping. Je crois que ça suffit pour le site en question.