Scraper le site Senacs

Salut les GH,

J’essaye en vain de scraper les fiches du site : SENACS | Liste des Centres sociaux qui regroupe les fiches d’identité des centres sociaux et culturels.
Il y en a plus de 2.000 et en mano, c’est pas faisable …

Quelqu’un aurait-il un conseil à me donner ?

Hello,

Je viens de tester avec Instant Data Scraper et ça a l’air de bien fonctionner :slight_smile:

Il te faudra un peu retravailler la donnée dans un .csv ensuite car le parsing n’est pas parfait mais ça te sort bien les téléphones/contacts/emails et ça prend seulement quelques secondes !

Bonjour,

J’ai téléchargé toutes les données dans un csv (2285 enregistrements). Go MP si ça vous intéresse.

Bonjour @virginie22 ,

Je l’ai essayé avec octoparse (vous pouvez aussi try webscraper), voici les données que j’ai recueillies(951 pour 5 mins):

SENACA

Je lance le scraping pendant 5 mins et les exporte via excel et CSV. Si c’est ce que vous voulez, alors essayer la version gratuite de logiciels de web scraping. Je crois que ça suffit pour le site en question.

Voici le lien pour récupérer les données : Senacs | Liste des centres sociaux - Google Spreadsheets

1 « J'aime »

Merciiii @TitanX , c’est vraiment a-do-ra-ble, je n’en demandais pas tant mais un tout grand merci ! A charge de revanche …

Merci aussi à @sept et @ClementAubry pour vos conseils …

Vous êtes tous trop forts !