Hello tout le monde,
Voici le site que je souhaite scraper : Toutes les villes de France
Il s’agit des communes de France.
Sur chaque page, il y a une liste de communes. J’ai besoin de récupérer l’ensemble des noms des communes, puis aller chercher des infos dans la fiche de chaque commune.
Des pages, il y en a… Sauf que premier soucis : il n’y a pas la page finale indiqué. Juste " suivant"… J’ai vu un tutoriel où il y avait les pages comme tel : 1.2…25. Donc Webscraper comprenait qu’il y avait des pages entre la 2 et la 25ème. Ce n’est pas le cas ici.
Une fois sur la fiche d’une Mairie, j’ai besoin d’aller dans 2 sous-catégories de la colonne de gauche .
1/ : Contact et horaires d'ouverture de la mairie de l'Abergement-Clémenciat (01400)
je dois y récupérer le nom du Maire, l’adresse postale de la Mairie, le tel, l’adresse mail…
2/ : Population de l'Abergement-Clémenciat (01400)
je dois y récupérer le nombre d’habitant.
J’ai vraiment essayé plusieurs fois mais sans succès. J’arrive pas à gérer la façon dont les infos sont organisées ( je suis en plus un peu novice).
Pour info, voilà ce que j’avais paramétré comme arborescence :
1 : link pages
2 : link nom commune
3 : une fois sur la fiche d’une commune : link mairie de … ( colonne de gauche de la fiche de la commune)
4 : text pour nom du maire
5 : text pour adresse postal
6 : text pour tel / mail…
7 : link population ( colonne de gauche)
8 : text pour nombre d’habitant de la commune
Cela ne fonctionne pas…
Un grand merci de votre aide.
Pierre