Bonjour !
J’aimerais trouver un moyen de scraper des garages, sur des sites similaire a celui ci :
L’idée serait de sortir une liste de tout les garages
Bonjour !
J’aimerais trouver un moyen de scraper des garages, sur des sites similaire a celui ci :
L’idée serait de sortir une liste de tout les garages
Hello, je cherche un moyen aussi, je suis très intéressé si tu trouves la solution
Pour le moment c’est par département mais ça fait long
C’est déjà ça.
Stp,tu pourrai détailler ta procédure ?
Les données sont renvoyées en JSON. Vous pouvez directement interroger cette API.
Pour avoir le maximum de résultats il faut générer les coordonnées géographiques de la position dont vous voulez avoir les garages les plus proches et les passer en paramètre de la requête.
Vous pouvez par exemple trouver les latitudes et longitudes de toutes les plus grandes villes de France, les mettre en paramètre de l’URL et faire une requête POST à l’API.
Ensuite vous parsez le JSON.
Très simple à faire en Python (en no code je n’en sais rien).
En gros je récupéré les infos par département avec instant data scraper mas ça m’oblige a faire chaque département « a la main »
D’accord merci pour ton message
Merci, comment as tu effectué la recherche ? Perso, en idf j’ai 166 garages
En interrogeant les 1000 plus grandes villes françaises et en étendant le rayon, j’ai récupéré un peu moins de 2000 garages et concessionnaires citroën.
Le fichier est disponible ici.
Sur le navigateur Mozilla:
getStoreList
https://www.citroen.fr/_/Layout_Citroen_PointsDeVente/getStoreList
lat=48.86&long=2.35&page=2634&version=132&order=4&area=150&ztid=&attribut=40&brandactivity=AC
area
sur 999 pour obtenir au maximum de résultatsmerci pour ton aide
Hello @matteoc,
Je plussoie l’approche de l’analyse du flux XHR proposée par @TitanX et @josselin, qui est le premier réflexe à avoir lorsqu’on cherche à scraper, surtout lorsque c’est une carte
Pour ce cas particulier, j’ai une autre solution: passer par le sitemap via l’url https://reseau.citroen.fr/sitemap
Tu récupères tous les liens et filtre ceux contenant /reparateur-
qui sont les URLs des garages.
Un coup de scraping avec un plugin gratuit comme webscraper.io et c’est réglé
Hello les GH,
le sitemap ne fonctione pas :‹ (
j’ai test https://reseau.citroen.fr/sitemap
https://reseau.citroen.fr/sitemap.xml
https://reseau.citroen.fr/sitemap_index.xml
dans le robots.txt il y a rien : ›(
pls help me
Salut, https://clay.com te permet de faire ça très rapidement grâce à leur extension chrome.
N’hésite pas à me contacter si tu as besoin d’aide pour le prendre en main.