Scraping magasins Carrefour

Hola todos,

Je suis sur un sujet de récupération d’un listing des magasins Carrefour + le d’infos possibles sur chaque magasin.

On à une map sur le site qui recense tous les magasins et dans les requêtes j’ai toutes les infos qui m’intéressent :

A savoir :

  • store id
  • name
  • address
  • contact
  • user_properties

Malheureusement, je ne trouve pas de moyen que tous les magasins soient affichés en requête dans le navigateur pour extraire ça.

Avez-vous des idées à me suggérer sur la manière de procéder ?

Merci !

Salut,

check cette requête :

curl 'https://api.woosmap.com/stores/search?key=woos-26fe76aa-ff24-3255-b25b-e1bde7b7a683&lat=45.371420&lng=4.3727410&max_distance=5000&stores_by_page=40&limit=40&page=1&query=(user.banner%3A%22CARREFOUR%22%20OR%20(user.banner%3A%22CARREFOUR%20MARKET%22%20OR%20user.banner%3A%22MARKET%22)%20OR%20user.banner%3A%22CARREFOUR%20CONTACT%22%20OR%20user.banner%3A%22CARREFOUR%20CITY%22%20OR%20user.banner%3A%22CARREFOUR%20EXPRESS%22%20OR%20user.banner%3A%22CARREFOUR%20MONTAGNE%22%20OR%20user.banner%3A%22BON%20APP%22)' \
  -H 'accept: */*' \
  -H 'accept-language: fr-FR,fr;q=0.9,en-US;q=0.8,en;q=0.7' \
  -H 'cache-control: no-cache' \
  -H 'origin: https://www.carrefour.fr' \
  -H 'pragma: no-cache' \
  -H 'priority: u=1, i' \
  -H 'referer: https://www.carrefour.fr/' \
  -H 'sec-ch-ua: "Not A(Brand";v="8", "Chromium";v="132", "Google Chrome";v="132"' \
  -H 'sec-ch-ua-mobile: ?0' \
  -H 'sec-ch-ua-platform: "macOS"' \
  -H 'sec-fetch-dest: empty' \
  -H 'sec-fetch-mode: cors' \
  -H 'sec-fetch-site: cross-site' \
  -H 'user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.0.0 Safari/537.36'

En modifiant les paramètres (notamment stores_by_page=40, limit=40, max_distance=5000 ou alors le page=1) tu devrais pouvoir tout récupérer.

Salut Paul,

Yes j’ai déjà pensé à cette solution + essayé mais je n’ai pas l’accès à l’api :confused:

Capture d’écran 2025-01-31 à 17.16.44

Il faut très probablement ajouter un header referer correct à la requête, on ne peut pas y accéder en cliquant juste sur le lien.

Edit : je viens de capter que c’est noté dans le detail de la réponse en plus
image

Ok, je galère un peu dès lors que ça devient un peu plus technique, je vais essayer de me débrouiller avec tes réponses + du GPT, merci!

J’arrive à générer du resultat sur Postman mais pas tous les résultats.

Le pb > je ne peux afficher que 300 stores par page mais il n’y a qu’une page.

J’essaye de jouer avec les coordonnées géo pour couvrir toute la france mais ça semble pas fonctionner.

Tu as une idée pour que je puisse avancer ?

Merci

Cool. Modifie la pagination maintenant : page=2 et ainsi de suite !
Pour les coordonnées, je prendrais celles du centre de la France et je jouerai sur le max_distance pour étendre la zone de recherche.

Parfait j’ai réussi.

Et au passage gagné un peu de compétence sur le sujet de l’appel en requêtes, merci Paul :call_me_hand:

1 « J'aime »