Scraping carte ou sitemap ?

Salut à tous :slight_smile:

J’aurais besoin d’un petit coup de main, je cherche à extraire toute les écoles de ce listing : Scuola in Chiaro - Cerca le scuole, esamina e confronta le loro caratteristiche

J’aimerais savoir si quelqu’un saurait me faire accéder déjà à la liste des URl de chaque établissement, pour ensuite les scraper tranquillement :slight_smile:

merci par avance pour le coup de main :slight_smile:

bonjour, j’ai pas trouvé de sitemap pas contre si on utilise la map, c’est une requete ajax qui renvoie un json, on peut modifier les paramètres à la main pour faire une recherche sur un rayon de … 10 000km par exemple, ce qui renvoie tous les établissements, après faut connaitre un peu le json pour en extraire les urls ou directement les infos qu’il te faut

Effectivement je suis en pleine apprentissage autour du JSON donc un peu « hors » de mes compétences.

Mais je serais très curieux déjà de savoir comment tu fais pour modifier à la main les paramètre de la map pour avoir le rayon de 10.000 km par exemple !
Ça me permet d’avoir la première étape :slight_smile:

Je dois avouer que je gère pas très bien les map :wink:

Salut,

Passe par ce lien tu as 55 829 liens.

https://cercalatuascuola.istruzione.it/cercalatuascuola/ricerca/risultati?codiceRegione=&codiceOrdine=&radioBiennioTriennio=Biennio&denominazione=&codMecc=&tipoRicerca=AVANZATA&gidf=1

Quand vous avez des cartes avec un listing derrière lancer une recherche sans aucun critère généralement ça marche sinon il faut passer par les XHR sur la console chrome.

2 « J'aime »

Gracias :wink:

Juste tu fais comment quand tu passes pas les XHR ? Sur ce cas par exemple :slight_smile:

1 « J'aime »

effectivement dans ce cas si on ne met aucun paramètre on récupère tous les résultats. Pour y arriver il faut maitriser un peu le fonctionnement d’un site web dynamique et la console développeur firefox ou chrome (ou edge), (bouton F12 en général) onglet réseau/network

2 « J'aime »

Exact @DJousto !

Sur ce site lorsqu’on regarde les requêtes envoyés du site au serveur et on remarque qu’ils utilisent l’API de Google Maps pour afficher les points avec l’URL : maps.google.apis.com/$rpc/google.internal etc etc

Et tu joues avec ce endpoint pour afficher les coordonnées et les universités

1 « J'aime »