etablissements scolaires

Hello,

Je suis pas ouf avec WebScrapper, ni le scrapping tout court.

Je voudrais récuperer les mails, téléphones, adresses, et sections particulières pour des collèges et lycées en france metropolitaine.

J’ai tenté sur Webscrapper, mais il ne me récupère que la derniere page, la 4eme et la 8eme (quand j’ai de la chance).

Est-ce que quelqu’un peut m’orienter sur la marche à suivre?

{« _id »:« colleges »,« startUrl »:[« Annuaire | Ministère de l'Education Nationale et de la Jeunesse page=[1-239]"],"selectors":[{"delay":0,"id":"lien-page-college","multiple":true,"parentSelectors":["_root","pagination"],"selector":"a.btn","type":"SelectorLink"},{"delay":0,"id":"Etablissement","multiple":false,"parentSelectors":["lien-page-college"],"regex":"","selector":".establishment__header__top__content h1 »,« type »:« SelectorText »},{« delay »:0,« id »:« Adresse »,« multiple »:false,« parentSelectors »:[« lien-page-college »],« regex »:«  »,« selector »:« .establishment__header__top__content__address p »,« type »:« SelectorText »},{« delay »:0,« id »:« telephone »,« multiple »:false,« parentSelectors »:[« lien-page-college »],« regex »:«  »,« selector »:« .establishment__header__top__content__gray > p:nth-of-type(1) »,« type »:« SelectorText »},{« delay »:0,« id »:« email »,« multiple »:false,« parentSelectors »:[« lien-page-college »],« regex »:«  »,« selector »:« .establishment__header__top__content__gray p a »,« type »:« SelectorText »},{« delay »:0,« id »:« website »,« multiple »:false,« parentSelectors »:[« lien-page-college »],« regex »:«  »,« selector »:« .establishment__header__top__content__site a »,« type »:« SelectorText »},{« delay »:0,« id »:« sections-particulieres »,« multiple »:false,« parentSelectors »:[« lien-page-college »],« regex »:«  »,« selector »:« .establishment__header__top__list ul »,« type »:« SelectorText »},{« delay »:0,« id »:« pagination »,« multiple »:true,« parentSelectors »:[« _root »,« pagination »],« selector »:« .pager__item a »,« type »:« SelectorLink »},{« delay »:0,« id »:« academie »,« multiple »:false,« parentSelectors »:[« lien-page-college »],« regex »:«  »,« selector »:« .academy div »,« type »:« SelectorText »}]}

MERCI :slight_smile:

Hi, le set de Annuaire de l'éducation — Éducation Nationale - Accueil est pas suffisant? ++

3 « J'aime »

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.