Scraping mail des structures

Bonjour,

Est il possible de récupérer les adresses mails des structures sur ce site sans (trop de ) codage? (Je n’ai aucune notion de codage. )
http://www.orientation-paysdelaloire.fr/

Merci à vous

Hello,

Sans codage cela me semble compliqué, pas certain qu’un outil tel que Import.io gère bien ce type de site avec structure utilisant intensivement le Javascript.

Concernant les structures pour lesquelles récupérer les informations, est ce qu’il s’agit bien de la liste des organismes de formation ?

plutot les lieux d’information et insertion (mission locale, cio, apec, pole emploi, cap emploi etc…)

Où est la page correspondant à la recherche/liste de résultats pour ces structures?

Tu coches les cases à gauche sur la page et ça apparaît sur la carte. Je crois qu’il n’y a pas de liste. C’est bloquant ?

Pour la section " S’informer sur son territoire ", en cochant toutes les rubriques sur la gauche pour « Lieux d’information », on obtient une carte sur la droite qui est mise à jour avec des pointeurs sur les endroits où sont localisés les divers organismes, et sur lesquels il faudra cliquer pour voir l’info souhaitée.

Autant dire que là, les solutions d’extraction de données standards en SaaS ne pourront rien faire, il faut du scraping personnalisé avec codage.

La technique à adopter ici est de rejouer la requête HTTP en POST qui est générée suite à la sélection des rubriques sur la gauche, et de traiter la réponse de cette requête, retournée en JSON via un bout de code Jascript, parser cette réponse, et en extraire toutes les infos que l’on veut :slight_smile: