Scraping annuaire bâtiment

Bonjour, je souhaite scraper les mails présents sur site : Les prescripteurs - D'architectures

Éventuellement les trier par typologie de métier et zone géographique

Des idées de la façon dont je pourrais procéder ?

Merci et bonne journée

Bonsoir, je ne voie aucune difficulté, après çà dépends quels outils tu maitrises, si la réponse est aucun … il faut commencer par là, choisir un outil, personnellement je n’utilise aucun outil du genre plugin navigateur, je mets moins de temps à coder un script, pour ce site il suffit de

  • récupérer les pages de résultats (faire varier l’url de 1 à 1502)
  • sur chaque page récupérer les urls « prescripteurs »
  • récupérer chaque page (url prescripteur) et pour chaque page chercher les infos dans le HTML, c’est là la principale difficulté car les données ne sont pas tagguées (pas de metadata), donc il faut se débrouiller pour reconnaitre les champs email, code postal etc …

Hello Yjdt !
Pour retirer juste les mail et en avoir une liste il y a plusieurs façon de faire.
Je n’y connais rien en code ducoup j’utiliserai une extension pour ça, par exemple web scrapper.. Faut comprendre comment il fonctionne au début mais une fois que c’est ok (il existe des vidéos tutos).

Il va te permettre d’automatiser la récupération de mail ligne par ligne assez rapidement, avec les noms, la typologie, l’adresse ect… (et tu pourras faire d’autre chose en attendant) ^^

Si tu as des question sur comment le set up je peux t’aider.

Sinon

Oui effectivement je n’ai pas/peu de compétences sur le sujet.

Je vais me pencher sur Web Scraper

Pour information, si quelqu’un ayant les compétences souhaite me faire une proposition pour effectuer ce scraping contre rémunération, je suis ouvert !

Bonne journée à tous