Impossible de scaper les mails de ce site

Bonjour,
J’essaie de scraper les mails des annonces d’un site mais impossible car ils ont crée un système vachement bien foutu.
Voici un exemple https://www.lhotellerie-restauration.fr/emploi/annonce.asp?n=_j3_355
J’ai essayé, mais impossible.
Si une personne veut bien tenter, je suis preneur !

Peace

Aucun souci, l’email est dans le code source. Tu peux utiliser scrapebox par ex , sinon cf La toolbox du growth hacker 💎

1 « J'aime »

Je l’ai eu pour un autre site de petites annonces. Ca se fait. Ce qui est cool, c’est qu’ils sont tellement sûr de leur protection qu’après ils ne le changent pas.

1 « J'aime »

Merci pour vos réponses, il est vrai que finalement c’était plus facile que je pensais pour récupérer le mail, mais je me suis heurté a un autre problème qui est de récupérer chaque lien de chaque annonce : https://www.lhotellerie-restauration.fr/emploi/serveur , la pour le coup ça me semble bien plus difficile =(

Oui c’est à cause du Javascript. J’essaye de te faire un petit screencast cet aprem.

1 « J'aime »

Hello,

Le contenu de l’annonce est mise dans la balise meta description de la page. Je ne sais pas si c’est le cas de toutes les annonces, mais tu peux creuser de ce côté là avec une regex pour parser les emails dans du contenu textuel.

Maxence.

1 « J'aime »

Ils l’ont déja changé trois fois ces trois dernières années. Je dis ça… je dis rien :innocent:

Hello @romeck,

Tu as trouvé une solution pour trouver les URL ?

Regarde ce qu’on voit en inspectant les blocs d’annonces :

Capture d’écran 2020-03-11 à 15.35.42

Je ne connais pas scrapebox, mais si tu peux récupérer tout ce qu’il y a dans le code source tel que je l’ai compris dans le message de @Camille alors aucun soucis.

Comme on le voit sur le screenshot, il suffit de récupérer le <div> avec la class ad_emploi pointer, et de récupérer ce qui se trouve entre guillements dans l’attribut onclick de ces balises.

Il suffit ensuite de le faire sur toutes les pages de recherches en jouant sur l’attribut pg de l’URL https://www.lhotellerie-restauration.fr/emploi/serveur?pg=6 (6eme page ici).

Bon courage !

1 « J'aime »

Je viens de tester, et ça fonctionne bien :wink:

  • URLs des annonces des 5 premières pages

  • Emails extraits

1 « J'aime »

Oui exactement, j’avais pas pris le temps de faire le sreencast :sweat_smile:
C’est faisable facilement avec le custom grabber de scrapebox.

1 « J'aime »