Scraper emails d'un arrondissement parisien

Bonjour à tous,

Pour un de mes clients, on cherche à scraper les emails de particuliers dans le 16ème arrondissement. A part acheter une base de données, vous avez des idées où je pourrais trouver des adresses ?

Merci pour vos lumières.

J

Bonjour Julien,

Si tu sais un peu coder, tu peux collecter les description des offres dans le 75016 sur leboncoin,
et collecter les mails quand ils sont dans la description, ou

  • Automatiquement envoyer un message depuis la messagerie leboncoin
  • Collecter les téléphones et faire du push SMS

https://www.leboncoin.fr/recherche/?cities=Paris_75016

Mais je ne sais pas si c’est très RGPD tout ça… :sweat_smile:

Au vu du très faible nombre d’adresses emails présentes dans les descriptions des annonces (ce qui ne serait pas dans l’intérêt du site qui préfère qu’on passe par leur messagerie), collecter les emails ne semblent pas être une bonne option.

Quant à automatiser l’envoi de messages depuis leur messagerie ou récupérer les num de tel, ils sont surprotégés de ce côté là… si quelqu’un à la solution ? :slight_smile:

@ScrapingExpert, surprotégés ? je n’en suis pas si sûr :blush:

Certain, nous sommes nombreux à s’être cassés les dents sur ces protections. Je ne dis pas que c’est impossible, mais difficile…

As-tu réussis à automatiser l’envoi de messages en masse en utilisant des centaines/milliers d’adresses emails légitimes, associés chacune à une adresse IP unique? Même avec l’artillerie lourde, pas de résultats positifs :frowning:

Quant aux numéros de téléphone, même en faisant tourner une centaine de proxies, en automatisant le clic sur le bouton « voir numéro » ou en envoyant la requête correspondante, on se fait griller rapidement.

Mais si t’as des retours positifs, et des conseils à partager, nous sommes preneurs :heart_eyes:

1 « J'aime »

Hello @ScrapinExpert,

Je ne sais pas ce que tu appelles « de masse », et je n’ai pas envoyé des spams aux 40 millions d’offre de Leboncoin, mais peut-être quelque milliers… :sweat_smile:

Sans trop de problème a priori…

@ScrapingExpert, tu utilises quel framework / librairie pour collecter les données ?

Que du fait maison, soit en headless browser, soit en pure requête HTTP via divers languages qui supportent cette fonctionnalité

Yes pareil ! Si ça n’est pas indiscret, tu utilises une librairie, un langage en particulier ?

Cela dépend des situations, j’ai de vielles libs en PHP, des plus récentes en Pytho, ou Nodejs : )