Scraping n° tel LBC + envoi message

Bonjour à tous ! :slight_smile:

Je viens à vous pour une petite question technique : avez-vous déjà réussi à extraire les numéros de téléphone sur LBC ? J’ai essayé divers tools et je récupère tout sauf cette info…

De plus, avez-vous déjà tenté d’envoyer en masse des messages ?

Je vous remercie par avance,
Morgan

1 « J'aime »

Message ou sms? Parce que si tu veux envoyer des messages en masse, tu vas te faire prendre par la patrouille.

Dans l’idée, mon but est de récupérer l’ensemble des numéros de téléphone et procéder à un envoi massif de SMS (là, pour le coup, pas de patrouille ! :rotating_light: ). Par contre, oui, j’imagine que si j’envoie pas mal de mails via l’interface LBC, je vais me faire prendre la main dans le sac. À moins de limiter les envois et par intervalle…

Sur LBC, les tel sont affichés via des images. Il te faudra donc un ocr pour les récupérer. Je ne sais pas si des tools te le permettent mais pour un dev ça se fait bien.
Pour les envois de masses SMS, il te faudra soit un fournisseur SMS avec une api, soit peut être le faire via un tel android.
Dans tous les cas, il te faudra surement du développement sur mesure. Il faudra mettre la main à la poche.

Quand je lis le code, je vois plutôt un bouton avec un javascript.

<button data-href="https://api.leboncoin.fr" data-listid="134548001" data-salesmen="1" data-textenabled="1" class="button-orange large phoneNumber trackable" data-info="{&quot;event_name&quot; : &quot;ad_reply::telephone::voir_le_numero&quot;, &quot;event_type&quot; : &quot;load&quot;, &quot;event_s2&quot; : &quot;4&quot;}"><i class="icon-phone icon-1-8x"></i>Voir le numéro</button>

Le javascript est une protection qui empêche de collecter automatiquement et trop facilement le numéro de téléphone.

2 « J'aime »

Ah oui t’as raison. Il me semblait que dans le passé, le site renvoyait une image avec le numéro écrit dessus (et donc facilement contournable surtout pour des numéros). Les connaissant, il doit il avoir une protection avec les paramètres envoyés.

En inspectant avec Firebug, je vois le numéro affiché :

à vérifier si certains utilisateurs pros ou payants ont une protection supplémentaire…? mais c’est récupérable en scrappant le href de ‹ < span class=« phone_number font-size-up »> ›

1 « J'aime »

J’avais repéré la même chose et je ne pense pas que les utilisateurs pros ou payants bénéficient d’une protection supplémentaire. Sachant que pour ma part, ce sont les particuliers qui m’intéressent.

Tu connais un outil qui me permettrait de scrapper le href ? Je suis novice en la matière :stuck_out_tongue:

Sur LBC, la difficulté ce n’est pas de scraper, mais de ne pas se faire choper :slight_smile: Ils sont très vigilant là dessus. Chez nous : phantomJS, rotation d’IP, pause +/- longues, court passages 3 a 5 fois par jour + MAJ du script tous les 2 mois environs car ça change tout le temps.

1 « J'aime »

Je confirme l’efficacité des contrôles LBC.

Par exemple, essayez de consulter le numéro de téléphone avec un simple navigateur. Au bout d’une trentaine de fois dans un intervalle de temps donné, c’est terminé…

Le changement d’IP ne suffit pas. Il faut aussi modifier l’agent et d’autres critères.

Normal qu’il apparaisse dans le dom une fois que t’as cliqué sur le bouton puisque le script modifie le contenu de la page avec ce qu’il a récupéré. Le numéro n’y est pas au chargement de la page.

1 « J'aime »

Hello!

Pensez-vous qu’en utilisant plusieurs proxy + du browser automation type Kantu / iMacro for Chrome avec des pauses incluses dans l’automation, LBC le détecterais tout de même ?

Oui c’est possible.

Au bout de 4 clics sur « afficher numéro » en moins d’une minute, l’IP est grillée directement.

Si tu devais récupérer les numéros depuis 10K annonces, tu aurais besoin de 2500 IPs différentes. Vu la volumétrie, tu aurais tendance à passer par des proxys partagés, et non dédiés, or ceux-ci seraient certainement déjà grillés par d’autres.

Mais j’imagine que certains ont déjà trouvés la bonne parade :slight_smile:

2 « J'aime »

Yes, c’est sûr !
Merci de ton feedback.

Si tu as le budget go pour luminati !

1 « J'aime »

Tu l’utilises Boris? Si jamais tu veux partager le prix au mois, je dis pas non :grin:

Bonjour à tous,
Quelqu’un à t’il finalement trouvé une solution ou outil permettant de récupérer le numéro de téléphone sur LBC ?

Salut @Baptiste-GL, Pour ma part, Zennoposter ( version 7 beta) + pas mal de modif dans le logiciel et un vpn premium, bypass les protections de datadome. dispo en PV si tu veux en discuter

1 « J'aime »

Bonjour,

D’après mes expériences, une bonne rotation d’IP et un temps de pause est suffisant pour récupérer les numéro de téléphones sur LBC.

Actuellement, je dois prendre pas loin de 10 000 / jour. Mais je confirme que cela change vite.

Cordialement,

Merci Androsyn