Scraping n° tel LBC + envoi message


#1

Bonjour à tous ! :slight_smile:

Je viens à vous pour une petite question technique : avez-vous déjà réussi à extraire les numéros de téléphone sur LBC ? J’ai essayé divers tools et je récupère tout sauf cette info…

De plus, avez-vous déjà tenté d’envoyer en masse des messages ?

Je vous remercie par avance,
Morgan


#2

Message ou sms? Parce que si tu veux envoyer des messages en masse, tu vas te faire prendre par la patrouille.


#3

Dans l’idée, mon but est de récupérer l’ensemble des numéros de téléphone et procéder à un envoi massif de SMS (là, pour le coup, pas de patrouille ! :rotating_light: ). Par contre, oui, j’imagine que si j’envoie pas mal de mails via l’interface LBC, je vais me faire prendre la main dans le sac. À moins de limiter les envois et par intervalle…


#4

Sur LBC, les tel sont affichés via des images. Il te faudra donc un ocr pour les récupérer. Je ne sais pas si des tools te le permettent mais pour un dev ça se fait bien.
Pour les envois de masses SMS, il te faudra soit un fournisseur SMS avec une api, soit peut être le faire via un tel android.
Dans tous les cas, il te faudra surement du développement sur mesure. Il faudra mettre la main à la poche.


#5

Quand je lis le code, je vois plutôt un bouton avec un javascript.

<button data-href="https://api.leboncoin.fr" data-listid="134548001" data-salesmen="1" data-textenabled="1" class="button-orange large phoneNumber trackable" data-info="{&quot;event_name&quot; : &quot;ad_reply::telephone::voir_le_numero&quot;, &quot;event_type&quot; : &quot;load&quot;, &quot;event_s2&quot; : &quot;4&quot;}"><i class="icon-phone icon-1-8x"></i>Voir le numéro</button>

Le javascript est une protection qui empêche de collecter automatiquement et trop facilement le numéro de téléphone.


#6

Ah oui t’as raison. Il me semblait que dans le passé, le site renvoyait une image avec le numéro écrit dessus (et donc facilement contournable surtout pour des numéros). Les connaissant, il doit il avoir une protection avec les paramètres envoyés.


#7

En inspectant avec Firebug, je vois le numéro affiché :

à vérifier si certains utilisateurs pros ou payants ont une protection supplémentaire…? mais c’est récupérable en scrappant le href de ‘< span class=“phone_number font-size-up”>’


#8

J’avais repéré la même chose et je ne pense pas que les utilisateurs pros ou payants bénéficient d’une protection supplémentaire. Sachant que pour ma part, ce sont les particuliers qui m’intéressent.

Tu connais un outil qui me permettrait de scrapper le href ? Je suis novice en la matière :stuck_out_tongue:


#9

Sur LBC, la difficulté ce n’est pas de scraper, mais de ne pas se faire choper :slight_smile: Ils sont très vigilant là dessus. Chez nous : phantomJS, rotation d’IP, pause +/- longues, court passages 3 a 5 fois par jour + MAJ du script tous les 2 mois environs car ça change tout le temps.


#10

Je confirme l’efficacité des contrôles LBC.

Par exemple, essayez de consulter le numéro de téléphone avec un simple navigateur. Au bout d’une trentaine de fois dans un intervalle de temps donné, c’est terminé…

Le changement d’IP ne suffit pas. Il faut aussi modifier l’agent et d’autres critères.


#11

Normal qu’il apparaisse dans le dom une fois que t’as cliqué sur le bouton puisque le script modifie le contenu de la page avec ce qu’il a récupéré. Le numéro n’y est pas au chargement de la page.


Réponse automatique à Annonces LE BON COIN

Communauté initiée par @camillebesse avec l'aide de @Cebri@JulienD@VivianSolide@Boristchangang
Follow @growthhackingfr