Je viens à vous pour une petite question technique : avez-vous déjà réussi à extraire les numéros de téléphone sur LBC ? J’ai essayé divers tools et je récupère tout sauf cette info…
De plus, avez-vous déjà tenté d’envoyer en masse des messages ?
Dans l’idée, mon but est de récupérer l’ensemble des numéros de téléphone et procéder à un envoi massif de SMS (là, pour le coup, pas de patrouille ! ). Par contre, oui, j’imagine que si j’envoie pas mal de mails via l’interface LBC, je vais me faire prendre la main dans le sac. À moins de limiter les envois et par intervalle…
Sur LBC, les tel sont affichés via des images. Il te faudra donc un ocr pour les récupérer. Je ne sais pas si des tools te le permettent mais pour un dev ça se fait bien.
Pour les envois de masses SMS, il te faudra soit un fournisseur SMS avec une api, soit peut être le faire via un tel android.
Dans tous les cas, il te faudra surement du développement sur mesure. Il faudra mettre la main à la poche.
Ah oui t’as raison. Il me semblait que dans le passé, le site renvoyait une image avec le numéro écrit dessus (et donc facilement contournable surtout pour des numéros). Les connaissant, il doit il avoir une protection avec les paramètres envoyés.
à vérifier si certains utilisateurs pros ou payants ont une protection supplémentaire…? mais c’est récupérable en scrappant le href de ‹ < span class=« phone_number font-size-up »> ›
J’avais repéré la même chose et je ne pense pas que les utilisateurs pros ou payants bénéficient d’une protection supplémentaire. Sachant que pour ma part, ce sont les particuliers qui m’intéressent.
Tu connais un outil qui me permettrait de scrapper le href ? Je suis novice en la matière
Sur LBC, la difficulté ce n’est pas de scraper, mais de ne pas se faire choper Ils sont très vigilant là dessus. Chez nous : phantomJS, rotation d’IP, pause +/- longues, court passages 3 a 5 fois par jour + MAJ du script tous les 2 mois environs car ça change tout le temps.
Par exemple, essayez de consulter le numéro de téléphone avec un simple navigateur. Au bout d’une trentaine de fois dans un intervalle de temps donné, c’est terminé…
Le changement d’IP ne suffit pas. Il faut aussi modifier l’agent et d’autres critères.
Normal qu’il apparaisse dans le dom une fois que t’as cliqué sur le bouton puisque le script modifie le contenu de la page avec ce qu’il a récupéré. Le numéro n’y est pas au chargement de la page.
Pensez-vous qu’en utilisant plusieurs proxy + du browser automation type Kantu / iMacro for Chrome avec des pauses incluses dans l’automation, LBC le détecterais tout de même ?
Au bout de 4 clics sur « afficher numéro » en moins d’une minute, l’IP est grillée directement.
Si tu devais récupérer les numéros depuis 10K annonces, tu aurais besoin de 2500 IPs différentes. Vu la volumétrie, tu aurais tendance à passer par des proxys partagés, et non dédiés, or ceux-ci seraient certainement déjà grillés par d’autres.
Mais j’imagine que certains ont déjà trouvés la bonne parade
Salut @Baptiste-GL, Pour ma part, Zennoposter ( version 7 beta) + pas mal de modif dans le logiciel et un vpn premium, bypass les protections de datadome. dispo en PV si tu veux en discuter