Scraper numéros leboncoin


#1

Bonjour, je cherche a scraper une annonce leboncoin, petit bémol je n’arrive pas a scraper le numéro de téléphone, celui-ci étant visible après avoir cliqué sur voir le numéro, j’ai essaye “element click” mais en vain.

J’espère vraiment que quelqu’un peut m’aider.

Cordialement


#2

Bonsoir,
Même si tu arrives à automatiser le clic sur numéro, tu verras qu’au bout de 4 affichages de numéro , en moins d’une minute, tu seras bloqué, et tu ne pourras plus obtenir d’autres numéros pendant plusieurs heures…


#3

Bonjour,

Merci pour votre réponse, et si j’utilise un script avec nodejs ou scrapy il n’est pas n’ont plus possible d’éviter cette sécurité ?


#4

Salut, il te suffit d’utiliser un outil “image recognition” comme deathbycaptcha.com les numéros sur LBC sont inséré dans une image (c’est pour ca que tu ne le vois pas dans la source) que tu enverras sur deathbycaptcha.com via une API, qui décodera les chiffres ,par contre fait gaffe car si tu veux faire ça en version “scraping” tu auras besoin de pas mal de proxy, la protection fait que LBC bannit ton IP si tu fais trop de requêtes de numéros


#5

Les numéros de LBC ne sont pas insérés dans une image, il s’agit de numéros récupérés via une requête AJAX…

De plus, deathbycatpcha n’est pas un service d’image recognition (OCR) mais un service de résolution de captcha, effectué par des Indiens…


#6

Si je comprends bien il n’est donc pas possible de scraper une requête ajax ?
J’ai vue que d’autres sites utilisent ce même principe (louervite.fr), celui de faire apparaître le numéro via une requête ajax, ces sites possèdent-ils la même sécurité que lbc ?


#7

C’est possible de scraper des données qui proviennent de réponses de requêtes AJAX.

Mais concernant LBC, il est question de faire tourner les IPs, les user-agents, et autres paramètres…

Ces autres sites qui possèdent le même principe n’ont pas forcément tous les mêmes mécanismes de protection, il faut anaylser au cas par cas.


#8

Pour le scrap de tels en masse , LBC ne “regarde” que les ip et pas les UA… comme dit @ScrapingExpert , au bout de 4 queries/jour c est fini donc la cle est de faire des rotations massives de proxies.Du coup tlm aura compris le type de proxies adaptes et la marche a suivre…


#9

Merci pour vos réponses,
Je suis encore novice en scraping serait-il possible de m’éclairer sur les différents moyens de scraper une requête ajax, je trouve peu d’informations à ce sujet sur internet.


Team : CamilleBriceJulienVivianBorisXavierSteven.