Solution pour scraper Leboncoin via une API

Bonjour à vous,

Je sais que pour certains, scraper Leboncoin est une vraie passion et se confronter à Datadome en freine beaucoup pour développer leurs idées ou leurs business.

Trouver une technique pour contourner les sécurités mises en place par Leboncoin s’avère être très complexe et faire en sorte que celle-ci soit fiable, pérenne et scalable l’est encore plus.

Je me suis dit que je pouvais apporter ma contribution à cette bataille en fournissant une API permettant un scraping beaucoup plus simple qu’actuellement.

Je me suis amusé à créer un P.O.C d’une API pour faciliter l’acquisition de données provenant de leboncoin.
Je vous joins une petite vidéo de ce P.O.C, je n’ai pas tout déroulé au niveau de l’arborescence JSON mais on récupère l’ensemble de la donnée présente sur leboncoin.

Vidéo du P.O.C

Avant que certains me disent que c’est impossible, que je vais me faire bloquer… J’ai créé deux projets liés à ce sujet, deux systèmes d’alerte en temps réel pour ne rater aucune bonne affaire sur leboncoin, ce qui m’apporte un peu de crédibilité, je pense.

Mes systèmes Pyget et Pygoo, fonctionne depuis plusieurs mois sans problèmes.

Avant de me lancer complètement dans ce projet, je préférais recueillir vos avis surs, l’usage d’un tel service, un pricing adapté et ce qui vous passe par la tête :smiley:

Mon objectif avec ce projet est de fournir un service clé en main, plus besoin de proxy, plus besoin de créer des scripts aléatoires qui arrive à scraper leboncoin une fois sur 10 :stuck_out_tongue:, on fait un simple appel à une API et on récupère la data, bref une économie de temps et surtout d’argent.

Merci à vous.

7 « J'aime »

Hey, super idée, j’allais m’attaquer à scraper lbc pour une mission freelance :slight_smile:

Côté pricing tu peux faire suivant le nombre de résultats et un abonnement plus cher avec de l’illimité !

Bonne continuation

Çà à l’air prometteur, je vais tester rapidement.
(attention à ta RGPD qui n’est pas clean de partout)

2 « J'aime »

Excellente idée ! N’hésite pas à me tenir au courant de l’évolution :slight_smile:
J’étofferai les landings pages (explication du fonctionnement sur Pygoo comme sur Pyget) et retirerai " Avec Pyget vous faites de bonnes affaires !", mais j’imagine que c’est plutôt un premier shot de landing, et c’est déjà bien de ne pas avoir le latin habituel ^^

1 « J'aime »

Hello !

Quand tu parles de récupérer l’ensemble des données tu intègres donc également les numéros de téléphone ?

Bonjour Neeko,

Partagerais-tu avec nous ton API ?

En tout cas, ca à l’air rapide et bien foutu :slight_smile:

Par contre, coté légal, n’as-tu pas « peur » de faire du scrapping du site leboncoin ? Sur les autres sites je ne dis pas, mais celui là étant particulièrement bien protégé, et on sait qu’ils n’aiment pas ca :stuck_out_tongue:

Sim

moi je cherche a automatiser la depose d’annonce sur leboncoin à tu une solution d’automatisation de depose d’annonce ?.

si non pour le scraping je cherche seulement à récuperer des informations generale sur les annonces immobiliére et surtout avoir les telephones des particulier, j’avais réussi a faire du scraping avec une extension chrome webscraping mais le bon coin bloc la récuperation des telephone à partir de 5 telephone scrapper il faut changer d’ip pour réussir a tout prendre mais c’est infaisaible a mon d’avoir des centaine d’ip et proxy et encore si il y a 1000 annonces a recuperer il fausdrait 1000 / 5 = 200 proxy

une galere quoi encore faut til que l’extension webscrping prenne en charge les proxy…

Hello,

Pyget / pygoo sont down ?

Existerait-il une API ou autre solution alternative ?

Je viens de trouver datashake.com et lobstr.io auriez vous des feedbacks à me faire sur ces deux services ?

Merci d’avance,
Arnaud

1 « J'aime »