Scraping Vinted en temps réel

Oui c’est parfaitement faisable, je le fais moi-même pour une plateforme équivalente

Bonjour qlq a réussi a avancer dans le sujet? Merci.

Bonjour, perso je n’arrive pas à trouver l’IP non protégée par cloudflare, quelqu’un pourrait m’aiguiller sur comment procéder?

Bonjour à tous,

Avant tout, désolé pour le déterrage du topic.

Pour un projet perso (et non « commercial ») j’aimerais également obtenir les nouveaux articles publiés sur Vinted. J’ai pu implémenter la logique de récupération des articles, mais mon problème est le volume énorme de nouveaux articles publiés : environ 5.5 millions par jour avec une moyenne de 5k sur la journée.

Ce serait malgré tout réalisable avec plusieurs machines, mais je me pose des questions concernant le coût probablement énorme pour faire tourner tout ça.

Etant donné que des bots Vinted sont réellement en « prod » sur Discord (donc probablement rentable), dites-moi que j’ai manqué quelque chose ou que je n’utilise pas la bonne méthode de monitoring svp :laughing:

Merci pour vos réponses :wink:

Bonjour à tous, désolé de déterrer le sujet également mais j’aii peut-être la moitié de la solution.

J’ai récemment décidé d’élaborer un serveur discord pour scap les annonces vinted des niches que je souhaitais donc des niches comme timberland qui ne sont pas mainstream et qui permettent de tirer de gros bénéfices.

Il faut prendre en compte que je n’ai aucune expérience dans le codage, j’ai donc demandé à chat gpt comment faire. Au bout de beaucoup d’erreurs j’ai finalement réussi à scrap les annonces avec un délai proche de 0 grace aux webhooks.

Sauf que là est mon problème de non codeur : le code est ultra massif avec tous ces webhooks, pas opti et il ne scrappe que les marques. J’utilise l’api de vinted pour scrappe par brand mais quand je veux scrappe par catégories ça ne fonctionne pas.

En conclusion j’ai réussi à scrapper des annonces en quasi 0 délais (3 à 5secondes ce qui est vraiment honnête pour des niches pas mainstream) mais je ne scrappe que par marques et non par catégories !

Si quelqu’un avait la solution ou tout simplement un code qui fonctionne je veux bien qu’il m’en informe !

Merci d’avance.

Difficile de t’aider sans voir le code…
Partage-le en MP si tu veux un avis.

Salut les gars, une solution ? J’ai uniquement un bot qui crawl mais c’est lent et ça fonctionne avec des proxies.

Hello. Je viens de voir que la route https://www.vinted.fr/api/v2/items/ID est maintenant restreinte, quelqu’un ici connaîtrait une solution/alternative par hasard ? On peut scraper la page https://www.vinted.fr/items/ID et récupérer les props mais ce n’est pas idéal et il manque plein de propriétés…

Tu fais une requête vers « https://www.vinted.fr/web/api/core/catalog/items?page=1&per_page=96&time=1745827090&search_text=&catalog_ids=&currency=EUR&order=newest_first&catalog_from=0&size_ids=&brand_ids=&status_ids=&color_ids=&material_ids=' »

toutes les 5 secondes, tu récupères tous les ids listés, et tu fais une requête vers ‹ https://www.vinted.fr/items/{ID_VINTED} ›

puis avec une regex tu extrais le json qui contient toutes les propriétés (qui est tout en bas de la page). Il faut utiliser un proxy qui charge le javascript pour faire cette 2è requête je pense.
Tu peux utiliser The best web scraping API qui est un proxy par cher qui marche super bien (le lien est un lien affilié).

Oublie pas de faire un dictionnaire des ID déjà enregistrés; pour être sûr de ne pas re-scraper les IDs déjà fais.

Pour l’instantanéité du as la mention « A l’instant » sur la date de publication des ventes en utilisant cette URL, donc je pense que c’est assez instant, mais je pense aussi qu’en simulant des recherche ca pourrait être plus rapide.

Merci pour ta réponse. J’ai cherché un peu sur la page et effectivement on peut récupérer les props Next.js. C’est un peu moins pratique que d’utiliser une route API mais s’il n’y a pas d’alternative tant pis faut faire avec. À mon avis c’est un peu plus lent qu’avant mais si c’est la seule façon de faire tous les bots doivent s’aligner dessus donc ça change pas grand chose.
Petite note : en cherchant dans les sources avec Chromium j’ai trouvé une nouvelle route /api/v2/items/{ITEM_ID}/plugins/items, peut-être quelque chose à creuser de ce côté.

Hello ! J’ai passé des mois à m’arracher les cheveux exactement sur le même setup que toi avec l’IP d’origine. Le problème de l’erreur 403, c’est que Vinted a complètement verrouillé son anti-bot (Datadome/Cloudflare). Même avec le bon cookie et le bon user-agent, ils font du TLS fingerprinting et ban les IP datacenters presque instantanément maintenant.

Honnêtement, maintenir son propre script avec une rotation de proxys résidentiels propres, ça devenait un gouffre financier et un job à plein temps. J’ai fini par jeter l’éponge sur le fait de coder le truc moi-même.

Depuis quelques semaines, j’utilise un acteur managé sur Apify (le Vinted Turbo Scrapper). Le mec qui a codé ça gère toute la partie bypass et rotation d’IP en backend. Ça crache le JSON en temps réel avec 0 prise de tête, et niveau vitesse c’est bluffant pour chopper les items sous-cotés avant tout le monde.

Si ça peut t’éviter de perdre des nuits de sommeil là-dessus : Vinted Turbo Scraper

Bon courage en tout cas, leur sécurité est devenue infernale !

1 « J'aime »