J’utilise Luminati (récemment renommé Bright Data) pour scraper des profils linkedin publics en non authentifié à partir d’un csv d’urls. Aucun problème pendant six mois, mais depuis quelques semaines leur success rate est tombé de ~100% à ~2%. Apparemment c’est dû au fait que Linkedin a amélioré ses protections.
Est-ce que quelqu’un ici fait du scraping de profils linkedin en masse (plusieurs milliers / jour), a le même problème, et a trouvé une solution ?
Je suis en train de parcourir la toolbox pour trouver une alternative à Luminati, mais je crains que ce soit le même problème pour tout leurs compétiteurs : Scrapingbee m’a déjà répondu que le scraping linkedin marchait pas non plus chez eux en ce moment.
Bonjour
tu parles de leur offre Proxy Service for Businesses, Residential IP Proxies. Bright Data ?
Est ce que tu fais de gros volumes ? Car j’ai étudié cette solution : success rate était bon, mais le prix exorbitant (pour moi qui ait besoin de la seule France, 15 à 20 millions de profils)
Pour quelle utilisation si pas indiscret ?
Je passe bien en scrap avec leurs Ip residential mais … ça coûte …
Bonjour
Exactement. Pour le moment on fait du 20-30k / mois donc ça nous va, mais ça devrait augmenter très rapidement dès septembre. On s’en parle en mp ?