Bonjour,
J’essaye de scraper la base d’annonces de lacentrale.fr à partir d’un scripte Python. Je me suis rendu compte, malheureusement, que le site m’envoyait des « fausses » données dès qu’il m’identifie comme bot.
J’ai essayé de contourner le problème en faisant une rotation avec plusieurs headers et une centaine d’adresses IP (partagées) grâce à un VPN, mais le problème revient toujours (pour certaines adresses IP).
J’ai du mal à comprendre comment le site identifier certaines de mes IP avant même que j’ai pu faire plus d’une requête par IP. Avez-vous des conseils / expériences avec lacentrale.fr ? Est-ce qu’utiliser Selenium pourrait régler ce problème ?