Je suis intéressé par ce topic, est-il possible de détailler davantage ?
En regardant les requêtes qui transitent, je ne vois pas de https://ws-seloger.svc.groupe-seloger.com/
Par contre, je vois qu’il passe par plusieurs API :
notamment celle-ci : https://harvest.data.seloger.com/ qui renvoi un JSON avec pas mal d’info, pas forcement tout mais c’est déjà une bonne piste.
Bonjour
Pour le faire au quotidien, je te confirme que par le HTML, on a ce qu’on veut.
SeLoger bloque cependant pas mal dès qu’il détecte le robot
Une rotation d’IP simple permet de contourner cela très facilement
J’ai essayé de scraper SeLoger avec WebScraper, ça fonctionne bien. Par contre, j’ai une limite au bout d’un moment : le site m’affiche un captcha car il a détecté le scrap. Savez-vous comment je pourrais contourner cette limite ?
Non j’ai pas essayé le changement d’IP. Est-ce que tu connaîtrais un outil permettant de la changer dynamiquement ?
Je suis passé par la version cloud de Webscraper (version d’essai). Ca fonctionne plutôt bien mais je vais être limité, et devoir payer…
Si ça fonctionne plutôt bien alors payer ne devrait pas être un frein, mais au contraire utilisé en tant qu’effet de levier Faut parfois accepter d’investir un peu surtout si ça fait bien le job je pense.
Vis à vis de ce problème tu as du nouveau? j’ai pas mal bossé sur le l’aspect browser fingerprinting, et maintenant il y a des tas de choses tellement évidentes qui me sautent aux yeux, on comprend vite pourquoi on peut se faire détecter…