Scraping SeLoger

Hello,

comme beaucoup, j’utilisais ponctuellement l’API* de SeLoger, qui ne semble plus fonctionner depuis quelques semaines.

J’ai l’impression qu’elle a été retirée de leurs serveurs. En examinant leur site, j’ai repéré un autre endpoint utilisé sur leur page annonce dont je n’ai pas réussi à reverse-engineerer la structure:
https://annonce-webapi-house-prod.svc.groupe-seloger.com/api/1.0/annonce/AnnonceService/GetAnnoncesSimilairesByAnnonceId/146705971

Est ce quelqu’un a été plus chanceux que moi?

Trouvé la réponse sur Github:
https://ws-seloger.svc.groupe-seloger.com

4 J'aimes

@pierrick1

Je suis intéressé par ce topic, est-il possible de détailler davantage ?
En regardant les requêtes qui transitent, je ne vois pas de https://ws-seloger.svc.groupe-seloger.com/
Par contre, je vois qu’il passe par plusieurs API :

Pour SeLoger, je trouve limite plus simple de le scrapper sans passer par les API mais directement le HTML.
Si quelqu’un a des infos, je suis preneur.

Merci

Bonjour
Pour le faire au quotidien, je te confirme que par le HTML, on a ce qu’on veut.
SeLoger bloque cependant pas mal dès qu’il détecte le robot
Une rotation d’IP simple permet de contourner cela très facilement

Merci, pour ta réponse.

Je suis passé par BeautifulSoup pour le scrapper, c’était le plus simple effectivement.

Bonne journée.

L’API permet de récupérer les détails d’un bien ou de faire une recherche. Jette un oeil sur cette doc: https://github.com/pasnox/housing/blob/master/SeLoger.com.api.txt