Probleme de scraping

Hello à tous !

J’essaye de scrapper ce site https://annuaire.huissier-justice.fr/resultats-recherche.aspx pour avoir les infos des Huissiers de Justice du Nord Pas de Calais, mais avec les outils que j’ai utilisé à chaque fois ça bug (Spider, Webscraper)…
C’est un site ou les contacts ne sont pas en forme de lien, ils sont en forme de mini layout qui s’ouvrent dans le même anglet.
Si quelqu’un a un outil qui pourrait m’aider ce serait trop cool !

Merci à tous !

Salut,

Regarde du côté du champ <input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="... ici le contenu qui devrait t'intéresser ...">
Ce champ comporte je pense toutes les infos que tu veux, il est juste encodé en base64.

Si tu veux te faire une idée de ce qu’il contient, tu peux copier/coller la totalité du contenu sur le site suivant :


puis cliquer sur decode.
1 « J'aime »

Hello,

Après quelques mois d’absence parmi vous, je reviens faire un tour et tenter d’apporter ma pierre à l’édifice.

Cet annuaire codé en ASP.net fait un usage intensif des requêtes en POST, ce qui est malheureusement antinomique avec la notion de liens où on pourrait avoir les paramètres de la recherche passés facilement, ce qui permettrait d’injecter ce lien dans Webscraper par ex.

D’autre part, la majorité des liens semblent eux même activer des requêtes en POST et ne pas avoir de HREF pointant vers des requêtes en GET, du coup webscraper n’est pas capable de cliquer sur ce type de bouton correctement…

Tente ton coup avec du headless browser si tu sais coder un peu :slight_smile: