Bonjour à toutes et tous,
Débutant dans le domaine du scraping, j’apprends pas à pas en tâtonnant, en partie grâce aux nombreux conseils fournis sur ce site. Je n’ai pas de notion de codage, donc j’utilise principalement l’extension « web scraper » et un tout petit peu python en m’appuyant sur chatGPT.
J’arrive à comprendre le principe de récupération de données sur la plupart des annuaires que j’ai visité jusqu’à présent (je galère encore avec la pagination sur certains toutefois), mais là je suis face à une problématique technique qui dépasse mon petit niveau…
Je cherche à récupérer les infos présentes sur cet annuaire : Annuaire adhérents - Fibois Nouvelle-Aquitaine
Au demeurant, rien d’exceptionnel j’imagine puisque toutes les infos sont open.
Mais je ne comprends pas la structure de cet annuaire, car après avoir affiché toutes mes entreprises en lançant une recherche vide, je clique sur le bouton « + Détail » sur la fiche d’une entreprise pour rendre les infos visibles, mais alors l’adresse de la page reste la même et il faut cliquer sur le bouton « retour à ma recherche » en bas de page pour revenir à la liste des entreprises.
Les fiches ne semblent pas avoir d’adresse de page propres comme c’est souvent le cas sur d’autres annuaires. Du coup comment faire comprendre à « web scraper » (ou autre) où et comment aller chercher chaque info ?
Si une bonne âme peut me conseiller sur ce cas, je suis preneur ! Merci d’avance.
Cadeaux:
https://bddbois.fibois-france.fr/apiuser/listeentite?apiid=3GXtqTvTC5&m=html&pagi=400
Pas besoin de scrapper tu peux regarder la request qu’ils font dans la console chrome virer les filtre de l’url et mettre une limite a 400
A partir du lien de @abel.y3k , tu récupères les ids dans le code HTML :
<div class="col-md-3 fbr_visible0 " style="">
<div class="fbr fbr_fiche fbr_fiche59509">
<div class="fbr-photo" >
<img src="https://bddbois.fibois-france.fr/apiuser/entite_image/59509 ">
Ici 59509
Et ensuite tu as accès à la totalité des données avec cette url :
https://bddbois.fibois-france.fr/apiuser/ficheentitewidget/59509/fiche?apiid=3GXtqTvTC5&m=html
Merci à tous les deux pour ces éléments très instructifs !
A partir de là, comment puis-je automatiser la récupération de toutes les données sans avoir à ouvrir chaque page entreprise une à une ?