Scraper l'annuaire du Stade Rochelais

Bonjour tout le monde,

Je souhaite récupérer une liste des entreprises partenaires du Stade Rochelais :

https://www.staderochelais.com/entreprises/partenaires/annuaire

L’idéal serait de récupérer le nom de l’entreprise, l’adresse ainsi que le numéro de téléphone. Je ferais de l’enrichissement par la suite.

J’avoue être curieux de savoir quelle méthode utiliser pour savoir le faire moi-même ! Si quelqu’un peut me donner une piste, ça serait génial !

Merci.

1 « J'aime »

Nom et adresse ça ne devrait pas poser de problème, mais je ne vois pas de téléphone, ni dans la recherche, ni dans les fiches individuelles…

C’est un peu mal renseigné sur le site… mais sur certaines fiches entreprise il y a un bouton « appeler ». En plus de ça, il n’est visible que sur certaines tailles d’écran, je dois redimensionner ma fenêtre pour le voir.

T’arrives à les retrouver sur Linkedin ? Parce que je peux te recommender des outils :slight_smile:

Eric, je suis intéressé par les outils !

Effectivement, il est invisible de mon coté (c’est plutôt mal fait !), mais en fait c’est dans le code source de la page, tu dois pouvoir le récupérer assez simplement :

<div style="display: none;" class="responsive-chips">
                    <div class="responsive-chip chip-phone"
                onclick="event.preventDefault(); window.open('tel:02 51 51 25 20', '_self');"
                interact event-type="SHEET_REVEAL_PHONE">
                <span class="item-infos-phone">Appeler</span>
                <span class="icon-font-phone"></span>
            </div>
        
            </div>

C’est réussi !

Pour info je suis passé par un script Google Colab qui voyage entre les pages pour extraire les données Json dans le HTML ! Plus qu’à exporter en CSV :slight_smile:

Merci pour vos pistes !

1 « J'aime »