Problème scraping octoparse

Salut à tous, j’essaye de scraper ce répertoire d’experts-comptables : Annuaire de l’Ordre – Ordre des Experts Comptables – Région Centre Val de Loire

J’utilise Octoparse mais malheureusement je n’y arrive pas. Le problème que je rencontre est le suivant :
Je n’arrive pas à automatiser l’ouverture d’une zone dépliable et à extraire les données. Et ça pour 1000 zones. Je vous laisse regarder comment est fait le site vous allez mieux comprendre.

Si quelqu’un à une solution je veux bien. Un grand merci à vous :slight_smile:

Je t’ai fait le scraping (ou plutôt, le reformatage des données):

2 « J'aime »

T’es un boss merci ! :v:t3:

1 « J'aime »

Bonjour, je suis sûr que je peux vous aider pour vos problèmes avec octoparse.
Tout d’abord, cette capture d’écran est ce que vous en avez besoin ?


Et l’image suivante est le workflow que je crée.
飞书20220810-115815

Voilà les étapes que je suivent

  1. Créer un loop item pour toutes les zones
  2. cliquer sur le bouton « Afficher les détails ». Il faut préciser le XPath de ce bouton, c’est //span[@class=« fiche-detail »]
    飞书20220810-120120
  3. sélectionner et extraire les données. L’essentiel de cette étape consiste également à corriger le XPath ( généralement, si vous n’arrivez pas à collecter correctement les données, c’est souvent à cause de XPath).

    Rue : //span[@class=« fiche-info rue »]
    Tél : //span[@class=« fiche-info tel »]
    e-mail : //span[@class=« fiche-info email »]
    Site : //span[@class=« fiche-info site »]

J’espère que ma réponse peut vous aider.

Pour finir, le Xpath semble très important pour octoparse. Je l’impression de corriger pas mal de xpath. mais à vrai dire, cela m’apporte souvent un sens de satisfaction hhahahha
Si vous voulez comprendre davantage, il y a tutoriel et leur support est excellent.

td {white-space:pre-wrap;border:1px solid #dee0e3;}
1 « J'aime »

Bonjour Arnaud,

Merci pour tes conseils, je vais essayer ça.

Bien à toi,
Jules.C

1 « J'aime »

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.