Problème scraping octoparse

Julo33 · Août 9, 2022, 3:29

Salut à tous, j’essaye de scraper ce répertoire d’experts-comptables : Annuaire de l’Ordre – Ordre des Experts Comptables – Région Centre Val de Loire

J’utilise Octoparse mais malheureusement je n’y arrive pas. Le problème que je rencontre est le suivant :
Je n’arrive pas à automatiser l’ouverture d’une zone dépliable et à extraire les données. Et ça pour 1000 zones. Je vous laisse regarder comment est fait le site vous allez mieux comprendre.

Si quelqu’un à une solution je veux bien. Un grand merci à vous

julienarcin · Août 9, 2022, 4:04

Je t’ai fait le scraping (ou plutôt, le reformatage des données):

Julo33 · Août 9, 2022, 6:44

T’es un boss merci !

Arnaud2017 · Août 10, 2022, 4:08

Bonjour, je suis sûr que je peux vous aider pour vos problèmes avec octoparse.
Tout d’abord, cette capture d’écran est ce que vous en avez besoin ?

Et l’image suivante est le workflow que je crée.
飞书20220810-115815

Voilà les étapes que je suivent

Créer un loop item pour toutes les zones
cliquer sur le bouton « Afficher les détails ». Il faut préciser le XPath de ce bouton, c’est //span[@class=« fiche-detail »]
sélectionner et extraire les données. L’essentiel de cette étape consiste également à corriger le XPath ( généralement, si vous n’arrivez pas à collecter correctement les données, c’est souvent à cause de XPath).

image1460×169 14.4 KB

Rue : //span[@class=« fiche-info rue »]
Tél : //span[@class=« fiche-info tel »]
e-mail : //span[@class=« fiche-info email »]
Site : //span[@class=« fiche-info site »]

J’espère que ma réponse peut vous aider.

Pour finir, le Xpath semble très important pour octoparse. Je l’impression de corriger pas mal de xpath. mais à vrai dire, cela m’apporte souvent un sens de satisfaction hhahahha
Si vous voulez comprendre davantage, il y a tutoriel et leur support est excellent.

td {white-space:pre-wrap;border:1px solid #dee0e3;}

Julo33 · Août 11, 2022, 7:07

Bonjour Arnaud,

Merci pour tes conseils, je vais essayer ça.

Bien à toi,
Jules.C

system · Août 11, 2023, 7:07

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.