Octoparse Bug ?

Salut tout le monde !

Etant débutant en growth hacking j’ai téléchargé Octoparse pour scraper le Site Malt. Cependant, l’auto-détections ne scrap que la première page… Auriez-vous une solution ?

Cordialement,

Denis

Salut, il faut créer une « pagination » pour que octoparse puisse crawler toutes les pages.

1 « J'aime »

Oui, j’ai vu églament le problème. Il ne semble pas qu’il s’agit de la pagination.
J’ai vérifié cette page Malt? : les pages se chargent en mode de « infinite scroll »

Il y a « catégories – sub-catégories – items ». Le problème est dû à la structure de HTML de la page. les éléments « catégorie » et « sub-catégorie » sont placés devant les listes d’offres d’emploi. dans la deuxième section, il y a seulement « sub-catégorie », rendant les sections différentes. donc, Octoparse ne peut plus détecter automatiquement…

(je ne sais pas si j’ai bien expliqué, sinon, vous pouvez contacter le support, ou [email protected] avec qui j’ai une discusion.)

En bref, l’autodétection ne peut pas détecter à succès cette page et il faut des configurations manuelles.

1 « J'aime »

Déjà fait, je l’ai même fait manuellement mais toujours rien. :melting_face:

Merci pour le contact, tout est clair. Je vais voir avec Manon si elle peut m’aider :sweat_smile:

Je vous ai également fait une vidéo du bug : Loom | Free Screen & Video Recording Software | Loom

Ah, je vois !
votre problème est que Octoparse ne récolte que les données de la première page, et donc des données redoublées.

Il se peut que le xpath généré automatiquement par Octoparse est incorrecte. Il vous faut corriger le xpath du bouton « next ».
le centre d’aide donne des tutoriels, par exemple

Si votre problème n’est pas encore réglé, laissez-moi savoir !

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.