Probléme de scrapping avec Octoparse

samy091 · Février 12, 2025, 10:17

Bonjour,

J’ai du mal à configurer Octoparse pour extraire les infos des exposants d’un salon.

Mon problème :

La première page contient une liste d’exposants avec des liens vers leurs fiches.
La seconde page affiche les détails de chaque exposant.

Ce que je veux faire :

Extraire la liste des exposants avec leur lien.
Aller sur chaque fiche pour récupérer les infos détaillées.

J’aimerais une explication claire sur comment créer le flux de travail, avec et sans l’auto-détection :

Avec l’auto-détection : Comment bien la configurer ?
Sans l’auto-détection : Quels réglages manuels utiliser (clics, boucles, délais, etc.) ?

Voiçi les 2 sites : home eng - Myplant & Garden

https://ecatalogue.firabarcelona.com/piscinawellness25/home?filter=ONLY_EXHIBITORS&lang=es_ES

Merci beaucoup pour votre aide !

Motorcycle24 · Février 12, 2025, 10:33

Sans m’être trop penché sur le sujet, parfois le mieux est de séparé les taches

Tu extrait d’abord toutes les URL de toute les pages de la liste d’exposant
Et ensuite tu refais une nouvelles tache Octoparse avec comme base la liste des URL que tu as extrait précédement

En général ca devient + simple

samy091 · Février 12, 2025, 10:45

Hello Motorcrycle24,
Merci pour ta réponse !

Malheureusement, certains sites web (notamment ces deux-là) m’empêchent d’extraire la liste des URL. Sur Octoparse, la liste reste vide après l’extraction. Je ne sais pas si c’est un bug ou une protection du site.

Dans d’autres cas, je ne vois pas le bouton « Lien » qui permet normalement d’extraire ces URL.

Si quelqu’un a déjà rencontré ce problème, je serais preneur de solutions !