Scrap d’un annuaire problème de pagination

Salut !

J’avais pas trop de problème jusque la mais la je galère à faire la pagination dans Octoparse pour scraper l’annuaire suivant : Annuaire Archive - ArtsHebdoMédias

Le site n’a pourtant pas l’air complexe, j’ai pris mon temps, mais le résultat final reste bancal…

Je ne pige pas mon erreur. Des idées ou pistes à creuser ?

Merci !

Hello, j’ai testé chez moi il pagine tout seul. Vérifie lors de la detection des éléments de la page.
Plan B en dépannage : tu te fais un fichier csv avec les urls de chaque page et tu mets ça dans la boucle

Merci pour ton retour !

Pas de soucie pour la pagination pour que octoparse comprenne qu’il faut cliquer sur chaque bouton suivant etc mais après je ne comprends pas pourquoi je lance en boucle qu’il clique sur plus d’information pour aller sur chaque fiche pour prendre les informations de contact mais ça il veut pas …

Du coup j’ai pu scrap toutes les urls et je vais scrap le reste par ca mais je me demande comment tu fais pour tout avoir d’un coup je dois faire une grosse erreur je penses !

Alors ça ça dépend comment le site est construit, souvent ca se passe bien mais parfois ca bloque. Vérifie dans les options de l’action « cliquer » si tu es sur « ouvrir dans un nouvel onglet » ou « ouvrir avec ajax » et change ce parametre.
Mais quand ça coince ta méthode est la bonne : tu passes une fois pour récupérer toutes les urls de pages uniques et tu lui donne ensuite ce fichier à traiter

tu peux récupérer toutes les pages que tu souhaites scrapper depuis le sitemaps. Ainsi pas besoin de paginatino

1 « J'aime »