Problèmes avec octoparse et éléments dynamiques

Bonjour.

Débutant dans le scraping et avec Octoparse, je suis actuellement entrain d’essayer de scraper les Fédération française des différents sports.

Je me retrouve avec 2 difficultés:

  • Dans un premier temps, sur ce site Trouver un club , Pour que les clubs apparaissent, il faut cliquer sur un département avant, cela ne change pas le lien de la page. J’ai cru comprendre qu’il fallait donc avec Octoparse que je fasse une action « cliquer » avec le xpath d’un des départements. Cependant, cela ne fonctionne pas du tout, et mon export se retrouve toujours vide, peu importe si je prend le xpath d’un autre département…

  • Trouver un club | FFN , pour celui-ci, la map interactive ne fonctionne tout simplement pas sur Octoparse, rien n’apparait

J’imagine que le premier problème peut se résoudre simplement, si vous avez une idée de comment faire, je vous en serai reconnaissant :slight_smile:

Merci beaucoup et bonne journée

Je en connais pas bien Octoparse, mais voici une proposition pour avancer :

Pour le FFTT, tu peux observer que les pages des clubs sont accessibles avec Structure
L’id se décompose en 2 digits pour la région, 2 digits pour le département et un incrément sur 4 digits…
Et boucler la dessus.

Pour la FFN, il me semble que toutes les données sont la.

Merci pour ta réponse, par contre les 4 derniers digits ne sont pas un simple incrément, y a certains département ou ça monte à des 9000, je vais créer tous les URLs et laisser tourner un testeur d’URL une nuit pour voir

Merci également pour le lien pour la FFN, mais je n’ai actuellement aucune idée de comment récupérer les informations, je vais devoir faire des recherches :grimacing:

C’est un json que tu peux convertir en tableau.

Salut,

Pour les utilisateur d’octoparse j’ai un probleme que je n’arrive pas à resoudre , Merci pour vos solutions !!

  • J’essayer de Scrapper sur Tripadvisor, sur des recherches de restaurants par exemples.

On a une Liste de 30 Affiches par page , Il faut cliquer sur la Page puis extraire l’email à l’intérieur, jusque la pas de probleme.

Mon but est de filtrers les Emails ( Des 30 Affiches de chaque page ) et ca sur toutes les pages possible.
Le probleme est que je n’arrive jamais à passer à la Seconde annonce de la 1ere page.
J’ai essayé de le faire en automatique comme manuellement , il garde la meme cible de clic ( Le 1er clic et le meme que le second meme si je le selectionne manuellement ) et repete en boucle…

Si tu as une solution ca serait cool ^^
là honnêtement je commence à sécher sur les tests ^^