Tu peux utiliser webscraper.io, cette extension Chrome peut naviguer seule sur les pages, cliquer sur les boutons et copier les infos de l’entreprise dans un fichier que tu pourras ensuite coller/exporter là où tu veux.
La fonctionnalité de prise compte du changement de page est un peu fastidieuse à mettre en place, mais ils ont de bons tutos sur le site.
Il y a d’autres webscraper, mais celui que je t’ai donné est gratuit dans mes souvenirs,
Ça te donne un fichier csv avec comme séparateur des virgules. Et avec comme données le nom de l’entreprise, le nom du contact et son email si elle est référencée
non créer un nouveau fichier (file puis new file) puis tu le lances en faisant F5, là il va te demander de le sauvegarder tu le sauvegarde où tu veux mais le fichier csv va apparaitre dans le dossier où se trouve le script. Quand la sauvegarde sera effectué le script va se lancer dans la console quand tu auras ça:
Franchement très courte, Octoparse se prend en main en même pas 2 heures et ne requière aucune connaissance en code, c’est que du visuel et c’est vraiment pensé pour être simple
Après connaître un peu de Xpath te permet de faire des choses plus complexe mais perso j’ai déjà fait des scraps complexes et volumineux avec Octoparse en quelques minutes (j’ai même découvert depuis peu la possibilité de changer d’ip automatiquement sans aucune manip particulière).
@ScrapingExpert je t’invite vraiment à tester leur version gratuite !
J’ai installé Octoparse il y a quelques jours et ça semble en effet vraiment pas mal.
Aurais-tu des suggestions à faire pour des forums/blogs pour mieux maitriser le xpath ?
Je bloque déjà sur du scrapping google map (malgré le tuto)… avec une erreur provenant apparemment du xpath :
au niveau du « loop item »
"cannot find any element using this xpath expression : « //DIV[@class=‹ section-layout section-scrollbox scrollable-y scrollable-show section-layout-flex-vertical section-layout-inset-shadow ›]/DIV[1]/DIV[1]/A[1] »