Hello les GH !
J’aimerais scraper le site L’annuaire des start-up du digital mais je ne suis pas dev et les url que produisent le site sont uniformes (peu importe les filtres l’url ne bouge pas)
Que me conseillez vous pour pouvoir scraper ce type de contenu lorsqu’on est pas dev
Merci à tous !
Hi,
J’ai fait un essai rapide en mode no code avec Instant Data Scraper
Par contre l’annuaire s’arrête par la L’annuaire des start-up du digital – Page 294
J’ai pas été chercher plus loin.
Ensuite sur chaque page du website officiel renvoyée comme BigInt on peut utiliser un Web Element Extractor chez phantombuster (par exemple), la j’ai pris juste le nom de domaine (on peut étendre à plusieurs choses si besoin)
Ensuite on scrap chaque page pour choper les données qui intéressent à partir du nom de domaine.
Je pense que c’est pas trop fastidieux j’ai mis quelques minutes pour lancer cela sans une ligne de code (un petit phantom semble suffisant mais y a plein de choses possibles bien entendu) .
En espérant avoir été assez clair
++
ça m’a l’air top je vais tester ça merci
Merci beaucoup pour ton temps c’est top aussi !
Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.