Meilleure web scraper pour les non dev ?

Nicolusmaximus · Septembre 12, 2022, 5:13

Hello les GH !
J’aimerais scraper le site L’annuaire des start-up du digital mais je ne suis pas dev et les url que produisent le site sont uniformes (peu importe les filtres l’url ne bouge pas)
Que me conseillez vous pour pouvoir scraper ce type de contenu lorsqu’on est pas dev
Merci à tous !

Kevin_Dfr · Septembre 13, 2022, 7:34

incubateur_BdM · Septembre 13, 2022, 9:09

Hi,

J’ai fait un essai rapide en mode no code avec Instant Data Scraper

Par contre l’annuaire s’arrête par la L’annuaire des start-up du digital – Page 294
J’ai pas été chercher plus loin.

Ensuite sur chaque page du website officiel renvoyée comme https://www.usine-digitale.fr/annuaire-start-up/bigint,197819 on peut utiliser un Web Element Extractor chez phantombuster (par exemple), la j’ai pris juste le nom de domaine (on peut étendre à plusieurs choses si besoin)

Ensuite on scrap chaque page pour choper les données qui intéressent à partir du nom de domaine.

Je pense que c’est pas trop fastidieux j’ai mis quelques minutes pour lancer cela sans une ligne de code (un petit phantom semble suffisant mais y a plein de choses possibles bien entendu) .

En espérant avoir été assez clair

++

Nicolusmaximus · Septembre 13, 2022, 9:35

ça m’a l’air top je vais tester ça merci

Nicolusmaximus · Septembre 13, 2022, 9:36

Merci beaucoup pour ton temps c’est top aussi !

system · Septembre 13, 2023, 9:36

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.