Scraper Glassdoor page Entreprise

Bonjour,

Je suis novice, voire même complètement débutant en matière de scraping.

J’ai besoin de récupérer les listes d’entreprises ainsi que les pages des entreprises sur Glassdoor. J’ai essayé d’utiliser Octoparse, mais je trouve cet outil assez complexe :slight_smile:

Auriez-vous d’autres suggestions pour effectuer le scraping de manière plus intuitive ?

Merci beaucoup !

Bonjour,
Je te propose de passer par Python. Je sais que cela peut sembler un peu laborieux pour se former, mais une fois que tu auras acquis les connaissances nécessaires, tu auras tous ce qu’il te faut et bien plus encore.

Je te recommande les bibliothèques suivantes :

  • Requests (pour effectuer tes requêtes HTTP, c’est-à-dire te connecter à l’URL que tu souhaites scraper).

  • BeautifulSoup (un parser très réputé, bien que je ne l’utilise pas personnellement, c’est sans doute un excellent outil).

Une connaissance basique du DOM est nécessaire.

Maintenant, en ce qui concerne l’aspect intuitif, je ne vois rien de mieux que d’écrire du code. En fait, c’est toi-même qui concevras ton programme de scraping et donc qui imagineras tout son fonctionnement. Cela te permettra de te passer de services de scraping qui pourraient s’avérer inefficaces sur certaine de t’ai problématique.

J’espère avoir été utile et je te souhaite une excellente journée !

1 « J'aime »

(Désoler pour les endroits où le texte n’était pas cohérent, dû à un problème avec mon écran de téléphone, j’ai fait corriger le message par chatgpt pour aller plus vite, mais je n’avais pas trop le temps de checker le résultat jusqu’à maintenant)

Autre chose très honnêtement si tu n’es pas trop expérimenté en python, cela ne me dérangerai pas de te donner un coup de main ou de t’aiguiller, si jamais mon contact est dans ma bio !

1 « J'aime »