[URGENT] - Scrapping membres association

Mag_Marketing · Mai 22, 2025, 3:18

Bonjour à tous,

J’ai besoin de votre aide ! Dans le cadre d’une campagne que je dois lancer d’ici peu, j’aimerais scrapper les membres de ce site https://www.gifen.fr/annuaire .
Mon objectif serait de scrapper les informations suivantes, idéalement en CSV :

Nom d’entreprise
Localisation
Code SIRET :
Code NAF :
Type de structure :
Site internet
Téléphone :
Mail :
Nom de l’interlocuteur
Fonction :

Qui pourrais m’aider sur ce sujet ?

Merci d’avance

thomasBO · Mai 22, 2025, 6:13

Salut, c’est possible avec N8N si tu veux

thomasBO · Mai 22, 2025, 6:26

Je peux le faire là rapidement sur n8n ou te fournir le workflow si tu veux

thomasBO · Mai 22, 2025, 7:23

Tiens, tu peux retrouver le fichier CSV Sur ce lien-là : https://tbonhomme.gumroad.com/

Mag_Marketing · Mai 23, 2025, 9:46

Bonjour Thomas.
Merci beaucoup pour ton retour et pour ton aide.
Je veux bien que tu me partages me workflow n8n.
Bonne journée

thomasBO · Mai 23, 2025, 10:06

Oui pas de soucis, voici le détail du workflow que j’ai utilisé pour scraper l’annuaire des entreprises sur le site gifen.fr. Tu pourras l’adapter à d’autres structures similaires si besoin.

Étapes du workflow :

Analyse de la pagination du site
J’ai commencé par comprendre comment les pages de l’annuaire sont structurées.
Génération des URLs de pagination (via un nœud Code)
Un nœud Code génère dynamiquement toutes les URLs de chaque page de l’annuaire.
Scraping des pages de pagination
Chaque page est ensuite scrapée pour récupérer les liens vers les fiches entreprises.
Stockage des URLs dans un Google Sheet
Toutes les URLs récupérées sont stockées dans un Google Sheet pour faciliter l’organisation.
Scraping de chaque fiche entreprise
Le workflow récupère ensuite les infos principales de chaque entreprise à partir de sa fiche individuelle : nom, adresse, SIRET, téléphone, email, site web, etc.
Tout est fait sans API, en nettoyant le HTML directement à l’aide de nœuds Code.

Particularités :

Tu n’as besoin d’aucune API
Workflow 100 % n8n (avec quelques nœuds Code)
Structure facilement réutilisable sur d’autres annuaires
Aucune dépendance externe

Voilà le lien : Workflow scrap

Mag_Marketing · Juin 2, 2025, 4:11

Merci beaucoup pour ton aide et les explications !

Mag_Marketing · Juin 27, 2025, 12:12

Bonjour Thomas,

J’ai essayé de reproduire le workflow que tu as réalisé, sans succès !
J’aimerais réitérer l’exercice mais n’arrives à répliquer l’automatisation via N8n.

Pourrais-tu m’aider ?

Merci d’avance
Bien à toi,
Bonne journée

jadevv · Juin 30, 2025, 3:52

Bonjonr,
T’as essayé Octoparse?

Domesoft · Juin 30, 2025, 1:40

Bonjour,
Je repond un peu tard.
J’ai capturé ces donnees il y a 15 jours. Est ce que tu les veux?

Mag_Marketing · Juillet 17, 2025, 1:01

J’aimerais reproduire l’exercice sur un autre site.
Je n’ai pas réussi à le faire via N8N comme conseillé.

Vinarom · Septembre 3, 2025, 10:01

Bonjour J’aurais besoin du même fichier avec la description de l’activité telle que sur le site. @ThomasBO, peux-tu m’aider stp ? Par ailleurs, je serai intéressé par une formation pour utiliser des outils de scrapping comme N8N ou Octoparse. Merci !