Aide Scraping salon

Salut la team,

J’aimerai scrapper les mails des exposants d’un salon, mais la difficulté est que les mails sont dans les fiches des exposants et non pas directement sur la liste globale (impossible donc d’utiliser IDS).

Pour info, voici le salon en question : Liste des exposants

Idealement, j’aimerai apprendre à reproduire ce scrapping, si quelqu’un parmis vous à la clef :slight_smile:

Merci pour votre aide !

Pour charger la page en question, il y a un appel à l’API d’Algolia et dans les résultats tu as toutes les infos (emails, tel etc…)

Voici le résultat, normalement tu as toutes les données…
Tu peux aussi facilement le convertir en Excel si besoin

2 « J'aime »

Je me souviens d’une histoire où un stand du salon avait mis en place un Wi-Fi public avec un formulaire pour accéder à la connexion.
Je dis ça. j’dis rien

1 « J'aime »

je ferais le truc en 2 phases: phases 1 tu récupère les url des site web (présent dans le code et donc scrapable via web scraper ou instant data miner.

dans un second temps le crawler mail finder de phantombuster

Si ça t’aide, j’en suis heureux.

PS : j’irai chercher les mails comme ça, tu peux en parler à récupérer ceux que les scraps n’ont pas trouvés.

1 « J'aime »

Tu es au top Merci ! c’est exactement le genre de doc qu’il me faut.

Est ce que tu pourrais m’expliquer en 2 mots comment tu as fait pour obtenir ce Json via l’API d’Algolia?

Merci, tu pourrai m’indiquer la partie de recuperer les urls dans le code du site ? La suite avec Phantombuster je connais

1 « J'aime »
  1. j’ai trouvé l’appel dans les ressources chargées par la page (onglet réseau dans les outils de développement du navigateur)
  2. j’ai adapté la requête pour récupérer l’ensemble des éléments en une seule fois (sinon il y a une pagination)
1 « J'aime »