Enrichir extraction Instant Data Scraper

golem105629 · Juin 5, 2022, 9:47

Hello à tous,

Je viens de réaliser une extraction à partir d’un annuaire d’entreprises grâce à Instant Data Scraper.
J’ai pu extraire nom de l’entreprise + un URL qui mène à une fiche pour chacune des entreprises. C’est le contenu de ces fiches qui m’intéresse particulièrement (numéro de téléphone, adresse etc.)

Connaissez-vous un moyen d’enrichir mon fichier qui contient actuellement nom de l’entreprise + l’URL de fiche avec le contenu de la fiche (disponible via l’url) ?

Merci par avance pour vos réponses et bravo à ce forum et la commu toujours au top

Olivier_Niel · Juin 6, 2022, 6:24

Je te propose de faire un import de ton fichier sur apollo.Io

golem105629 · Juin 6, 2022, 1:51

Hello Olivier, merci !
Peux-tu me préciser quel outil/fonction est à privilégier dans ce cas ? Je n’ai encore jamais eu l’occasion de tester appolo.

Thanks !

ClementAubry · Juin 6, 2022, 4:22

Réponse hors sujet pour Apollo, on parle d’URL d’un annuaire et pas de site web de prospect ici.

@golem105629 je te conseille de jeter un coup d’oeil à webscraper.io

golem105629 · Juin 6, 2022, 8:58

Merci @ClementAubry je viens de tester webscraper.io qui pour autant n’a pas l’air de pouvoir répondre exactement à mon besoin. Peut être que mes explications n’étaient pas hyper claires désolé…
Sauf erreur de ma part avec webscraper.io, je suis obligé de visiter les pages une par une pour sélectionner les données à scraper ? Or dans mon cas: une entreprise = une fiche = une URL

Le site se présente comme ceci:
Un annuaire qui liste nom d’entreprise + url menant à la fiche de l’entreprise en question.

Ai-je manqué une fonctionnalité de webscraper.io qui me permettrait de récupéré les infos contenues dans ces fiches ? Ou peut être l’outil n’est t-il pas le plus adapté à mon usage ?

J’espère que mes explications sont un peu plus claires ? En tout cas n’hésite pas si tu as besoin de précisions

ClementAubry · Juin 7, 2022, 8:27

@golem105629 avec webscraper tu peux directement scraper les résultats d’un annuaire (en récupérant les fiches) puis visiter chacune des sous-pages pour récupérer la donnée.

Puisque tu as déjà scrapé les URLs des fiches, tu peux rajouter toutes ces URL en entrée de webscraper pour aller visiter toutes ces pages et extraire la donnée

Cela présuppose simplement que toutes les fiches ont la même structure, ce qui est généralement le cas pour un annuaire

RenaudLT · Juin 7, 2022, 8:50

Très claire clément,
Je ne sais pas s’il existe un comparatif fonctionnel des outils de scrapping, pour s’y retrouver suivant les besoins
dans le cas d’un besoin de capture d’info depuis une page.
En gros au lieu de prendre une photo je récupère les données dans une feuille de calcul

Quel(s) outil(s) est le mieux adapté ??
Merci par avance

PS: j’ai voulu essayer Anypicker mais pas été au bout car c’est payant dès le début et mes besoins sont très ponctuels

ClementAubry · Juin 7, 2022, 12:42

Pour la plupart de mes besoins ponctuels en scraping, j’utilise personnellement les extensions chrome suivantes :

Instant data scraper
Webscraper
Data miner

Si ça ne fonctionne pas, je pars sur du plus technique à savoir flux XHR ou custom code python (requests + BeautifulSoup)

golem105629 · Juin 12, 2022, 7:21

Merci @ClementAubry pour ces précisions, c’est hyper clair et ça fonctionne du tonnerre

system · Juin 12, 2023, 7:21

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.