Scraping & enrichissement B2B à partir de nom de société + siret

Hello La Communauté,

Pour vous quel est le meilleur process (méthode, outils, etc) pour enrichir une BDD B2B à partir des infos suivantes :
Nom entreprise+numéro de siret

Objectif de récupération :

Site web de l’entreprise (Nom de domaine)
Nom du dirigeant
Adresse postal du siège social
CA (si dispo)
Capital social
Numéro de tel fixe du standard/siège social
Année de création de l’entreprise

Pas besoin des e-mails, c’est pour faire du Lead scoring.

Des idées ?

1 « J'aime »

hello dans ton cas un scrap des sites qui reference les sociétés suffirait type verif.com et infogreffe société.com… après tu as plusieurs outils via La toolbox du growth hacker 💎 rubrique scraping

Hello @growthimmo,

A partir du SIRET seul, tu peux récupérer des informations directement à partir de:

  • la base SIRENE (API)
  • Infogreffe, societe dot com et similaires
  • pourquoi pas societeinfo pour enrichir avec le site web / nom de domaine

A partir du nom de l’entreprise + SIRET:

  • Google SERP, pour récupération n° de tel dans l’encart à droite si le résultat apparaît comme un Google Place

Pour les outils, le plus simple serait de tout scripter toi même via:

  • Python ou Nodejs si les requêtes HTTP seules suffisent
  • Nodejs + Puppeteer si besoin de passer en headless browser

ou:

  • Sinon, pourquoi pas utiliser quand c’est possible l’extension WebScraper (exemple: sur societe dot com).
  • Certaines des briques/API de PhantomBuster pourraient t’intéresser également, par exemple le Domaine Name Finder.

Mais pour aller plus loin tu pourrais aussi inclure dans tes objectifs de récupération d’autres métriques en vue d’un lead scoring encore plus poussé:

  • Taille des effectifs
  • Social network participation
  • Social network connections
  • Social network influence

Pour l’extraction des données propres aux réseaux sociaux, il est possible d’identifier les liens des pages (via bot personnalisé ou PhantomBuster) à partir du website de l’entreprise quand on l’a:

  • Linkedin
  • Twitter
  • Instagram
5 « J'aime »

Comme toujours, tes retours sont aussi quali que détaillés @ScrapingExpert ! Merci aussi à toi @Kev1 pour ton retour très pertinent.

Je vais creuser ça !

2 « J'aime »

En effet la réponse de @ScrapingExpert est plus que complète !
En fonction de ta volumétrie et du budget dont tu dispos je recommanderais quand même d’utiliser directement societeinfo en API qui te donnera l’ensemble des infos que tu recherches en une seule requête :wink:

Mon entreprise http://www.explore.fr est spécialisée dans la data. N’hésite pas si tu souhaite pousser ton analyse encore plus loin (possibilité d’ajouter de la connaissance client en plus d’une API de sirétisation par exemple…).

A te lire