Pour vous quel est le meilleur process (méthode, outils, etc) pour enrichir une BDD B2B à partir des infos suivantes :
Nom entreprise+numéro de siret
Objectif de récupération :
Site web de l’entreprise (Nom de domaine)
Nom du dirigeant
Adresse postal du siège social
CA (si dispo)
Capital social
Numéro de tel fixe du standard/siège social
Année de création de l’entreprise
Pas besoin des e-mails, c’est pour faire du Lead scoring.
hello dans ton cas un scrap des sites qui reference les sociétés suffirait type verif.com et infogreffe société.com… après tu as plusieurs outils via La toolbox du growth hacker 💎 rubrique scraping
pourquoi pas societeinfo pour enrichir avec le site web / nom de domaine
A partir du nom de l’entreprise + SIRET:
Google SERP, pour récupération n° de tel dans l’encart à droite si le résultat apparaît comme un Google Place
Pour les outils, le plus simple serait de tout scripter toi même via:
Python ou Nodejs si les requêtes HTTP seules suffisent
Nodejs + Puppeteer si besoin de passer en headless browser
ou:
Sinon, pourquoi pas utiliser quand c’est possible l’extension WebScraper (exemple: sur societe dot com).
Certaines des briques/API de PhantomBuster pourraient t’intéresser également, par exemple le Domaine Name Finder.
Mais pour aller plus loin tu pourrais aussi inclure dans tes objectifs de récupération d’autres métriques en vue d’un lead scoring encore plus poussé:
Taille des effectifs
Social network participation
Social network connections
Social network influence
Pour l’extraction des données propres aux réseaux sociaux, il est possible d’identifier les liens des pages (via bot personnalisé ou PhantomBuster) à partir du website de l’entreprise quand on l’a:
En effet la réponse de @ScrapingExpert est plus que complète !
En fonction de ta volumétrie et du budget dont tu dispos je recommanderais quand même d’utiliser directement societeinfo en API qui te donnera l’ensemble des infos que tu recherches en une seule requête
Mon entreprise http://www.explore.fr est spécialisée dans la data. N’hésite pas si tu souhaite pousser ton analyse encore plus loin (possibilité d’ajouter de la connaissance client en plus d’une API de sirétisation par exemple…).