je cherche actuellement à me créer une base de donnée regroupant toutes les agences web en France et à l’international.
Les filtres sur linkedin sont assez limités et ne donnent pas un retour complet.
Dux soup m’a permis d’ajouter certains prospects cibles mais je n’ai pas une vue exacte de mon marché.
Avant de me lancer dans un scraping bourrin de Gmaps sur les plus grosses villes de chaque pays, auriez vous d’autres outils /process à me conseiller?
Merci pour ton message. Voici les informations que je cherche :
Les basiques :
Nom de l’agence
Adresse 1
Adresse 2
CP
Ville
Pays
CA
Nombre de salariés
Nom du dirigeant
Les plus :
Trafic sur la page :
Type : agence SEO, marketing, web
CMS cités sur le site : Magento, shopify, prestashop, …
URL du site
URL de la page linkedin
Hello, pour les basiques je t’ai filtré agence web mais c’est pas parfait. Pour les plus, je me suis mis au dressage de bot . J’écris actuellement un à partir de zéro qui est prévu pour me retourner ce genre d’information (enrichissement de données) directement en json ou csv. Je maîtrise pas encore les proxys et autres (@ScrapingExpert en parle ici) donc pour l’instant je me contente des quotas fournis par les api. Je bloque sur l’équivalent de l’APE, SIRET dans les autres pays. Je cherche une liste d’exemple de numéros id d’entreprise et les termes utilisés pour les reconnaitre dans le reste du monde. Si tu as une piste je suis preneur.
@NRateau@lorent ça m’intéresse aussi… je chercherai pour ma part :
Nom de l’agence
Nom du dirigeant
Email du dirigeant
Nom de l’employé 1
Email de l’employé 1
Nom de l’employé 2
Email de l’employé 2
…Etc
Numéro de tél de l’agence
Si qqun a ça sous la main ou un bon deal à proposer.
Super boulot!!
Pour le moment, j’utilise Dux soup + filtre agence web en FR sur linkedin pour me faire mon mapping.
Le CSV que je tire me permet avec un pivot d’estimer les tailles des structures
Seul bémol, je me suis fait striker par Lnkn car étant en freemium j’ai attend ma limite de vue + ils ont repéré l’utilisation d’un bot
Je crois que la DCL (Daily Call Limit) sur Lkd est de 500, c’est à vérifier.
Il aura toujours une barrière quelque part à gérer dans le scraping et l’enrichissement de données.