Hello à tous,
Je cherche une solution pour automatiser mon data quality dans Hubspot. On a de plus en plus de leads et on rencontre les 3 problèmes classiques :
- Gérer les duplicates
- Problèmes de formatting
- Enrichissement
Nos leads (Companies/Contacst) sont soit créeés via des Inbounds soit via des Outbound où on utilise Linkedin pour identifier et Lusha/Surfe pour enrichir et pousser dans Hubspot.
Hubspot fait une partie de l’enrichissement en native (du moins pour les Companies), mais gère mal les duplicate et le formatting.
Aujourd’hui, on fait notre data quality de manière occasionnel et en bulk via Claude.
Il y a bien sur leur Data Hub mais a 800€/mois (sans doute négociable), je me demande s’il n’y a pas des meilleurs options pour automatiser ce data quality pour chaque nouvelle entry?
Any ideas?
C’est quoi tes problèmes de formatting ?
Même chantier de notre côté sur la propreté de la data.
On gère les anomalies via Claude et les corrigeons petit à petit mais reste la question des duplicate (déjà un peu traités par Koalify) + de l’enrichissement constant.
Je suis curieux des idées !
1 « J'aime »
Top. Merci déjà pour l’info sur Koalify, je connaissais pas?
Ca fait le job pour les duplicates (Contact et Companies)?
J’ai une solution qui marche pas mal mais qui n’est pas rapide, surtout s’il faut reprendre un stock, mais nickel pour nettoyer les données entrantes au fil de l’eau, je l’utilise pour passer d’un soft à un autre, il y a toujours des pb de formats.
Avec un outil no-code d’automation → tu lis toutes les data une par une → tu crées des router qui vérifient les formats → si c’est pas bon tu corriges (soit en formatant, soit avec IA générative).
(ça m’est arrivé de faire tourner ça tout un week end pour un gros volume avec un rate-limit sur l’API, mais ça finit par se faire)
Et c’est une solution homemade que tu as développé ? Si oui, avec quel stack?
“presque” home made, c’est un fork de la solution open source active pieces, pour lequel on crée des connecteurs avec les API des applis françaises (qui sont sous représentées dans les outils d’automation), ça permet à des éditeurs FR de vendre leurs SaaS comme interconnectés avec les grands SaaS du marché, proposer des templates d’automation…
plus d’info ici pour les curieux https://theapproad.com/
Pour l’exemple que je t’ai donné, c’est avec les outils basiques de la plateforme : lire les data d’un SaaS connecté (par exemple Hubspot) ou d’une feuille google Sheet → traitement → modifier dans Hubspot (ou ajouter selon les cas). Si le traitement le nécessite, tu ajoutes la brique IA de ton choix (avec ton token) et tu fais compléter.
Le cas typique, c’est de capter un siret, et de faire tourner les API open data pour enrichir (dans mon cas pour avoir les label Qualiopi des organismes de formation et savoir qui fait de la VAE, du CFA ou du BDC)