Enrichissement FRANCHISE

Bonjour tout le monde, j’ai une problématique actuelle : Créer une liste de franchise enrichie avec info juridique & nom du dirigeant si possible

Voici ma méthodologie mais qui ne me permet pas d’avoir des résultats fiables :

→ Annuaire des franchises par région → Extraction des noms de franchise

→ Scrapping google map avec requête “nom de la franchise + région” → Extraction des 3 à 5 établissements d’une franchise dans la région cible avec numéro / téléphone / site web

C’est là ou ça se corce, l’enrichissement des infos juridiques

→ Script python via l’API DATA.GOUV qui essaye de matcher l’adresse et le nom avec la base datagouv.

Le soucis c’est que les résultats sont vraiment pas précis et parfois non trouvés (seulement 30% à 40% de find je dirais et peu de fiabilité)

Auriez vous des pistes d’amélioration ?
Est-ce que mon idée initiale est bonne ou alors il y a un autre angle à prendre plus intéressant ?

Dans l’idéal je souhaiterai un résultat comme ci dessus :
BOULANGERIE ANGE (SIEGE SOCIAL) / ADRESSE / CODE POSTAL / VILLE / SIRET / SIREN / Tranche salarié / info Gmaps
BOULANGERIE ANGE (ETABLISSEMENT 1) / ADRESSE / CODE POSTAL / VILLE SIRET / SIREN / Tranche salarié / info Gmaps
BOULANGERIE ANGE (ETABLISSEMENT 2) / ADRESSE / CODE POSTAL / VILLE SIRET / SIREN / Tranche salarié / info Gmaps

Etc avec un résultat fiable.

Merci d’avance pour votre temps ! :slight_smile:

Salut @Ayuki,

Ton problème de matching DATA.GOUV à 30-40% c’est classique, leur API est vraiment pas faite pour du fuzzy matching sur des noms d’entreprise.

Teste l’API Pappers à la place, tu peux chercher par dénomination + code postal et leur matching est beaucoup plus tolérant. On est passé de ~35% à quasi 75% juste en switchant. Et une fois que t’as le SIREN, Pappers te sort les dirigeants avec nom + fonction directement depuis le RCS.

Pour les cas où t’as l’URL du site mais pas le nom exact, un scraper sur les pages /mentions-legales récupère souvent le SIRET en dur (regex 14 chiffres).

1 « J'aime »

Salut Olivier merci beaucoup pour ta réponse remplie de bonne infos !
Je vais tester ça de suite ! :slight_smile: