Bonjour tout le monde, j’ai une problématique actuelle : Créer une liste de franchise enrichie avec info juridique & nom du dirigeant si possible
Voici ma méthodologie mais qui ne me permet pas d’avoir des résultats fiables :
→ Annuaire des franchises par région → Extraction des noms de franchise
→ Scrapping google map avec requête “nom de la franchise + région” → Extraction des 3 à 5 établissements d’une franchise dans la région cible avec numéro / téléphone / site web
C’est là ou ça se corce, l’enrichissement des infos juridiques
→ Script python via l’API DATA.GOUV qui essaye de matcher l’adresse et le nom avec la base datagouv.
Le soucis c’est que les résultats sont vraiment pas précis et parfois non trouvés (seulement 30% à 40% de find je dirais et peu de fiabilité)
Auriez vous des pistes d’amélioration ?
Est-ce que mon idée initiale est bonne ou alors il y a un autre angle à prendre plus intéressant ?
Dans l’idéal je souhaiterai un résultat comme ci dessus :
BOULANGERIE ANGE (SIEGE SOCIAL) / ADRESSE / CODE POSTAL / VILLE / SIRET / SIREN / Tranche salarié / info Gmaps
BOULANGERIE ANGE (ETABLISSEMENT 1) / ADRESSE / CODE POSTAL / VILLE SIRET / SIREN / Tranche salarié / info Gmaps
BOULANGERIE ANGE (ETABLISSEMENT 2) / ADRESSE / CODE POSTAL / VILLE SIRET / SIREN / Tranche salarié / info Gmaps
Etc avec un résultat fiable.
Merci d’avance pour votre temps ! ![]()