Bonjour à tous,
Je cherche de l’aide pour scraper et obtenir une base de donnée de tous les conseiller en gestion de patrimoine, conseiller en investissement financier, courtier en assurance… en gros tous les professionnels inscrit au Registre unique des Intermédiaires en Assurance Banque et Finance (ORIAS) avec leurs coordonnées de contact. Il est possible de cibler également les cabinets qui représentent ces professionnels.
Est-ce que vous auriez des pistes ? des sources exploitables ? des outils adéquats ?
Plusieurs difficultés rencontrées :
Nombreuses appellations différentes et spécialités différentes pour des services similaires
On fait le boulot pour un membre du forum de la LGM.
voici un échantillon :
Le travail est simple mais peut être un peu fastidieux :
Les conseillers en gestion de patrimoine (CGP) n’ont pas un code NAF spécifique.
Sur le site de l’ORIAS, en saisissant le numéro Siren, tu peux récupérer les informations sur leur inscription et leur catégorie (voir le Google Sheet).
Le travail consiste donc à identifier de manière large les CGP (sans se limiter aux codes NAF, en croisant énormément d’infos) et à interroger le site de l’ORIAS.
tu télécharges la base Siren, tu auras la base des sociétés assez réduite en information mais cela suffira, tu auras le code naf + le siren de la société, mais tu ne pourras pas envoyer des 100.000 aine de millier de requêtes donc soit malin pour réduire le nombre de siren à envoyer.
Je crois que sociétéinfo à aussi la base, mais ce que me disait le membre du forum de la lgm, le fichier est pas assez mis à jour et pas assez en volume
de mémoire on a 15.000 sirets ( établissements) inscrit à l’orias.
La recherche de contact ensuite est très facile. car tu as les sociétés. donc du sales nav, ou tu as pleins de solutions qui le font.
De mémoire on avait fait une pré séléction avec plusieurs code naf + gmb.
un fois qu’on avait 60-100k siren a testé on a fait un script pour requeter L’orias, de mémoire il y’a une petite protection cloudflare, mais ca saute avec puppeteer.
Mais je crois que le membre de ce fameux forum avait essayé. On commence a être dans de la data b2b customs. Elle se travaille comme un artisan.
Je suis en vacances, je ne peux pas m’empêcher de regarder ce qui se passe. Donc si tu n’as pas trouver de solution, n’hésites pas à me contacter la semaine prochaine. J’ai fais de nombreux SaaS autour de la data et je fais beaucoup de projet data b2b. Et la base CGP je l’ai bien mise en valeur. Un gros provider me l’a aussi acheté avec une maj mensuel, bon il la revend une fortune donc ce n’est pas interessant.
Regarde Sales Nav, regarde Societeinfo etc … mais sans trop spolier tu seras déçus.
Il faut la base siren : récupérer les siren des codes naf en faisant un inter avec les google maps. pour te faire une pré sélection d’un bon cgp
ensuite requeter le site de l’orias en utilisant nodejs ou python
récupérer la liste
enrichir les contacts ( spoiler encore, beaucoup de cgp ne sont pas sur linkedin)
Y’a un peu de travaille, je ne connais pas ton niveau, mais si tu fais du growth de facon gentillette, aucune chance que tu fasse cette liste orias rapidement.
Effectivement, il y a pas mal de barrière pour y arriver correctement.
Je suis débutant, mis à part Data Miner et d’autres scrapers de ce style, je ne connais pas trop.
Tu proposes des services de scraping par hasard ? On peut peut-être travailler ensemble.
Nop, je ne propose pas de service de scraping à proprement parlé, le scraping est juste un outil pour ma boite. Ton besoin fait intervenir pas mal de savoir faire, c’est souvent la qu’on intervient.
Je travaille avec des clients qui distribuent des produits à destination des CGPs. Si besoin, j’ai 5 à 6k de leads que j’ai travaillés et que je mets à jour régulièrement, incluant des sources comme Apredia, SN, CNCGP et Google Maps.
tu as pas tords du tout, mais la nomenclature naf n’'étant pas fiable… voici tous les codes naf de sociétés inscrites en cgp sur le site de l’orias , dont le 66.30z
NB : ma société dans ses status dit qu’elle fait de l’hébergement de data, ils ont réussi à me mettre le code naf : programmation et developpement informatique … tu ne choisis pas ton code naf c’est l’institution qui te le choisi arbitrairement en fonction de ce qu’ils comprennent; Peu de chance de se tromper avec l’activité de boucher, mais plus une activité à de la valeur plus le risque est grand.
Petite question sur le sujet : pour les courtiers en assurance + agents généraux à part l’ORIAS vous connaissez d’autres méthodes pour récupérer leurs coordonnées ?