Scraping profession règlementée ( CGP )

Bonjour à tous,
Je cherche de l’aide pour scraper et obtenir une base de donnée de tous les conseiller en gestion de patrimoine, conseiller en investissement financier, courtier en assurance… en gros tous les professionnels inscrit au Registre unique des Intermédiaires en Assurance Banque et Finance (ORIAS) avec leurs coordonnées de contact. Il est possible de cibler également les cabinets qui représentent ces professionnels.

Est-ce que vous auriez des pistes ? des sources exploitables ? des outils adéquats ?

Plusieurs difficultés rencontrées :

  • Nombreuses appellations différentes et spécialités différentes pour des services similaires
  • Base de donnée souvent peu publique

Merci pour votre aide !

Salut,

On fait le boulot pour un membre du forum de la LGM.

voici un échantillon :

Le travail est simple mais peut être un peu fastidieux :

Les conseillers en gestion de patrimoine (CGP) n’ont pas un code NAF spécifique.
Sur le site de l’ORIAS, en saisissant le numéro Siren, tu peux récupérer les informations sur leur inscription et leur catégorie (voir le Google Sheet).
Le travail consiste donc à identifier de manière large les CGP (sans se limiter aux codes NAF, en croisant énormément d’infos) et à interroger le site de l’ORIAS.

tu télécharges la base Siren, tu auras la base des sociétés assez réduite en information mais cela suffira, tu auras le code naf + le siren de la société, mais tu ne pourras pas envoyer des 100.000 aine de millier de requêtes donc soit malin pour réduire le nombre de siren à envoyer.

Je crois que sociétéinfo à aussi la base, mais ce que me disait le membre du forum de la lgm, le fichier est pas assez mis à jour et pas assez en volume

de mémoire on a 15.000 sirets ( établissements) inscrit à l’orias.

La recherche de contact ensuite est très facile. car tu as les sociétés. donc du sales nav, ou tu as pleins de solutions qui le font.

Merci pour ta réponse,
Est ce qu’il ne vaut pas mieux scrapper directement Sales nav avec le filtre d’activité/ titre ?

Et que penses-tu de ce code NAF 6622Z ? ( code APE )

il y’a des cgp dedans mais il en faut d’autres.

De mémoire on avait fait une pré séléction avec plusieurs code naf + gmb.

un fois qu’on avait 60-100k siren a testé on a fait un script pour requeter L’orias, de mémoire il y’a une petite protection cloudflare, mais ca saute avec puppeteer.

je te conseille de faire ton xp, et d’essayer

Mais je crois que le membre de ce fameux forum avait essayé. On commence a être dans de la data b2b customs. Elle se travaille comme un artisan.

Je suis en vacances, je ne peux pas m’empêcher de regarder ce qui se passe. Donc si tu n’as pas trouver de solution, n’hésites pas à me contacter la semaine prochaine. J’ai fais de nombreux SaaS autour de la data et je fais beaucoup de projet data b2b. Et la base CGP je l’ai bien mise en valeur. Un gros provider me l’a aussi acheté avec une maj mensuel, bon il la revend une fortune donc ce n’est pas interessant.

Regarde Sales Nav, regarde Societeinfo etc … mais sans trop spolier tu seras déçus.

Il faut la base siren : récupérer les siren des codes naf en faisant un inter avec les google maps. pour te faire une pré sélection d’un bon cgp

ensuite requeter le site de l’orias en utilisant nodejs ou python

récupérer la liste

enrichir les contacts ( spoiler encore, beaucoup de cgp ne sont pas sur linkedin)

enrichir les mails via du Icypeas, enrow, dropcontact

Y’a un peu de travaille, je ne connais pas ton niveau, mais si tu fais du growth de facon gentillette, aucune chance que tu fasse cette liste orias rapidement.

Effectivement, il y a pas mal de barrière pour y arriver correctement.
Je suis débutant, mis à part Data Miner et d’autres scrapers de ce style, je ne connais pas trop.

Tu proposes des services de scraping par hasard ? On peut peut-être travailler ensemble.

Nop, je ne propose pas de service de scraping à proprement parlé, le scraping est juste un outil pour ma boite. Ton besoin fait intervenir pas mal de savoir faire, c’est souvent la qu’on intervient.

@kevinclt propose des services de scraping

Tu peux aussi trouver des presta sur fiverr ou autres.

La difficulté est de monté le projet.

Mon conseil est quand meme que tu essayes de ton côté de creer la mécanique, le process. et de voir apres ce que tu dois faire

1 « J'aime »

Un cgp a un code naf 66.30Z
Il faut télécharger le zip des fichiers Siren sur le site du Siren sur google et filtrer par le code Naf gestion de fond

1 « J'aime »

Hello,

Je travaille avec des clients qui distribuent des produits à destination des CGPs. Si besoin, j’ai 5 à 6k de leads que j’ai travaillés et que je mets à jour régulièrement, incluant des sources comme Apredia, SN, CNCGP et Google Maps.

On peut en discuter par MP si besoin

tu as pas tords du tout, mais la nomenclature naf n’'étant pas fiable… voici tous les codes naf de sociétés inscrites en cgp sur le site de l’orias , dont le 66.30z

Code NAF/APE
69.20Z
66.22Z
70.22Z
66.19B
68.31Z
68.20A
65.12Z
68.20B
66.29Z
46.19B
68.10Z
70.10Z
68.32B
66.30Z
64.20Z
62.01Z
74.90B
46.13Z
46.18Z
35.11Z
96.09Z
64.92Z
65.11Z
68.32A
85.42Z
82.99Z
64.99Z
85.59B
46.11Z
47.99A
01.45Z
64.19Z
62.02A
35.14Z
47.78A
46.45Z
82.11Z
66.12Z
85.51Z
73.20Z
64.30Z
85.59A
84.30B
55.20Z
55.10Z
71.12B
72.20Z
66.19A

NB : ma société dans ses status dit qu’elle fait de l’hébergement de data, ils ont réussi à me mettre le code naf : programmation et developpement informatique … tu ne choisis pas ton code naf c’est l’institution qui te le choisi arbitrairement en fonction de ce qu’ils comprennent; Peu de chance de se tromper avec l’activité de boucher, mais plus une activité à de la valeur plus le risque est grand.

1 « J'aime »

Petite question sur le sujet : pour les courtiers en assurance + agents généraux à part l’ORIAS vous connaissez d’autres méthodes pour récupérer leurs coordonnées ?