Scraper des professionnels de santé (du privé)

L’objectif est surtout d’identifier une source fiable sur les différentes spécialités (dentiste, kiné, ophtalmo, médecin esthétique, etc…)

Merci d’avance ^^

Hello, c’est quoi la question exactement? :grin:

1 J'aime

Scrappenchez doctolib … Mais là c’est du hacking et bonne chance

Du hacking ? Pourquoi ? Comment ? Où ? Sur quelle planète ?

2 J'aimes

Déja que de base il n’y a pas de question très claire posée dans ce topic… :joy:
@timtim: Scrappenchez ? Kezako?

Je vois pas comment être plus clair désolé… je peux traduire en Mandarin et pléthore d’autres langues si ça peut aider certain

C’est une sorte de danse qu’effectue le scraper avant de lancer son script

4 J'aimes

En Sumérien pour moi stp :wink:

Non la question n’est pas très clair, car tu dis scraper, mais tu ne précises pas quoi. Le nom, l’adresse, le mail ?

1 J'aime

Amargi dagal an-ki asbu :wink:

c’est vrai que c’est plus synthétique dans cette langue

prénom et nom ce serait déjà très bien ! je me doute qu’obtenir le mail en supplément serait présomptueux, j’utiliserais un autre outil pour cela :slight_smile:

https://www.doctolib.fr/sitemap.xml

Source fiable pour les professionnels de la santé en France: l’Annuaire Santé, plus de 1.5 millions de pro y sont recensés avec nom, prénom, lieu d’exercice, cabinet si cabinet il y a, email parfois.

2 J'aimes

Vous êtes trop sympa @ScrapingExpert / @camillebesse

6 J'aimes

Je suis un ancien de Doctolib et j’ai pas mal taffé là-dessus. Tous les sites utilisent une version plus ou moins à jour de la base Ameli.
Je pense qu’Ameli sera plus simple à scraper que Doctolib (qui normalement injecte de fausses données au-dessus d’un certain seuil). A l’époque l’appli mobile était la meilleure porte d’entrée.

4 J'aimes

Intéressant, merci @GEDEA

1 J'aime

Merci beaucoup @GEDEA en effet très intéressant je vais aller voir ça, je compte aussi viser les différentes BDD des ordres de chaque spécialité qui ont pas mal d’info en publics comme sur le lien ci-dessous où l’on peut filtrer à sa guise et le résultat semble exhaustif, manquerait plus que l’url web des praticiens ayant un site internet afin de gratter les adresses mails qui y sont référencés : https://www.conseil-national.medecin.fr/annuaire

Un petit rappel vis à vis de l’info que j’ai apporté récemment, j’ai parlé de l’Annuaire Santé, c’est la base officielle utilisée par Ameli.

C’est de là que proviennent la plupart des données « communes » qu’on peut trouver ici et là, et il y a fort à parier que Doctolib l’ait utilisé et/ou l’utilise toujours…

Le seul bémol vis à vis de cette base officielle, c’est le manque d’un moteur de recherche puissant.

Mais ces données, couplée à des données scrapées depuis Google SERP ou Google Places, c’est le Graal.

3 J'aimes

Exactement, Ameli est beaucoup plus fiable que Doctolib qui n’est pas à jour sur bcp de pros. On se demande d’ailleurs pourquoi Ameli ne branche pas le petit truc qu’il faut pour proposer aux internautes et aux docteurs les mêmes services que Doctolib… peut-être que l’argent levé par Doctolib sert à payer quelques décideurs chez Ameli pour empêcher ceci :-))