Scrapping de @ sur Doctissimo.com possible ?

Bonjour,

Je souhaite cibler des personnes ayant des troubles du sommeil, anxiété, insomnie est ce qu’il est possible de scrapper les @ sur Doctissimo des personnes ayant ce trouble ?
Sinon quelles pourraient être les autres solutions : j’ai essayé Insta, FB et j’en ai trouvé mais sur ce type de thématique et site en particulier je sèche, merci d’avance à toutes et tous pour vos retours.
Bonne journée,

2 « J'aime »

hello @Elzistero , oui c’est possible directement sur google avec cette recherche :
site:doctolib.fr « @gmail.com »

Puis tu utilises https://apify.com/apify/google-search-scraper pour ensuite utiliser un extraction des emails avec des regex

1 « J'aime »

A priori ça fonctionne plutôt bien oui !

site:doctolib.fr @gmail.com OR @yahoo.com OR @hotmail.fr OR @orange.fr

Capture d’écran 2021-02-23 à 10.38.17|658x500

Euh… Vous êtes sûrs de vous ? @Elzistero parle de Doctissimo et vous avez tous les deux répondu pour Doctolib, ça n’a rien à voir :grinning_face_with_smiling_eyes:

Ces business en « docto » hahah tu peux partager l’une de page que tu veux scrapper @Elzistero ?

Merci @thomas_1 mais du coup je peux pas avoir les mails des patients ? Car je n’ai que les praticiens c’est impossible à trouver je suppose même sur Doctolib ? L’idée est de pouvoir trouver des patients avec pour pathologie « insomnie » « trouble du sommeil » « anxiété » « stress chronique »
Merci Thomas

Hello @Kevin_Dfr tout simplement merci !
C’est une super idée.
Bonne journée à toi et longue vie à Growthhacking.fr

1 « J'aime »

Rebonjour @Kevin_Dfr

Voici un exemple que je souhaiterai scrapper en gros tous les forums dédiés à l’insomnie mais je peux peut être mentionner uniquement dans la barre de recherche « Forum Doctissimo Insomnie »
Capture ci-jointe.
Mon but est de pouvoir agglomérer le maximum de mail provenant des forums dédiés à ce type de soucis :slight_smile: ou stress ou anxiété.
Merci

Oui ça marche alors : plutôt avec cette URL : )
site:https://forum.doctissimo.fr/psychologie/insomnie-sommeil « @gmail.com » OR « @hotmail.fr »

1 « J'aime »

Super Merci @Kevin_Dfr

1 « J'aime »

Il faudrait pas plutôt utiliser l’opérateur booléen « inurl: » au lieu de « site: » ?
D’ailleurs j’ai fait le test par curiosité mais je trouve quasi rien pour info @Elzistero … (0 résultat avec « site: » et 1 résultat avec « inurl ») :confused:

Tu as dû te tromper, ce qu’il a proposé fonctionne :

site:https://forum.doctissimo.fr/psychologie/insomnie-sommeil "@gmail.com" OR "@yahoo.fr"

Mais ça ne renvoie que 22 résultats.

En effet, mais c’est parce que tu as testé avec yahoo.fr et Kevin avait mis hotmail.fr !
Par contre, il y a un truc que je comprends pas : quand je teste ta requête avec « inurl: » au lieu de « site: » je trouve 24 résultats, tous différents de ceux provenant de ta requête avec « site: ». Je suis loin d’être un expert en la matière mais du coup ça attise ma curiosité… Quelqu’un à une explication ?

Merci oui c’est sur que je trouve beaucoup moins de résultats que lorsque je scrappe FB ou Insta avec la même technique, peut être qu’il y a tout simplement moins de gens qui laissent leur mail sur ce type de forum ce que je peux comprendre mais même avec une autre technique j’ai aucun résultat

Barre Google : « Insomnie » filetype:csv @gmail.com OR @yahoo.fr OR @wanadoo.fr (pour les plus vieux) toujours rien alors que sur d’autres thématiques c’est la totale ex : sport etc… Merci en tout cas vous êtes au top !

1 « J'aime »

Hello ! Possible de filtre en fonction du pays ?

Site > c’est une recherche sur le domaine
inurl > dans l’url (https://{ce-que-tu-recherche})

Dorkez sur du intext plutôt ou du intitle des fois ça fonctionne :grinning:

Bonjour Thomas,
Sur ton screenshot, comment fais-tu pour avoir le listing des emails dans le meme doc?