Scrapper plusieurs pages sans coder


#1

Bonjour,

Je suis débutant en scrapping et je souhaiterais récupérer les noms/adresse des médecins dans chaque département sur doctolib pour une étude personnelle que je mène.
J’arrive à scrapper une page sur import.io mais les il n’y a que 10 résultats par pages et un grand nombre de résultats. J’ai essayé les méthodes énoncées dans les sujets précédents mais je ne trouve pas de solution simple pour mon problème.

merci d’avance


#2

Bonjour @JeanM,

De mon côté ça marche très bien.
Tu peux réessayer ?

Start: https://app.import.io/dash/extractors/

Screenshot%20from%202018-07-09%2015-55-19



#3

Bonjour @VivianSolide,

Merci pour ton aide.
En effet, on peut extraire les données pour plusieurs URL.
Cependant je suis limité à 500 URL (est-ce parce que j’utilise la version gratuite ?). La version payante coûte 300$ ce qui est beaucoup pour ce dont j’ai besoin (extraction pour 7187 URL, je cherche uniquement des informations sur les médecins généralistes).
Y a-t-il un autre moyen d’y parvenir ?


#4

Import.io est en effet assez cher.
L’autre moyen serait peut être d’utiliser Apify.
Par contre il faut avoir des (petites) bases en code.


#5

Merci pour l’info je vais tester aussi


#6

Je suis preneur pour ton code @Tanguyb si tu y arrives :slight_smile:
Je manque de bases …


#7

Merci pour votre aide !

Je manque de bases pour ce type de code…
@Tanguyb si tu es prêt à m’aider en mp je t’en serais très redevant :slight_smile:


#8

@JeanM pour le moment je n y suis pas arrive … je suis très loin de savoir coder mais je me force, je cherche et c est avec plaisir que je partagerai si cela fonctionne …


#9

Vous êtes bloqué sur quoi ?


#10

Moi je ne connais pas java donc je suis bloqué assez tôt …


#11

Je te confirme cette fameuse idée dont je te parlais, faire quelques formations scraping pour débutants, reste à éluder la partie initiation code qui s’avère être la moins évidente j’imagine…


#12

Bonjour @JeanM

Il existait cette tres bonne solution, mais il me semble qu’il ne la vend plus sur son site.
Le programme fonctionne toujours si tu arrives à l’acheter

https://gsa-email-spider.soft112.com/

Francois


Communauté initiée par @camillebesse avec l'aide de @Cebri@JulienD@VivianSolide@Boristchangang
Follow @growthhackingfr