Avant de commencer, je dois préciser que je n’ai aucun background tech. Je ne sais pas du tout coder …
J’essaye d’obtenir la liste des medecins du site suivant : OnlineDoctor
En regardant le code source de la page je vois qu’il y a énormément d’infos sur les medecins :
Nom
Prénom
Adresse
Email
D’autres infos aussi mais qui m’intéressent moins.
Sauriez vous me dire comment transformer le code HTML en quelque chose d’utilisable ? Idéalement une liste que je puisse transposer sur excel ?
il y a plus simple, sans parcourir toutes les pages du site avec un scrapper :
Tu récupères le json contenu dans le code source de la page (view-source:h ttps://doctors.onlinedoctor.cloud/de/t/de/map-iframe) que tu as vu.
Il y a toutes les données dedans.
Tu le converti en tableau (juste la liste de « doctors ») si tu préfères.
Ça te fait une jolie liste de 537 éléments :
Merci à tous les 2 pour votre aide (@Morph@Sonic)
J’ai réussi après quelques essais !
Est il ensuite possible d’envoyer un mail à ces personnes ?
Un utilisateur lambda peut uniquement voir le nom et l’adresse de ces medecins. Leur email est accessible uniquement dans le code source de la page. Est ce que l’utiliser pour envoyer 1-2 mails / an est légal ?
Non en soi ces données m’importent peu mais c’est surtout pour la méthode !
Dernière question je suis vraiment débutant dès qu’il s’agit de ligne de code, en commençant à copier à partir de l’endroit où tu m’as montré jusqu’à la fin ( avant la balise script ) je n’obtiens rien de spécial, comment savoir jusqu’où copier ? Merci encore
Pour la méthode, il faut quand même des bases techniques.
Regarde ce qu’est un JSON, il est délimité par { et }
Tu peux le visualiser avec des outils en ligne comme celui-ci.
Dedans, comme je le disais plus haut, il y a un tableau « doctors » avec toutes les données.