Atteindre les journalistes

Bonjour,

J’ai trouvé un site référençant plusieurs journaux avec les contacts. Cependant sur une grande échelle avec l’importxml, Octoparse, Webscrapper et Chatgpt, je n’ai pas réussi à trouver le moyen d’automatiser le scrap de cette page je souhaite récupérer l’adresse mail est-ce que vous aurez des pistes s’il vous plait ?

Bonjour @Othmane6920,

J’ai l’impression que cela fonctionne plutôt bien avec l’extension Google Chrome Instant Data Scraper. Je suis étonné que de ton côté cela ne fonctionne pas avec Octoparse.

1 « J'aime »

Les adresses email sont protégées par cloudflare.
Il faut que la page soit "rendue "pour qu’elles apparaissent (avec du js).
Il faut donc un outil qui permette d’exécuter le js avant de récupérer les données (comme sélénium par exemple).
Ou alors réussir à déchiffrer les données comme le fait le script
/cdn-cgi/l/email-protection#7d37180f1210185330322f343334382f383d0d081f111415181f19120e531b0f
Donne
[email protected]

Top merci, pour octoparse, il doit avoir sa limite sûrement