Scraping grilles d'émissions de radio

Hello tout le monde,

Mon meilleur pote est doctorant en Histoire et a besoin de scraper par milliers des pages de grilles de radio, est-ce que vous auriez un moyen simple ou des idées afin de de transposer les résultats des pages suivantes sur un fichier csv ? Merci :slightly_smiling_face:

http://www.radioscope.fr/grilles/index-rtl.htm

Hello,

Webscraper.io en outil sans code, sinon un script custom de scraping (type requests+beautifulsoup en python) fera l’affaire.

Sinon, directement dans google sheet avec ImportXML ou ImportFromWeb :slight_smile:

1 « J'aime »

Incroyable. Le site n’a pas de sitemap! Dommage ça aurait vraiment simplifié.
Ici ImportFromWeb peut faire le job, mais il faudra surement procéder en 2 temps pour d’abord retourner la liste des urls de chaque station/année puis refaire une requête pour chaque url résultant pour en ressortir les programmes.

1 « J'aime »

Impeccable, ça fonctionne nickel, merci les gars ! :slightly_smiling_face: :slightly_smiling_face:

1 « J'aime »