Scraper des vidéos sur Youtube


#1

Hello à tous,

J’aimerais faire un petit test. J’ai en effet un blog traitant d’un sujet bien spécifique et, sur Facebook ainsi que sur mon blog, il m’arrive de faire des liens vers des vidéos Youtube que je trouve fortement sympathiques. L’impact sur la page FB n’est pas négligeable, tout comme celui sur mon site mais je dois tout faire à la main actuellement.

J’aimerais savoir si vous auriez quelques astuces. Imaginons qu’une chaine traite de ce sujet et qu’elle propose une centaine de vidéos. Est il possible de se connecter à la chaine, de récupérer la liste des vidéos, leurs titre et pourquoi pas la présentation ?

De cette base, je pourrais alors créer quelques article sur mon blog, remettre un peu en forme, ajouter du contenu et le documenter un peu.

Si vous avez des idées, d’éventuels conseils pour le scraping je suis preneur.
J’ai fais quelques tests sous Spreadsheets avec un importXML mais cela montre rapidement des “limites”

Merki =)


#2

J’imagine qu’il doit certainement y avoir une API de Google pour Youtube que tu pourrais utiliser ?


#3

Tu as l’addon “youtube” scrapebox, qui est pratique pour ça : http://www.scrapebox.com/youtube-downloader


#4

Merci pour vos réponses =)

@ScrapingExpert : je suis dessus. J’ai trouvé quelques scripts sous Python ou Java ici :
https://developers.google.com/youtube/v3/docs/channels/list#try-it
Je vous tiens au courant de mon avancée alors.

@camillebesse : je vais me procurer Scrapebox assap. Cet outil à l’air très puissant =)


#5

Etant sur un autre dossier ce matin, j’ai fais quelques tests sous une Spreadsheets avec la fonction importXML
Ca fonctionne plutot pas trop mal avec l’ext Chrome Scrapy (récupération des URLS de la chaine)

Pour le moment j’arrive à récupérer quelques données comme le titre, le nombre de vues, la durée et le descriptif.
Je bloque juste un peu sur ce dernier point puisque le descriptif est parfois sur plusieurs lignes.
Vous avez une astuce ?

Pour l’instant j’en suis à

Citation
=REGEXREPLACE(CONCATENER(IMPORTXML(B3; “//*[@id=‘eow-description’]//text()”));"\n";"
")

Ce qui me met parfois le contenu dans le bon format et parfois me met tout sur une seule ligne par exemple
Si vous avez une astuce =)

Merci


#6

Beaucoup plus simple : youtube-dl :sunglasses:

#videos et #playlist et pas uniquement youtube


#7

Merci Mik =)
Je vais mettre ça de coté, ca va me servir =)

Les vidéos ne m’appartiennent pas et je souhaite juste faire le lien vers celles ci.
Mon besoin s’est plus de récupérer les informations de la vidéo (description etc) pour créer un import sous Wordpress massif avec une programmation etc.

En tout cas, pour ce script Youtube, merci encore.
Il risque de me servir d’ici quelques semaines :smiley:


#8

Si tu es sous linux tu as aussi aria2c qui est super :grin:

J’ai des scripts bash (pour du wget ou du youtube-dl) si tu veux.

PS : Tu as des outils similaires (udemy-dl et edx-dl) si tu es fan de leurs formations :blush:


#9

Ca pourrait bien me servir en effet =)

Pour les formations Udemy, j’en ai quelques unes de coté (souvent en anglais) que j’aimerais suivre.
C’est fou toutes les formations dispo, python, php, java …

On passe en MP :smiley:


#10

Sinon il y a le tool Borg sur windows qui fait la même chose :palm_tree:


#11

Quelques avancées.
J’ai pu m’amuser avec l’ext Scraper de Chrome. Elle me permet d’obtenir la liste des URLs d’une chaine par exemple ou encore sur un thème. Ensuite, avec Scrapebox, j’arrive à récupérer les META dans un XLS.
Aussi, avec la fonction IMPORTXML sur Google spreadsheets, j’arrive à récupérer quelques informations comme la durée, la date de la vidéo.

J’aimerais maintenant réussir à reprendre les informations présentes dans la description.
Mon but n’est pas de DL les vidéos, mais de faire le lien vers celles ci depuis mon blog.
Une piste ?

Merci :slight_smile:


#12

Tu as essayé Chromescrapper ?


Team : CamilleBriceJulienVivianBorisXavierSteven.
Follow @growthhackingfr