Scraper Bandcamp.

Hello la communauté,

J’aimerai contacter plusieurs groupes que j’ai repéré sur le site Bandcamp, je souhaite récupérer leurs comptes instagram et Facebook.

J’ai essayé avec Octoparse et d’autres logiciels mais je n’arrive pas isoler les informations et elle se mélange entre elle, je me retrouve avec des liens différents de ceux demandés ou alors avec un morceau de phrase de la page.

Pouvez-vous m’aidez à trouver la solution pour exporter un fichier avec les informations que je souhaite ?

Je prends n’importe quel tips, je suis prêt à tout essayer ! :wink:

Merci à vous.

1 « J'aime »

Websraper ?

c’est depuis quelle page que vous souhaitez scraper les comptes ins et facebook ?
j’y suis intéressé, et je veux voir si je peux vous aider

Voici la page que j’essaye de scraper : Stoner Metal Music & Artists | Bandcamp

J’arrive avec Web scraper et Octoparse à entrer dan chaque page et récupérer des informations mais je n’arrive pas toujours à prendre celle dont j’ai besoin.

Voici un exemple de page que je souhaite scraper : Trip to Oregon | WEEDIAN

J’aimerai réussir à cibler uniquement les différents liens concernant Facebook et Instagram.

Merci de votre retour en tout cas :slight_smile:

Déjà essayé avec Webscraper mais ça ne fonctionne pas…

tu peux peut être essayer selenium: « Selenium est un outil d’automatisation de test pour le web. Il permet de créer des « robots » qui naviguent dans des pages webs comme le ferait un vrai utilisateur. Bien que le premier rôle de Selenium soit le testing de pages webs (développement web), cet outil est beaucoup utilisé pour l’extraction de données. »
(Web Scraping Python avec Selenium | Le Data Scientist)

J’y arrive avec octoparse. En effet, je divise votre projet en deux sub-projet
projet 1 - obtenir les urls de chaque article
projet 2 - utiliser un template, y entrer les urls des pages qu’on obtient à travers le premier sub-projet pour récupérer les liens social media, comme ce que la capture d’écran. Et s’il n’y a pas de liens de comptes ins ou fb, c’est parce que ces données sont à faute sur cette page.
pour d’autres info que vous n’avez besoin, vous pouvez directement les supprimer après avoir téléchargé ce fichier sur votre ordinateur

si vous y êtes intéressé, le template s’appelle Email & social media links

j’ajoute
voilà un tutoriel qui présente comment utiliser ce template que j’ai mentionné

Hello @Arnaud2017 ,

Merci beaucoup pour votre aide si précieuse, la solution était sous mes yeux et j’ai passé tellement d’heures pour réussir à faire ça :joy:

J’ai appris une bonne chose aujourd’hui auriez-vous par curiosité, une idée de comment je pourrais automatiser ma prise de contact sur ces réseaux sociaux ?
J’envoie généralement une 30aine de message par jour.

Merci encore pour tous ! :wink:

Hello @Earendhil,

Merci de ton retour, je vais regarder ça de plus près, ça me semble très intéressant :wink:

ahah, ça me prend seulement 10 minutes pour extraire ce dont vous avez besoin, c’est bien sûr parce que j’ai utilisé octoparse assez fréquemment et longtemps. :grinning:
En tout cas, je suis très content que je peux vous aider.

S’agissant la prise automatique de contact, je ne sais pas grand chose, mais je vous recommande phantombuster qui offre des automations

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.