Scraping salon avec Webscraper

Hello à tous,

J’ai quelques petits problèmes pour scraper les exposants de ce salon : La liste de tous les exposants aux Rencontres Flotauto

Tout d’abord, quand je crée mon sitemap, je clique sur l’exposant et quand je veux sélectionner l’adresse par exemple, il me sélectionne tout le bloc avec toutes les infos et ce n’est pratique après dans l’export.
Pareil pour le secteur d’activité, ça me sélectionne un bloc entier.
Y a-t-il un moyen de sélectionner uniquement une phrase et pas un bloc entier ?

Deuxième problème, je n’arrive pas à sélectionner les pages pour changer de pages, du coup j’ai sélectionné les lettres pour avoir tous les exposants.
Mais quand je fais le scrap, je n’ai que 20 exposants et pas les 280.

J’espère avoir été suffisamment clair dans mes problèmes ^^

Je vous mets le sitemap :
{"_id":« flotauto_monique »,« startUrl »:[« https://rencontres.flotauto.com/visiter/liste-des-exposants.htm"],« selectors »:[{« delay »:0,« id »:« exposants »,« multiple »:true,« parentSelectors »:["_root",« pages »],« selector »:".tg-grid-2 a[data-page=‹ 1437 ›] »,« type »:« SelectorLink »},{« delay »:0,« id »:« nom »,« multiple »:false,« parentSelectors »:[« exposants »],« regex »:"",« selector »:« h2 »,« type »:« SelectorText »},{« delay »:0,« id »:« coordonées »,« multiple »:false,« parentSelectors »:[« exposants »],« regex »:"",« selector »:".tg-grid-8 > b",« type »:« SelectorText »},{« delay »:0,« id »:« secteur »,« multiple »:false,« parentSelectors »:[« exposants »],« regex »:"",« selector »:"#tg_bloc__5937 div",« type »:« SelectorText »},{« delay »:0,« id »:« pages »,« multiple »:true,« parentSelectors »:["_root"],« selector »:« li.tg-pos-left a »,« type »:« SelectorLink »}]}

Merci d’avance pour votre aide !

Si tu veux pas te faire ch… tu peux toujours utiliser Dashblock en pay as you go ça va pas couter cher

Merci je vais regarder !

Bonjour,
J’essaie le scraping de base dans un contexte « bureautique »
Un copier/coller d’une partie d’une page web pour m’éviter de faire chaque champ à la main
J’ai la page de données ouverte et j’essaie de lancer l’extension webscraper qui me demande de faire F10 et je me retrouve de dev avec la console google chrome
J’ai pas pu aller plus loin :slight_smile:

Euh je fais quoi là du coup ?
Une idée également @ClementAubry ?

Merci

Hello @AudryBenjamin15,

Pour les blocs avec toutes les infos, il va falloir que tu travailles la donnée extraite dans un gsheet/excel. Sur gsheet, tu as l’option Données > Séparer le texte en colonnes qui pourrait t’aider.

Pour la pagination, il faut utiliser un Element click selector, tu trouveras les explications sur cette page.

Bon courage :slight_smile:

Super merci beaucoup :slight_smile:

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.