URL unique

Bonjour, mes cheveux deviennent encore plus blanc quand je me penche sur le sujet.
Je cherche à scrapper un site qui se compose avec un résultat générique genre 1/40 pages
et sur chaque pages, il y à 20 mini résultats avec peut d’informations.
Les information détaillé se trouvent sur les 20 liens à déclanher en Rank pour gratter puis ignorer ou fermer.
Quel serait la marche à suivre?
Qui déclenche chacun un résultat unique.
Je n’arrive pas à mettre le résultat unique

{"_id":« bouillon »,« startUrl »:[« https://www.l.fr »],« selectors »:[{« id »:« selector »,« type »:« SelectorElementScroll »,« parentSelectors »:["_root"],« selector »:"#div_1412554 div.contenu_texte",« multiple »:false,« delay »:0},{« id »:« plus »,« type »:« SelectorPopupLink »,« parentSelectors »:[« selector »],« selector »:« parent »,« multiple »:false,« delay »:0},{« id »:« corps du text »,« type »:« SelectorText »,« parentSelectors »:[« plus »],« selector »:« div.contenu-texte-annonce »,« multiple »:false,« regex »:"",« delay »:0},{« id »:« moins »,« type »:« SelectorPopupLink »,« parentSelectors »:[« plus »],« selector »:« div:nth-of-type(1) div div.icon-left-decompose »,« multiple »:false,« delay »:0}]}

Hello Mika,

Je me suis permis de réaffecter ton post dans cette section « Scraping » davantage que « Marketplace ».

Pourrais tu nous redonner l’export JSON de ton sitemap, mais pas via un copié collé en texte comme tu l’as fais, mais via la fonctionnalité de code préformaté proposée par l’éditeur de messages de ce forum?

Ainsi on y verra plus clair et on pourra importer directement ton sitemap tel quel :slight_smile:

Bonjour ScrapingExpert,
Merci pour ta réactivité, voici le collé dans la partie code.

{"_id":"test","startUrl":["https://www.l.fr=[1-10]"],"selectors":[{"id":"selecteur","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"div.contenu_texte","multiple":true,"delay":"1000"},{"id":"offre","type":"SelectorText","parentSelectors":["selecteur"],"selector":"td:nth-of-type(4)","multiple":false,"regex":"","delay":0},{"id":"mail","type":"SelectorText","parentSelectors":["selecteur"],"selector":"td:nth-of-type(4)","multiple":false,"regex":"[a-zA-Z0-9_]+(\\.[a-zA-Z0-9_]+)*\\@[a-zA-Z0-9_]+(\\.[a-zA-Z0-9_]+)*\\.[a-zA-Z]{2,4}$","delay":"500"},{"id":"tel","type":"SelectorText","parentSelectors":["selecteur"],"selector":"td","multiple":false,"regex":"(?:(?:\\+|00)33[\\s.-]{0,3}(?:\\(0\\)[\\s.-]{0,3})?|0)[1-9](?:(?:[\\s.-]?\\d{2}){4}|\\d{2}(?:[\\s.-]?\\d{3}){2})$","delay":0}]}

J’espère que cette version est mieux

1 J'aime