Bonjour à tous,
Je me permets de vous relancer sur le sujet.
J’ai bien avancé sur la mission, je suis à environ 10k adresses scrapées. Mais le problème, c’est que parfois WebScraper scrape 20 pages, et parfois, il s’arrête au moins d’une page. Du coup le scraping devient très chronophage.
Sauriez-vous à quoi cela est dû ? A noté que j’ai augmenter le reload time à 4000 mais rien n’y change ;.
Voici le script :
`
{"_id":"scrapping-ce","startUrl":["http://m.annuaire-comite-entreprise.com/departement-herault.html"],"selectors":[{"id":"pagination","type":"SelectorLink","parentSelectors":["_root","pagination"],"selector":"#pages > div.pagination a:nth-last-child(2)","multiple":false,"delay":0},{"id":"liens","type":"SelectorLink","parentSelectors":["_root","pagination"],"selector":"p a","multiple":true,"delay":0},{"id":"Nom","type":"SelectorText","parentSelectors":["liens"],"selector":"strong","multiple":false,"regex":"","delay":0},{"id":"mail","type":"SelectorText","parentSelectors":["liens"],"selector":"center a.ui-link","multiple":false,"regex":"","delay":0}]}
Merci d’avance pour votre aide !
`