Je rencontre un soucie avec le modele Contact detail scraper, quand j’ai réussis a scrap les url des entreprises d’un annuaire afin de récupérer les emails et tel avec le modele octoparse, cela me fait 5 à 10 lignes doublon voir plus par url, sauf que même si ce n’est que 2$ les 1000 lignes, on paie des milliers de lignes pour rien au final … y a t’il une astuce ou un autre modele à utiliser pour scrap les emails/tel à partir des URL ?
Le probleme c’est que c’est systématique, pas un beug, j’ai teste avec 3 fichiers d’url que j’ai scrapé en copiant collant les url ou par le biais d’un fichier propre c est toujours le même résultat : pour scrap les emails/tel de 1000 url donc 1000 lignes il vas falloir 10/15k de ligne que l’on paie avec 10/15 doublons par url.
Du coup il n’y a pas un autre scraper par url bon marché comme octoparse mais qui ne fait pas tout ses doublons qui font grimper la facture ?