Probleme avec modele octoparse

Bonjour !

Je rencontre un soucie avec le modele Contact detail scraper, quand j’ai réussis a scrap les url des entreprises d’un annuaire afin de récupérer les emails et tel avec le modele octoparse, cela me fait 5 à 10 lignes doublon voir plus par url, sauf que même si ce n’est que 2$ les 1000 lignes, on paie des milliers de lignes pour rien au final … y a t’il une astuce ou un autre modele à utiliser pour scrap les emails/tel à partir des URL ?

Merci !

1 « J'aime »

Bonjour,

Les données peuvent être dédupliquées, vous pouvez ouvrir octoparse.fr et cliquer le logo bleu en bas à droite pour contacter le support d’assitance.

Le probleme c’est que c’est systématique, pas un beug, j’ai teste avec 3 fichiers d’url que j’ai scrapé en copiant collant les url ou par le biais d’un fichier propre c est toujours le même résultat : pour scrap les emails/tel de 1000 url donc 1000 lignes il vas falloir 10/15k de ligne que l’on paie avec 10/15 doublons par url.

Du coup il n’y a pas un autre scraper par url bon marché comme octoparse mais qui ne fait pas tout ses doublons qui font grimper la facture ?

Perso je n’ai pas ce problème de doublon, tu dois avoir un truc qui cloche au départ…