Emails à partir d'une liste de sites Web


#1

Bonjour,

A partir d’une liste de sites internet (1000 websites), je souhaite trouver leurs emails correspondants.
Je pensais engager un assistant virtuel qui utiliserait emailhunter.co, mais on m’a dit que cet outil avait des limites et qu’il ne trouverait pas toutes les adresses email.

Des avis sur la question ?
Comment pourrais-je m’y prendre ?

A noter que je vais extraire les sites web du site kompass :wink:

Merci !


#2

Bonjour,

D’après ce que j’en sais, la faiblesse de emailhunter dot co réside principalement dans le fait qu’ils ne mettent à disposition que les emails trouvés (et donc existant) par leur outil de crawl. Ils ne devinent pas les emails à partir d’un pattern donné, ils ne donnent que ce qui existe sur le Web. Pour résumer, si leur crawler n’a jamais croisé sur la toile d’emails appartenant à tel ou tel nom de domaine, il te sera impossible d’utiliser cet outil pour obtenir ces emails.

Autre point faible, il y a me semble t-il une grosse partie de boulot manuel à faire si tu veux utiliser leur outil à partir de ta propre liste de sites Internet, alors que tu aurais tout intérêt à automatiser le process au maximum.

Une autre technique serait de développer un crawler qui va se balader sur chacune des URLs de ces sites Internet, afin d’y trouver les adresses emails, en recherchant par exemple les pages de contact (ou certainement qu’un tel outil en ligne existe déjà?).


#3

@NoirCap bonjour,

Ce petit script en python fait le job, mais nom de domaine, par nom de domaine, et nécessite une vérification des adresses emails.

En le couplant avec un crawler, tu pourras rechercher les 1000 noms de domaines en une seule fois, mais ça reste du bricolage.


#4

@NoirCap c’est très simple même si tu n’es pas développeur.

Tu peux utiliser un tool comme SCRAPEBOX qui profite depuis quelques mois d’une fonctionnalité de collecte des mails.

En gros, tu renseignes les sites que tu veux analyser, le logiciel passe toutes les pages de chacun des sites en revue pour en extraire les mails. C’est très efficace.

Néanmoins attention, cette pratique est un peu borderline aux yeux de Google et des autres moteurs de recherche. Pourquoi Google ? Parce que l’outil récupére l’ensemble des urls de chaque site avec une requête “site:” sur Google et profite donc de l’indexation. Puis le robot visite les pages et en extrait tous les mails à la vitesse de la lumière.

Pour éviter le blacilistage de ton IP, n’oublie pas d’utiliser un proxy ou plusieurs si tu fais du multithread comme un cochon.

À ta dispo en MP si besoin.

Jckrppr


#5

Merci pour ces réponses ! :smiley:
@fgundermann @Arthur_Benoit

Vous pensez que ça me coutera combien si je délègue cette tâche ? ^^
(A noter que j’ai 2 listes à scraper : une de 230 URLs et une autre de 2000 URLs) :wink:


#6

Tu peux aussi scrapper les informations whois (Registrar) des noms de domaine :wink:


#7

@NoirCap si tu veux envoie moi un échantillon de 50-100 urls en MP. Je regarde si ma technique fonctionne et je te t’envoie les résultats.


#8

Tu peux aussi regarder https://grabby.io/


#9

Pas besoin de changer de proxy ?
(J’ai 2000 URLs) ^^


#10

Tu as besoin de proxy lorsque tu scrapes 2000 fois le même site. Mais si tu scrapes 1 fois 2000 sites, tu n’en as pas besoin.


#11

Hello, je suis le cofondateur d’Email Hunter. La tâche que souhaite réaliser @NoirCap correspond tout à fait à ce que fait Email Hunter du coup je suis pas sûr que comprendre les deux inconvénients que tu mentionnes.

Même pas besoin d’assistant virtuel en fait, ça peut se faire en 5 minutes avec le bulk Domain Search: https://emailhunter.co/bulk_searches

Tu envoies la liste de domaines que tu as et Email Hunter retourne la liste d’emails utilisant ces domaines sur le web entier, avec scores de confiance et classement génériques/personnels.

Concernant les guess utilisant le pattern, Email Hunter le fait aussi, c’est ce qu’on appelle l’Email Finder. Mais dans ce cas il faut bien entendu donner les noms avec pour qu’on puisse savoir quels emails deviner.


#12

Yes je l’ai fait sur Email Hunter et je suis très satisfait :slight_smile:


#13

Salut,

Je suis super intéressé par email hunter, ce qui est gratuit c’est 150 emails ou 150 domaines stp ?

Merci


#14

Domaines :wink:


#15

je viens de m’abonner, l’onboarding est top ! Bravo.

Précision : les requetes (ex : 1000 par mois pour 49€HT) c’est 1 requete = 1 page de résultats.

Exemple : la requete X me renvoit 67 emails et me coute 7 credits


#16

de quel maniere?


#17

Hello, je ne viens de voir le thread que maintenant, déso pour le retard…

Ce que je voulais dire c’est que, si le nom de domaine demandé n’a jamais été crawlé/indexé/trouvé, il est impossible d’avoir des emails associés à ce nom de domaine. Bien sûr , il s’agit d’un cas assez rare :slight_smile:


#18

Yes, on est d’accord !


#19

Je trouve la récupération des adresses email assez simple avec email sourcer (ou emailhunter, etc.) mais la principale question pour moi est la validation. Lorsqu’on a récupéré des centaines de milliers d’adresses il faut les filtrer, d’abord pour celles qui ne sont simplement pas valides (mais lorsqu’elles ont été récupérées récemment sur le site de la société, ce n’est pas vraiment un problème) mais surtout pour choisir la ou les quelques meilleures et ne pas brutalement spammer toutes les boîtes, ce qui est contre-productif.
Des idées ou des suggestions là-dessus?


#20

Pour la déliverabilité des emails je t’invite à consulter la liste des outils faite par Camille, dans la catégorie Email verification: La toolbox du Growth Hacker 🛠

Si tu passes par Hunter tu peux utiliser le score de confiance qui filtrera déjà bien ta liste des emails risqués. Si tu veux être sûr d’un taux de déliverabilité très élevé il faut passer par un outil de vérification.


Communauté initiée par @camillebesse avec l'aide de @Cebri@JulienD@VivianSolide@Boristchangang
Follow @growthhackingfr