Scraper adresses mail perso étudiants

Tes questions sont simples à résoudre @Henri_Guichane, si tu es débutant, il faut que tu prennes l’habitude de fouiller un peu :wink:

Bon je saturais encore avec mes proxys, du coup j’ai redev une autre extension pour extraire les étudiants d’une école quand on est sur la page de résultats. Je vais publier le code source d’ici demain (je vais le nettoyer pour qu’il soit présentable :grimacing:).

@Henri_Guichane spécialement pour toi : https://chrome.google.com/webstore/detail/schoolin-extract-linkedin/fjiobnldkkobkedaodpihamnpjibfblk

Fais une recherche sur Linkedin, filtre par année d’obtention du diplôme et télécharges ensuite. Tu auras un csv avec les couples nom/prenom et prenom/nom (c’est impossible à différencier le nom du prénom et souvent les deux sont inversés, du coup tu prends tout et tu nettoieras ensuite).

2 « J'aime »

Hahaha @boristchangang tu dégaines une extension à chaque nouvelle question sur le forum.

Merci !

2 « J'aime »

Ça me détend :slight_smile: et ça me permet de tester mon framework :slight_smile: Tout le monde est gagnant! Et j’aime tellement Linkedin :blush: :blush:

Si tu générais directement la liste d’email, en ayant en stock les patterns email de la majorité des grandes écoles, tu pourrais même monétiser l’extension :wink:

Perso je pense que bombarder le même email domain d’école (du style envoyé 200 mails à @hec.edu) tu seras vite blacklisté !

1 « J'aime »

Trop de patterns différents (doit y avoir 300 grandes écoles) :smile: Mais ça peut être une piste :blush: Au pire je peux mettre un petit champs pour le pattern et inclure les combinaisons dans le CSV directement.

Oui, pas faux Raphael !

T’as essayé de faire des fausses offres de stage ?

4 « J'aime »

@akeutareu :joy: :joy: :joy: :joy: C’est bien vu :slight_smile:

sinon t’as des site comme pôle emploi, apec, monster… ou tu peux accéder à des bibliothèques de cv, je suis sur que tu pourras trouver ton bonheur

Merci Boris !

@ScrapingExpert : Le volume de profils risque d’être élevé, plusieurs milliers d’adresses.

J’ai l’impression que hunter fonctionne uniquement pour les adresses professionnelles et non celles des écoles…

Ah du coup je vais être bloqué au bout de combien d’envois ?

N’y a-t-il pas une possibilité de se procurer les adresses persos à partir des adresses d’écoles et de manière assez automatisée ? :smile:

Truc simple, tu fais toutes les combinaisons possibles dans un Excel sur tes étudiants.

Ensuite tu testes les combinaisons ici : Gros cleaner de mails
Et tu ne gardes que les bons.

N’envoies pas 200 mails d’un coup à HEC évidemment, ménages ta monture. Sauf si un test de mail nécessite de n’envoyer qu’à une école, tu mixes 30 mails de HEC avec d’autres écoles et tu finis ta liste en une semaine avec plusieurs envois.

Si tu fais du cold Emailing, envoies tes mails avec Yet another Mail Merge sur une adresse gmail perso. Ca limite les risques.

Merci pour Yet another Mail Merge, bonne astuce !

Pour tester les mails, nojunk.io me renvoie souvent « adresse incertaine » quand je teste des adresses d’écoles. As-tu une idée pour trouver rapidement le modèle d’adresse (type @essca.eu) via Google que je pourrais compléter avec les noms et prénoms ? :slight_smile:

Adresse incertaine signifie en principe que le serveur est configuré en accept_all. Ce qui signifie que le domaine existe bien mais tu ne peux pas trouver la structure de mail (il laisse tout passer).

Sinon pour trouver rapido des adresses sur google :
filetype:pdf(ou csv, xls) « @essca.eu ». Je peux tomber sur ça [email protected]
ou
t’as des trucs à faire avec insite:"" + « keyword »

Mais si ton adresse est en accept_all c’est chaud d’envoyer, il faut absolument que tu « dilues » toutes les adresses accept_all dans un batch d’adresse marquée comme valides si tu passes par un ESP. Ca vaut aussi si tu passes par YAMM. Tu auras de fortes chances d’arriver avec du accept-all mal calibré, donc fais gaffes !

1 « J'aime »

Attention, adresse d’étudiant nominative = OPTIN obligatoire. Si tu aspires et envoi là dessus, attends toi à des problèmes.

2 « J'aime »

@YannickC C’est quoi le type de problème qui peut arriver ?

Je n’ai jamais fait, ne compte pas forcément le faire, mais la réponse m’intéresse quand même :slight_smile:

Je t’épargne les plaintes utilisateurs qui peuvent amener à une remontée CNIL parce peu se donnent la peine d’aller aussi loin.

Le vrai probleme est plutot sur l’E-reputation.
Tu vas blacklister ip et domaines car tu seras répertorié comme un spammeur. Et autant une réputation est longue a monter, autant l’inverse se passe très très vite.

Alors si tu as 15000 ip, et que tu es l’homme cameleon, alors tu seras intraçable. Mais globalement, c’est comme un casier judiciaire. Une fois la bétise faite, c’est à vie sur le papier, et ineffaçable.

D’où l’intérêt de ne jamais envoyer ce type d’email depuis son vrai domaine. Eventuellement, le même nom avec une extension différente. Concernant l’ip, plus grande monde utilise son propre serveur, donc bon, le problème retombe plutôt sur le service que tu utilises.

Mais clairement, ce n’est pas une bonne idée d’envoyer des centaines de mail sur hec.edu (par exemple).

Moi j’ajouterais plutôt en mass sur LI, puis après messagerie, ou récupération des mails (via l’export), pour custom audience FB. Ou tout simplement Linkedin Ads.