Scraper un téléphone présent dans un e-mail

Hello tout le monde,

Vous le savez, il y a beaucoup de gens qui indiquent un numéro de téléphone dans leur signature mail.

J’en ai + de 500 comme ça dans ma boîte mail.

J’aimerai scraper tous ces numéros de téléphone.

Comment est-ce que vous vous y prendrez à ma place ? :male_detective:

1 « J'aime »

Hello,
1- Exporter les emails dans un fichier CSV(j’utilise le module ImportExportTools NG dans Thunderbird, compatible avec la majorité des fournisseurs)

2- Utiliser la fonction expression régulière dans Excel, Libre Office Calc, Google Sheets pour créer une nouvelle colonne.

Tel : « 0102030405 » « +331020330405 » « 01 02 03 04 05 » « 01.02.03.04.05 » « 01-02-03-04-05 » « +33 102 030 405 »

Une REGEX pour la route :
^(?:+(?:\d{2}(?: \d{3}){3}|\d{12})|(?:(?:\d{2} ){4}|(?:\d{2}-){4}|(?:\d{2}.){4})\d{2}|\d{10})$

3 « J'aime »

Hello,

Super réponse de @lorent, je valide les expressions régulières !

Sinon en tapant « extract phone from email signature » il semblerait qu’il y ai des outils spécialisés et pas très chers, du type SigParser : si tu en essayes peux-tu nous faire un retour ?

Je suis sûr que ça intéresse du monde, merci :slight_smile:

2 « J'aime »

Au top ! Merci beaucoup pour cette réponse hyper complète @lorent

Hello @ClementAubry, pas convaincu d’ouvrir mon porte monnaie pour cet outil mais si jamais c’est le cas un jour je ferai un retour à la communauté avec plaisir ! :fire:

Je l’avais fait pour extraire les email de mes mails GMail. Pour cela, je les avais exporté. De là, c’est du scraping de fichier texte assez simple à mettre en place.