Extraire les e-mails d'un fichier txt


#1

Bonjour à tous,

Question de noob sans doute, mais je n’arrive pas à extraire des données et notamment des e-mails d’un fichier txt contenu 3 millions de lignes du type “NOM; PRENOM; E-MAIL; PROFESSION…”.

Avez-vous une idée d’une formule ou ligne de code qui me permettrait de tout supprimer sauf les adresses e-mail ?

Merci d’avance :slight_smile:


#2

Le fichier tel que tu le décris ressemble à un fichier CSV. Si il s’agit bien de champs délimités par des points virgules alors tu peux l’ouvrir tout simplement dans Openoffice Spreadsheet ou Office, et copier coller la colonne des emails ?


#3

Merci pour ta réponse. Il faut que je télécharge Openoffice Spreadsheet ou Office alors, cela va bien supporter un contenu de plusieurs millions de lignes ?


#4

Même avec 200.000 lignes ça plante visiblement


#5

C’etait Prévisible tu ne pourras pas le faire avec un tool classique. Tu dev un peu ou pas du tout ?


#6

Salut boristchangang, je ne dev pas mais je peux comprendre un peu les lignes donc si vous m’aidez un peu ça devrait aller :smiley:
Je viens de trouver cette URL assez sympa : www.convertcsv.com/email-extractor.htm je pense qu’on pourrait s’en inspirer pour le code. Evidemment sur ce site ça marche pour 5 lignes mais pour 200.000… Ca plante et re-plante


#7

Ça plantera tjrs quoique tu fasses. La source de ton fichier est safe ?
Le script pour récupérer les infos, n’est pas très compliqué à écrire mais si tu n’es pas dev rien que le lancer ça va être un peu tendu :joy: tu sais lancer un script node ? Python ?


#8

Sinon en mode non dev, il y a moyen de splitter le gros fichier principal en plusieurs petits fichiers, les ouvrir avec Openoffice, et voilà :slight_smile:


#9

http://www.maxprog.com/site/software/internet-marketing/email-extractor_sheet_us.php

Avec ce soft, tu pourras extraire des emails sur des fichiers de plusieurs dizaines de millions de lignes (testé et approuvé).


#10

Merci Camille, je vais tester.


#11

En PowerShell c’est super facile.

PS > $Result = Import-CSV -Path TonFichier.csv -delimiter ‘;’
PS > $Result | Select-Object -ExpandProperty ‘E-MAIL’ | Out-File -Path MonFichierResultat.txt

Ca générera un fichier texte en sortie qui ne contiendra que les adresses mail.


Team : CamilleBriceJulienVivianBorisXavierSteven.