Je viens d’arriver dans ma boite et y’a pas mal de boulot sur le nettoyage des fichiers de prospection…
J’ai ce genre de fichier word à mettre sous excel pour faire un tri des leads, trouver un mail etc et mieux les cibler (c’est juste une partie): Word a convertir sous excel - Google Documenten
Pour le moment j’arrive à nom/Job/emplacement sur Excel de sur comme ceci mais franchement c’est dégeu : Excel Monaco - Google Spreadsheets
Dans l’idéal, j’aimerais par ligne toute tes infos disponibles triées par colonne par exemple avec colonne A = Nom / Colonne B = Job / Colonne C = Localisation / Colonne D = Marchés etc. Et surtout avoir les points d’intérets par prospect et par colonne !
Avez-vous une idée ? J’ai essayé de transformer le word (chaque prospect = 1 phrase en titre) mais franchement j’ai du mal…
Merci d’avance !
PS : Surtout que j’en ai encore 4 des fichiers comme ça =D
Ils proposent d’utiliser PowerGREP qui permet d’extraire des données brutes d’un document Word, de chercher des informations, de repérer certains textes avec balise (ex : GRD titre, sous-titre, liste, etc., et de les traiter ensuite de manière automatisée. La version d’essai devrait suffire. https://www.powergrep.com/msword.html
As-tu possibilité de convertir ton .doc en document XML?
Si oui, alors il y a peut être quelque chose à faire, en faisant du parsing du doc xml, pour en extraire les données désirées, et au final sortir un CSV.
@Kyrian merci je vais tester. J’ai hérité du document comme ça… sinon j’aurais peut être essayé les outils de scrapping dont vous parlez tant x). Merci du tips. Je vais aller voir !
@ScrapingExpert effectivement c’est ce que je viens de faire ! Du coup cela veut dire que je convert en CSV pour ensuite essayer de le trier avec par exemple « remplacer « lettre » par colonne » pour avoir le truc ? Sachant que je ne sais pas coder.
Non, tu convertis le fichier .doc en .xml, afin d’utiliser un outil de parsing de XML, ou un script (malheureusement nécessite de savoir coder), qui pourra lire ce XML, en extraire les infos dont tu as besoin, et finalement créer le fichier CSV.