Extraire des données d'un fichier Pdf

Sujet : Extraction de données et Automatisation.

Bonjour,
Pourriez-vous me dire comment exraire des données d’un fichier pdf ?
Plus précisement, depuis un bordereau qui fait 440 pages, je veux extraire chaque ligne de colis avec son numéro de suivi, Longueur auditée, Largeur auditée, Hauteur auditée, et le poids audité, pour CHAQUE client et le mettre ensuite dans un Google sheet.
Et l’automatiser.
Précision je ne fais pas de Python :-/

D’avance merci.

que ce soit python ou autres outils, tout dépend de la qualité du pdf, si c’est un pdf généré par un outil type adobe, le fichier pdf contient le texte donc facilement exploitable (python ou charger le pdf dans word par exemple), si c’est un document scanné, c’est pas gagné, faut faire de la reconnaissance de caractères et le résultat dépendra de la qualité du scan

2 « J'aime »

Hello @Scills01

Ça doit pouvoir se faire assez facilement.
J’ai fait un tutoriel sur mon site juste là!

Attention, c’est effectivement avec Python :full_moon_with_face:
Curieux d’avoir tes retours.

C’est exactement ça.

Si tu peux le partager je peux y jeter un œil et dans le second cas te renvoyer un fichier avec le texte issu d’un algo de reconnaissance de caractère (OCR), que tu pourras exploiter comme tu veux.

Merci c’est très sympa, le pdf est un doc clients donc je ne peux pas le partager ici, je vois avec mon boss et si il est ok pour te l’envoyer, je te le fais suivre.

Hello, merci mais je ne fais pas de Python :slight_smile:

Il faut s’y mettre sans attendre :full_moon_with_face:

Salut t’a un plugin dans Chatgpt :wink: J’ai pas encore test

oui j’ai vu ça hier, avec le 4. Si mon boss le prend, j’essaierai
Merci :slight_smile:

Ok n’hésite pas a faire un retour sur l’efficacité du truc. Au plaisir

oui bien sûr je ferai un retour

Exactement ce que j’allais dire. Je pense que tu peux le faire avec chatgpt.

Ou tu peux lui faire générer le code python pour le faire (après faut savoir l’executer)

Tu as essayé les code généré sur Python ? Perso je m’aide souvent avec pour modifier mais pas faire un script entier… A voir ca m’intéresse pour le coup car je suis pas un vrai Dev.

Yes, j’ai généré un script entier, mais j’ai avec moi un dev python qui l’a vu et a vu que c’était pas mal. Si on ne maitrise pas, c’est plus difficile, mais je suis sûr qu’apres qq aller-retours, on peut trouver le bon script

1 « J'aime »

Utilise le code interpreter de GPT 4, après pas sûr qu’il traite un fichier 44 pages. Cependant, tu peux dans un premier temps le tester en lui demandant de te sortir le max et ensuite découper ton PDF en partie correspondant.

Bon a savoir

j’allais le dire :slight_smile:

1 « J'aime »

Oui, j’allais justement en parler, avec le nouveau code interpreter, tu peux lire des pdfs, à priori. Même si d’autres plugins le permettent aussi, je ne sais pas quelle est la différence.

Ce bon vieux GPT, peut dire maintenant « GPT est on ami » je crois :sweat_smile: :joy:

1 « J'aime »

Hello Dumpin, merci également pour ton retour. C’est pas gagné, c’est 444 pages :wink:
Y a des Dev dans ma boite, je vais voir avec eux même si j’aurais préféré le faire moi-même.

Bonne journée à tous!