Extraire des données d'un fichier Pdf

Si tu as des dev sous la main, fais avec eux, il existe plein de packages pour faire de l’OCR.
Par contre si le document est confidentiel, l’envoyer à ChatGPT c’est pas terrible non plus…

Une fois le texte extrait, il faudra aussi voir comment structurer les données qu’il contient…

Tu devrais visiter ça

yes c’est clair des fichiers client sur chatgpt…même si je ne bosse pas pour la Défense je vais éviter :wink:

Hello, merci, je ne clique jamais sans savoir, peux-tu mettre un lien :slight_smile:

Sans probléme https://avepdf.com/fr

Hello :wave:,

Tu as regarder du côté de AWS ? J’ai eu un use case similaire sur des png avec plus de 400 photos et c’était une bonne solution.

Si tu veux jeter un œil : OCR Software, Data Extraction Tool - Amazon Textract - AWS

1 « J'aime »

Merci c’est super sympa!

Suffit de le télécharger sur du google drive et de l’ouvrir pour le transformer en doc et on peut manipuler les données en le sauvegardant en open format

Merci Jorgi, astuce que je ne connaissais pas :slight_smile:

Ce sujet a été automatiquement fermé après 730 jours. Aucune réponse n’est permise dorénavant.