Extraire des données d'un fichier Pdf

Morph · Juillet 13, 2023, 3:37

Si tu as des dev sous la main, fais avec eux, il existe plein de packages pour faire de l’OCR.
Par contre si le document est confidentiel, l’envoyer à ChatGPT c’est pas terrible non plus…

Une fois le texte extrait, il faudra aussi voir comment structurer les données qu’il contient…

cruz · Juillet 16, 2023, 7:59

Tu devrais visiter ça

Scills01 · Juillet 17, 2023, 11:04

yes c’est clair des fichiers client sur chatgpt…même si je ne bosse pas pour la Défense je vais éviter

Scills01 · Juillet 17, 2023, 11:05

Hello, merci, je ne clique jamais sans savoir, peux-tu mettre un lien

cruz · Juillet 17, 2023, 3:59

Sans probléme https://avepdf.com/fr

veillemail301 · Juillet 17, 2023, 6:37

Hello ,

Tu as regarder du côté de AWS ? J’ai eu un use case similaire sur des png avec plus de 400 photos et c’était une bonne solution.

Si tu veux jeter un œil : OCR Software, Data Extraction Tool - Amazon Textract - AWS

Scills01 · Juillet 18, 2023, 9:36

Merci c’est super sympa!

Jorgi · Juillet 18, 2023, 7:11

Suffit de le télécharger sur du google drive et de l’ouvrir pour le transformer en doc et on peut manipuler les données en le sauvegardant en open format

Scills01 · Juillet 19, 2023, 9:49

Merci Jorgi, astuce que je ne connaissais pas

system · Juillet 18, 2025, 9:50

Ce sujet a été automatiquement fermé après 730 jours. Aucune réponse n’est permise dorénavant.