Création de base donnée à partir de PDF

Bonjour à tous,

J’ai une base assez conséquente de CV que je souhaiterais pouvoir exploiter au travers d’une base de donnée.
Connaissez-vous des outils capables de récupérer tous les mots unitaires d’un pdf afin de pouvoir les intégrer dans une bdd ?

L’idée est ensuite de pouvoir sélectionner des profils correspondant à des expertises bien spécifiques grâce à des mots clés uniques.

Merci pour vos conseils et retour,
Henri

pdftoxml ou pdf2html par exemple

Tu peux automatiser via l’api de libreoffice