Il faut utiliser une solution de parsing en script, de type pdftohtml (sous linux), cela génère un XML qu’on peut ensuite parcourir à la recherche de numéro de tel en appliquant des regexes.
Merci pour les pistes, l’option PDFSAM + Tabula est assez sympa mais malheureusement pas 100% adapté à ce que je recherche, je garde néanmoins, j’en aurais sûrement besoin un autre jour !
Du coup je vais tester la première solution, j’ai un script qui génère un xml à partir de mes .pdf ; je vais tester en appliquant des regexes pour voir ce que cela me sort