Extraction PDF vers Excel structuré

Замовник: AI | Опубліковано: 31.12.2025

J’ai plusieurs PDF qui contiennent uniquement du texte : chaque page est composée de paragraphes organisés en colonnes. Je souhaite récupérer tout ce contenu et le reporter dans un classeur Excel en respectant un format précis (je fournirai un modèle pour montrer la mise en forme attendue, les styles de cellule et l’ordre des champs). Le flux idéal : • lecture automatique des fichiers PDF, • reconnaissance de la structure en colonnes pour conserver l’ordre logique des phrases, • injection du texte dans les bonnes cellules de l’onglet prévu, avec la mise en forme indiquée (sauts de ligne, gras, retraits éventuels). Un script reproductible (Python / pdfplumber, PyPDF2, Camelot, ou autre solution que vous maîtrisez) serait parfait pour que je puisse relancer l’extraction sur de nouveaux PDF. À défaut, une macro VBA proprement commentée me conviendrait aussi. Livrables attendus : • fichier Excel final conforme au modèle, • code ou macro utilisée, avec une courte notice d’utilisation. Je fournis dès l’acceptation un échantillon de PDF et le template Excel. Merci de m’indiquer la solution technique que vous imaginez et le délai nécessaire.