Aujourd'hui, pendant qu'Olivier planchait sur un algorithme de débruitage, destiné à réduire les zones ombrées sur le papier, j'ai repris notre collection de PDF musicaux afin d'extraire automatiquement ceux qui ne sont pas vectoriels. Cela fera une base de référence pour tester ScanToMusic. J'en ai profité pour extraire les PDF qui sont traités sans erreur, si l'on en trouve de libre de droits cela fera un petit dossier de PDF d'exemple que l'on fournira avec PDFtoMusic. Il reste maintenant à lancer le traitement par lot. Comme nous possédons plusieurs milliers de PDF cela risque de prendre la nuit... |