Myriad Blog 1.3.0 Thursday, Jul 31st, 2014 at 03:43pm 

Wednesday, May 17th, 2006 at 05:05pm
Projet PDFToMusic, étape 1.
L'étude du PDF a débuté (voir le billet "On échange ?"), une première ébauche du parseur (analyseur ou butineur qui balaye un fichier pour en extraire les informations) a été écrite et l'on commence à extraire les différents éléments des fichiers PDF. Il apparaît que, du point de vue de l'utilisation que nous voulons en faire, trois catégories de documents se dégagent.  
La catégorie 0 (zéro): Ce sont les PDF n'incluant qu'une seule image de la partition par page du document. Ils ont vraisemblablement été générées directement depuis un scanner. La seule chose que l'on pourrait faire de ces documents serait d'exporter les images de manière séparée et de les faire traiter par OMeR.
La catégorie 1 : Ce sont les PDF, incluant des objets graphiques (lignes, rectangles, etc), et les objets musicaux (tête de note, nuance, etc) dessinés à partir d'une police de caractère. Ce sont des fichiers issus de l'exportation directe depuis un logiciel de musique, comme ce que l'on obtient depuis Harmony Assistant par exemple. L'interprétation des objets semble possible. Le problème est que la police incluse dans le document PDF est "remappé" (seuls les caractères utilisés dans le document sont présents) et ne semble pas utilisable directement.
La catégorie 2 : Ce sont les PDF n'incluant que des objets graphiques : les objets musicaux sont dessinés avec des primitives graphiques simples et non avec des polices. Je n'ai aucune idée de la façon dont ces fichiers ont été générés. Il va falloir isoler ces objets et construire un système expert de reconnaissance de forme ? Probablement.
 
La catégorie 1 semble la plus répandue. La catégorie 2 vient ensuite nettement moins souvent. La catégorie 0 est très rare à ma connaissance. La pierre d'achoppement de la catégorie 1 va être l'extraction des données brutes des fichiers de polices inclus dans le document et leur analyse. Apparemment, la plupart de ces fichiers sont des polices au format TrueType qui est un format public. Bon point. Cela va être la prochaine étape de l'analyse : serons-nous capables d'extraire ces données et de reconnaître la forme que ces données dessinent ?
by Didier Guillion
Comments

Comment from NICOU59 Thursday, May 18th, 2006 at 10:08pm
PDFToMusic
C'est vraiment génial comme idée. Il faudrait mettre ça dans Omer, et là, c'est sur, on serait devant une suite de logiciels hors norme avec des outils fabuleux à tous niveaux...Rapport qualité / Prix toujours plus imbattable !

Comment from Gilbert Rouquié Wednesday, Jun 7th, 2006 at 11:18am
La catégorie 1
Dans un PDF de partition musicale en catégorie 1, je trouverais dommage d'abandonner toute tentative d'identifier directement, depuis le stream PDF, le plus possible des glyphes présents dans les polices Type 1 spécialisées pour les partitions (SToccata pour Myriad, et je ne me souviens plus des noms de celles pour Finale ou Sibelius).
 
Dans un monde idéal, il suffirait de connaitre l'Encoding standard utilisé par ces polices - de ce que j'ai pu constater, c'est à peu près toujours le même - pour identifier sur le champ, en fonction du code hexa du caractère, une tête de note, une tige, une altération, une clef.
 
Lorsque le PDF utilise cet Encoding standard, pensez vous l'utiliser ? Pour moi ce serait dommage d'interpréter le tracé décrit dans la fonte pour obtenir une image, puis d'appliquer un OCR sur cette image pour remonter à l'identité du glyphe, si cette identité est directement accessible à travers l'Encoding ?
 
Je (crois que je) comprends le remapping et le principe d'économie du PDF de ne fournir les tracés que des glyphes utilisés. L'Encoding n'est alors plus le bon. Mais alors votre idée est elle de bâtir un dictionnaire des glyphes des fontes Type1 musicales, pour les reconnaître lorsqu'ils apparaissent dans les PDFs ? Les fontes musicales ne sont somme toute pas si nombreuses.
 
Je me rends bien compte que c'est une spécialisation très étroite que de ne reconnaître que les PDFs utilisant les Type 1 musicales connues, mais, à en juger par CPDL, c'est une forte proportion de partitions publiques que ceci représente. Avec une identification alors parfaite des glyphes musicaux, vous vous épargnez les soucis d'OCR du type : différencier un corps de blanche d'un dièze ou d'un bémol.
 

Comment from Didier Guillion Wednesday, Jun 7th, 2006 at 01:20pm
Réponse à Gilbert Rouquié
Votre suggestion d'utiliser l'encoding standard est bonne à condition de connaitre le nom de la police d'origine, or dans un fichier PDF on ne dispose pas du nom de la police Type 1 utilisée : les noms sont cachées. Par exemple la police Toccata s'appelera "HMXXXMBVU".
De plus, j'ai téléchargé pas mal de fichiers recemment sur CPDL et la quasi totalité sont de catégorie 2 : aucune fonte incluse et chaque caractère dessinés avec des commandes PDF...
 
Cordialement


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013