Le Blog de Myriad -



Myriad Blog 1.3.0	Thursday, Apr 18^th, 2024 at 01:30pm

The Myriad team shares here its everyday life and its mood

Thursday, Jun 15^th, 2006 at 04:59pm

Projet PDFToMusic, étape 10

Plusieurs fichiers PDF, encodant les caractères sous forme d'images bitmap sans indication de début et de fin de symbole ont été localisés. Une catégorie a donc été créée pour les regrouper, ce sera la catégorie 3.
Nous avons donc actuellement 4 catégories, divisées en sous-catégories :
La catégorie 0 (zéro) : Ce sont les PDF n'incluant qu'une seule image non vectorielle de la partition par page du document. Non utilisable.
La catégorie 1 : Les symboles musicaux sont délimités et dessinés à partir d'une police de caractère.
La catégorie 2 : Les symboles musicaux sont délimités et dessinés à l'aide de tracés vectoriels (catégorie 2.1) ou d'images bitmap (catégorie 2.2).
La catégorie 3 : Les symboles musicaux ne sont pas délimités et dessinés avec des images non vectorielles (catégorie 3.2). On peut supposer que la catégorie 3.1 existe (symboles musicaux vectoriels non délimités) mais elle n'a pas été rencontrée pour l'instant. Son traitement serait des plus délicat...

Les catégories 1, 2 et 3 convergent vers le module de reconnaissance de caractère mis au point par Olivier qui a été connecté à l'ensemble et donne des résultats probants.
La base de donnée des tracés est alimentée avec l'ensemble des données extraites des catégorie 1 et 2. J'hésite encore à généraliser ceci à la catégorie 3 car ceci risque de faire "enfler" la base de manière drastique.
Le module de reconnaissance arrive à séparer les coulés et liés des autre symboles, eux aussi n'alimentent pas la base de donnée.

Lors de l'analyse des PDF en notre possession, un cas particulier de la catégorie 1 a été rencontré. Certains fichiers ne codent pas les lignes des portées avec des commandes PDF (ligne, ou rectangle) mais utilisent un caractère particulier d'une fonte embarquée représentant 5 lignes horizontales sur quelques pixels. Ce cas devra être traité.

by Didier Guillion

Comments

Comment from

Wednesday, Jun 21^st, 2006 at 02:36pm

(No subject)

Dans le cas d'images, ne peut-on pas définir un nombre de pixels minimum pour une reconnaissance correcte (par exemple 20 pixel pour le diamètre d'une note (cercle de la ronde) ?

Sorting

Most recent first
Oldest first

Top of page

Legal information

Last update: