Myriad Blog 1.3.0 Tuesday, Sep 16th, 2014 at 06:56am 

Thursday, Oct 30th, 2008 at 04:13pm
ScanToMusic étape 20

 
Pour mettre à plat les différentes techniques de travail sur les images, nous avons travaillé sur des pages de texte, en essayant d'y appliquer divers algorithmes préalables à la reconnaissance optique de caractères (OCR).
Le but est de vérifier quels algorithmes s'avèrent efficaces dans la chaine de traitement d'une telle reconnaissance, afin de voir ensuite lesquels appliquer lors de la reconnaissance des symboles musicaux.
 
Nous sommes donc partis d'un texte scanné dont voici un extrait, après ajustement automatique du contraste :
 

 
Nous le passons en inversion vidéo pour plus de confort :
 

 
Ensuite, nous avons essayé l'algorithme suivant :
si la squelettisation peut être assimilée à un "feu de prairie" (voir billet précédent), alors l'algorithme inverse permettrait de connaître les lignes de séparation entre les caractères.
 
Imaginons que chaque forme de la page (chaque lettre) soit un ballon dans lequel on souffle. Les point de rencontre des parois de ces ballons tracent une ligne de partage entre chacun d'entre eux.
 
Nous avons donc soufflé...
 

 
... et encore soufflé...
 

 
 
Ici, nous ne résistons pas à vous montrer un détail de cette image, au résultat graphique assez sympathique. Nous adorons , notamment la bouille des "e":
 

 
 
Mais bon, on n'est pas là [que] pour s'amuser. En poursuivant le gonflage, on obtient des "cellules" qui englobent chaque caractère. Ici, le caractère d'origine a été surimprimé en rouge pour bien voir :
 

 
Vu d'un peu plus près :
 

 
Et après "élagage" des branches inutiles :
 

 
On voit maintenant que chaque cellule contient un caractère (ou un morceau de caractère lorsqu'il ya a un point ou un accent).
 
Par contre, lorsque deux caractères se touchaient au départ (le hr du dernier mot), ils se retrouvent dans la même cellule. Les séparer sera le but du prochain algorithme.
by Olivier Guillion
Comments

Comment from Franck Thursday, Oct 30th, 2008 at 06:05pm
Alcoorithme
C'est marrant, dès les premières lignes d'un billet, je peux dire sans regarder la fin s'il est signé Didier ou Olivier.
Et là encore j'ai deviné... dès qu'il a été question de souffler dans le ballon !

Comment from hermesII Thursday, Oct 30th, 2008 at 06:08pm
ballon
J'en perds mon latin entre les feux de forêts et les E ballons glonflés à l'oxygène, j'en ai le souffle coupé.
Bravo pour toutes vos recherches scientifiques !  
j'ai hate d'en savoir plus dans les prochaines étapes
 

Comment from Antoine Bautista Thursday, Oct 30th, 2008 at 11:57pm
Alphabet + essai
Bonsoir Olivier
 
1°) Peut-on en tirer une nouvelle Police de ces lettres ballons ?
2°) Que donne " l'œuvre de noël " en lettres gonflées ? ( pour voir ce que donne le "e dans l'o " et "le tréma" dans les cellules ) .
 
A+


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013