Myriad Blog 1.3.0 Tuesday, Nov 25th, 2014 at 03:04am 

Wednesday, Dec 10th, 2008 at 05:54pm
ScanToMusic Etape 32

 
Souvent, les scans des pages sont effectués avec une faible précision, ce qui peut poser problème au module de reconnaissance.  
Avec peu de pixels, les caractères sont crénelés, présentant des arêtes aiguës, et certaines opérations graphiques (extraction de squelette ou de contour par exemple) peuvent être perturbées.
 
Aussi désirons-nous, lorsque le nombre de pixels est insuffisant, "zoomer" le caractère afin de reconstituer les courbes et les formes qui les composent. Evidemment, il ne s'agit pas simplement d'agrandir les pixels, cela ne supprimerait pas le crénelage.
 
Deux solutions sont utilisables.  
 
La première, la plus simple, consiste à agrandir les pixels du caractère puis d'appliquer un effet de flou assez puissant. Les contours du caractère deviennent alors indéfinis. En jouant alors sur l'histogramme des valeurs de gris, on peut lui redonner une certaine netteté. Les courbes sont ainsi arrondies.
 
La seconde est d'utiliser un redimensionnement "bicubique". Il s'agit de considérer que chaque position intermédiaire entre les pixels suit une fonction mathématique (polynôme d'ordre 3) dépendante des pixels adjacents.  La valeur des pixels intermédiaires passe donc d'une valeur de pixel à l'autre en suivant une courbe douce (spline).
 
Les deux méthodes donnent des résultats assez proches.  
Par exemple, ici, à gauche le caractère brut, dont les pixels ont été simplement agrandis,. au milieu, le résultat de l'agrandissement par flou/histogramme, et à droite le résultat de l'agrandissement bicubique :
 

 
La méthode du milieu donne des formes plus rondes, mais au détriment des détails (base et jonction de la barre verticale du "P", haut de la barre du "d", etc) et a tendance à éroder les lignes fines, comme le haut du "e".
 
Nous avons donc conservé l'agrandissement bicubique (à droite). Il sera appliqué dès que le caractère à reconnaître est d'une taille inférieure à un seuil à déterminer.
by Olivier Guillion


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013