Myriad Blog 1.3.0 Monday, Jan 26th, 2015 at 11:44pm 

Dev News Monday, Dec 29th, 2008 at 05:09pm
ScanToMusic tape 36

 
Maintenant que le module de reconnaissance de caractres est suffisamment avanc, nous allons poursuivre deux tches en parallle :  
 
- L'amlioration de la reconnaissance de textes, notamment par un meilleur dcoupage des zones de texte en caractres individuels
 
- L'application des connaissances que nous avons pu acqurir la reconnaissance des symboles musicaux proprement dite. Le problme principal rside dans les lignes des portes, qui "brouillent" la reconnaissance.
Deux solutions sont possibles:
 
Soit nous essayons d'enlever physiquement ces lignes de l'image, en tentant de reconstituer les parties des symboles qui sont dessines dessous
 
Soit  nous adaptons nos algorithmes de reconnaissance, en leur faisant ignorer partiellement ou totalement ces parties-l.
 
Entre les deux, notre coeur balance...
by Olivier Guillion

Dev News Monday, Dec 22nd, 2008 at 05:02pm
ScanToMusic tape 35

 
Le module d'extraction de zones de caractres dans une image et le module de reconnaissance ont t fusionns.
 
On peut donc maintenant charger une page scanne, lancer une analyse, et obtenir graphiquement le texte reconnu affich en surimpression sur le scan.
 
Cela va nous permettre de poursuivre plus avant l'amlioration de la reconnaissance, mais nous devrons rapidement rsoudre le problme de lenteur de calcul, qui va nous gner dans nos mises au point.
 
Avant d'optimiser les routines de reconnaissances elles-mmes, nous essayons de trouver un algorithme simple et rapide, fiable 100%, permettant d'liminer des comparaisons les caractres trop diffrents du caractre scann. En effet, plutt que de rendre plus rapide la fonction complexe de comparaison, il vaudrait mieux qu'elle soit excute le moins souvent possible.  
 
Et rien ne nous empchera, une fois cela fait, de l'optimiser quand mme...
by Olivier Guillion

Dev News Thursday, Dec 18th, 2008 at 04:36pm
ScanToMusic tape 34

 
Ca y est, un module de reconnaissance optique des caractres alphanumriques est maintenant oprationnel.
 
Lorsque les caractres individuels ont t correctement extraits du texte, et que le programme d'extraction peut  fournir quelques informations sur l'chelle des caractres et leur position par rapport la ligne de base, ce module a un taux de succs qui avoisine les 100%.
 
Les erreurs qu'il commet encore surviennent sur des scans de mauvaise qualit, ou lorsque plusieurs lettres colles sont considres comme une seule.
 
Il nous faut maintenant interconnecter nos diffrents modules, pour raliser une chaine complte allant de l'image scanne au texte complet extrait.
 
Seul bmol pour l'instant, la reconnaissance, si elle fonctionne assez bien, reste abominablement lente. Du travail d'optimisation devra tre effectu pour rendre le procd utilisable, mais ce n'est pas notre souci pour l'instant. D'abord quelque chose qui fonctionne tout court, et ensuite seulement quelque chose qui fonctionne vite.
by Olivier Guillion
 2 comments.

Dev News Wednesday, Dec 10th, 2008 at 05:54pm
ScanToMusic Etape 32

 
Souvent, les scans des pages sont effectus avec une faible prcision, ce qui peut poser problme au module de reconnaissance.  
Avec peu de pixels, les caractres sont crnels, prsentant des artes aigus, et certaines oprations graphiques (extraction de squelette ou de contour par exemple) peuvent tre perturbes.
 
Aussi dsirons-nous, lorsque le nombre de pixels est insuffisant, "zoomer" le caractre afin de reconstituer les courbes et les formes qui les composent. Evidemment, il ne s'agit pas simplement d'agrandir les pixels, cela ne supprimerait pas le crnelage.
 
Deux solutions sont utilisables.  
 
La premire, la plus simple, consiste agrandir les pixels du caractre puis d'appliquer un effet de flou assez puissant. Les contours du caractre deviennent alors indfinis. En jouant alors sur l'histogramme des valeurs de gris, on peut lui redonner une certaine nettet. Les courbes sont ainsi arrondies.
 
La seconde est d'utiliser un redimensionnement "bicubique". Il s'agit de considrer que chaque position intermdiaire entre les pixels suit une fonction mathmatique (polynme d'ordre 3) dpendante des pixels adjacents.  La valeur des pixels intermdiaires passe donc d'une valeur de pixel l'autre en suivant une courbe douce (spline).
 
Les deux mthodes donnent des rsultats assez proches.  
Par exemple, ici, gauche le caractre brut, dont les pixels ont t simplement agrandis,. au milieu, le rsultat de l'agrandissement par flou/histogramme, et droite le rsultat de l'agrandissement bicubique :
 

 
La mthode du milieu donne des formes plus rondes, mais au dtriment des dtails (base et jonction de la barre verticale du "P", haut de la barre du "d", etc) et a tendance roder les lignes fines, comme le haut du "e".
 
Nous avons donc conserv l'agrandissement bicubique ( droite). Il sera appliqu ds que le caractre reconnatre est d'une taille infrieure un seuil dterminer.
by Olivier Guillion

Dev News Thursday, Dec 4th, 2008 at 05:11pm
ScanToMusic Etape 30

 
Nous avons maintenant pass en revue la plupart des algorithmes de reconnaissance de caractres. Nous commenons avoir une vision claire de ce qui peut fonctionner et des problmes inhrents chaque mthode.
 
Un bon taux de reconnaissance pourrait tre effectu en crivant un sous-programme spcifique pour chaque caractre, du genre : "s'il y a un demi-cercle en bas gauche, et une grande ligne verticale droite, c'est un 'd' ". Mais nous prfrerions viter ce genre de chose, car cela empche une amlioration de l'algorithme par apprentissage. Pour que le rsultat change, il faut modifier le programme...
 
Une autre mthode, l'une des plus anciennes, qui donne tonnamment de bons rsultats, est la comparaison graphique des matrices de points. Mais cette mthode reconnat mal les fontes ou les styles encore jamais rencontrs.
 
L'extraction de donnes caractristiques du caractres (position des trous et des bosses, courbes, lignes, etc) permet d'atteindre d'assez bons taux avec seulement une poigne de donnes dcrivant le caractre.  
 
Nous essayons donc d'implmenter une mthode "mixte", combinant l'extraction de donnes caractristiques et une reconnaissance de la matrice de points. Sachant que les deux mthodes, indpendamment, trouvent toujours le bon rsultat dans les 5 premiers, la combinaison des deux devrait donc augmenter sensiblement le taux de reconnaissance.
La manire de combiner les deux n'a, d'aprs la documentation que nous avons pu trouver, jamais t mise en oeuvre jusqu'ici. Est-ce parce que cela ne fonctionne pas, ou parce que personne n'y a pens avant ? Les tests de ces prochains jours nous permettront de le savoir.
by Olivier Guillion
 2 comments.


Full view
Reduced view
Most recent first
Oldest first
All
Didier Guillion
Olivier Guillion
Sylvie Ricard
All
Dev News
Technical
Mood
Memories
Myriad Life
To be seen
30 previous days
Apr 2006
May 2006
Jun 2006
Jul 2006
Aug 2006
Sep 2006
Oct 2006
Nov 2006
Dec 2006
Jan 2007
Feb 2007
Mar 2007
Apr 2007
May 2007
Jun 2007
Jul 2007
Aug 2007
Sep 2007
Oct 2007
Nov 2007
Dec 2007
Jan 2008
Feb 2008
Mar 2008
Apr 2008
May 2008
Jun 2008
Jul 2008
Aug 2008
Sep 2008
Oct 2008
Nov 2008
Dec 2008
Jan 2009
Feb 2009
Mar 2009
Apr 2009
May 2009
Jun 2009
Jul 2009
Aug 2009
Sep 2009
Oct 2009
Nov 2009
Dec 2009
Jan 2010
Feb 2010
Mar 2010
Apr 2010
May 2010
Jun 2010
Jul 2010
Aug 2010
Sep 2010
Oct 2010
Nov 2010
Dec 2010
Jan 2011
Feb 2011
Mar 2011
Apr 2011
May 2011
Jun 2011
Jul 2011
Aug 2011
Sep 2011
Oct 2011
Nov 2011
Dec 2011
Jan 2012
Feb 2012
Mar 2012
Apr 2012
May 2012
Jun 2012
Jul 2012
Aug 2012
Sep 2012
Oct 2012
Nov 2012
Dec 2012
Jan 2013
Feb 2013
Mar 2013
Apr 2013
May 2013
Jun 2013
Jul 2013
Aug 2013
Sep 2013
Oct 2013
Nov 2013
Dec 2013
Jan 2014
Feb 2014
Mar 2014
Apr 2014
May 2014
Jun 2014
Jul 2014
Aug 2014
Sep 2014
Oct 2014
Nov 2014
Dec 2014
Jan 2015
Jan 26th, 2015 at 04:55pm 
Article from Olivier Guillion
Acam Winter tape 33
Jan 23rd, 2015 at 04:53pm 
Article from Didier Guillion
ACAM sur Mac tape 18
Jan 22nd, 2015 at 04:53pm 
Article from Olivier Guillion
Acam Winter tape 32
Jan 21st, 2015 at 04:54pm 
Article from Didier Guillion
ACAM sur Mac tape 17
Jan 20th, 2015 at 04:58pm 
Article from Olivier Guillion
Acam Winter tape 31
Jan 19th, 2015 at 04:55pm 
Article from Didier Guillion
ACAM sur Mac tape 16
Jan 16th, 2015 at 05:49pm 
Comment from dheo
Keyboard Input
Jan 16th, 2015 at 05:49pm 
Comment from dheo
Keyboard Input
Jan 16th, 2015 at 05:49pm 
Comment from dheo
Keyboard Input
Jan 16th, 2015 at 05:49pm 
Comment from dheo
Keyboard Input

Top of page
Last update:  (c) Myriad