Myriad Blog 1.3.0 Friday, Dec 19th, 2014 at 08:16am 

Thursday, Dec 4th, 2008 at 05:11pm
ScanToMusic Etape 30

 
Nous avons maintenant passé en revue la plupart des algorithmes de reconnaissance de caractères. Nous commençons à avoir une vision claire de ce qui peut fonctionner et des problèmes inhérents à chaque méthode.
 
Un bon taux de reconnaissance pourrait être effectué en écrivant un sous-programme spécifique pour chaque caractère, du genre : "s'il y a un demi-cercle en bas à gauche, et une grande ligne verticale à droite, c'est un 'd' ". Mais nous préférerions éviter ce genre de chose, car cela empêche une amélioration de l'algorithme par apprentissage. Pour que le résultat change, il faut modifier le programme...
 
Une autre méthode, l'une des plus anciennes, qui donne étonnamment de bons résultats, est la comparaison graphique des matrices de points. Mais cette méthode reconnaît mal les fontes ou les styles encore jamais rencontrés.
 
L'extraction de données caractéristiques du caractères (position des trous et des bosses, courbes, lignes, etc) permet d'atteindre d'assez bons taux avec seulement une poignée de données décrivant le caractère.  
 
Nous essayons donc d'implémenter une méthode "mixte", combinant l'extraction de données caractéristiques et une reconnaissance de la matrice de points. Sachant que les deux méthodes, indépendamment, trouvent toujours le bon résultat dans les 5 premiers, la combinaison des deux devrait donc augmenter sensiblement le taux de reconnaissance.
La manière de combiner les deux n'a, d'après la documentation que nous avons pu trouver, jamais été mise en oeuvre jusqu'ici. Est-ce parce que cela ne fonctionne pas, ou parce que personne n'y a pensé avant ? Les tests de ces prochains jours nous permettront de le savoir.
by Olivier Guillion
Comments

Comment from bubu42 Thursday, Dec 4th, 2008 at 10:24pm
méthodes combinées
La manière de combiner les deux n'a, d'après la documentation que nous avons pu trouver, jamais été mise en oeuvre jusqu'ici. Est-ce parce que cela ne fonctionne pas, ou parce que personne n'y a pensé avant ? Les tests de ces prochains jours nous permettront de le savoir.
C'est peut-être aussi parce que du point de vue calcul, ça alourdit considérablement le programme. Avec les machines rapides d'aujourd'hui, le problème est minimisé, mais il y a quelques années, les processeurs n'étaient pas aussi performants.

Comment from Pascal Friday, Dec 5th, 2008 at 03:54pm
-bruit-
Je parcours de temps en temps le blog et l'évolution de ScanToMusic, dont je ne peut qu'admirer le nouvel exploit en marche.
 
Une question fatidique s'impose :  
Auriez-vous trouvé une solution pour vous débarrasser des "mauvais caractères" ?
 
 
Pascal P.


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad