HomeProductsDownloadOrderSupportSearch
  
 
 Myriad Blog 1.3.0 Tuesday, Mar 19th, 2024 at 03:44am 

Monday, Dec 8th, 2008 at 04:49pm
ScanToMusic étape 31

 
Il nous est venu une astuce qui permettrait peut être d'améliorer la reconnaissance.  
 
Maintenant, nous savons localiser les lignes sur la page et extraire des blobs sur celles ci. Il est très difficile de différencier par exemple un 'i' d'un 'l' surtout quand le point du 'i' est considéré comme un blob indépendant. Le seul critère dont nous disposons est la hauteur de la forme par rapport à la hauteur de la ligne de caractère. Par rapport à la ligne de base, il y a la partie au dessus appelée "ascent" et la partie en dessous appelée "descent". Par exemple, un 'p' ou un 'g' ont un descent, un 't' ou un 'l' un ascent plus prononcé. Un '(' a à la fois un ascent et un descent.
 
Nous avons commencé à implémenter des algorithmes de discrimination des caractères permettant de déterminer si le blob à un ascent, un descent, si c'est un accent associé à une lettre ou même un symbole de ponctuation, simplement en comparant l'aire de la forme à l'aire de la ligne.
 
A terme, nous espérons que cela permettra de mieux séparer les caractères en restreignant la recherche à un groupe de caractères possibles.
by Didier Guillion
Comments

Comment from Franck Tuesday, Dec 9th, 2008 at 10:12am
descent : moins utile que le reste
Avez-vous envisagé la possibilité de reconnaître un caractère en n'analysant que sa partie supérieure ? Les formes étant ainsi moins complexes, les points de comparaison réellement nécessaires sont moins nombreux, mais il reste évidemment quelques confusions possibles (i-j v-y ...)

Comment from Didier Guillion Tuesday, Dec 9th, 2008 at 09:15am
A Sylvain
Pour l'instant, non. Mais ce sera envisagable. Le probleme sera surtout de trouver des partitions pour valider ceci.
 
Cordialement

Comment from Sylvain Machefert Tuesday, Dec 9th, 2008 at 00:41am
et les autres alphabets
juste une question comme ça, les lettres particulières (latin étendu, par exemple avec des hacek), ou les alphabets cyrillique, grec.... seront-ils reconnus ?
 
(hein, j'en demande trop ? )

Comment from Didier Guillion Monday, Dec 8th, 2008 at 07:38pm
A bubu
Oui, en effet, pour l'instant, je ne vois pas ce cas...
 
Cordialement

Comment from bubu42 Monday, Dec 8th, 2008 at 06:55pm
up and down
Très futé, en effet. Cela fait donc deux critères discriminants de plus qui limitent la recherche à l'intérieur de 6 catégories :
- milieu seul
- milieu + descent
- milieu + ascent
- milieu + descent + ascent
- ascent  
- descent
ascent+descent sans milieu doit quand même être plus que rare, non ?


Most recent first
Oldest first

Top of page
Legal information Cookies Last update:  (c) Myriad