Le Blog de Myriad -



Myriad Blog 1.3.0	Wednesday, Apr 17^th, 2024 at 11:38am

The Myriad team shares here its everyday life and its mood

Monday, Dec 8^th, 2008 at 04:49pm

ScanToMusic étape 31

Il nous est venu une astuce qui permettrait peut être d'améliorer la reconnaissance.

Maintenant, nous savons localiser les lignes sur la page et extraire des blobs sur celles ci. Il est très difficile de différencier par exemple un 'i' d'un 'l' surtout quand le point du 'i' est considéré comme un blob indépendant. Le seul critère dont nous disposons est la hauteur de la forme par rapport à la hauteur de la ligne de caractère. Par rapport à la ligne de base, il y a la partie au dessus appelée "ascent" et la partie en dessous appelée "descent". Par exemple, un 'p' ou un 'g' ont un descent, un 't' ou un 'l' un ascent plus prononcé. Un '(' a à la fois un ascent et un descent.

Nous avons commencé à implémenter des algorithmes de discrimination des caractères permettant de déterminer si le blob à un ascent, un descent, si c'est un accent associé à une lettre ou même un symbole de ponctuation, simplement en comparant l'aire de la forme à l'aire de la ligne.

A terme, nous espérons que cela permettra de mieux séparer les caractères en restreignant la recherche à un groupe de caractères possibles.

by Didier Guillion

Comments

Comment from Franck

Tuesday, Dec 9^th, 2008 at 10:12am

descent : moins utile que le reste

Avez-vous envisagé la possibilité de reconnaître un caractère en n'analysant que sa partie supérieure ? Les formes étant ainsi moins complexes, les points de comparaison réellement nécessaires sont moins nombreux, mais il reste évidemment quelques confusions possibles (i-j v-y ...)

Comment from Didier Guillion

Tuesday, Dec 9^th, 2008 at 09:15am

A Sylvain

Pour l'instant, non. Mais ce sera envisagable. Le probleme sera surtout de trouver des partitions pour valider ceci.

Cordialement

Comment from Sylvain Machefert

Tuesday, Dec 9^th, 2008 at 00:41am

et les autres alphabets

juste une question comme ça, les lettres particulières (latin étendu, par exemple avec des hacek), ou les alphabets cyrillique, grec.... seront-ils reconnus ?

(hein, j'en demande trop ?

)

Comment from Didier Guillion

Monday, Dec 8^th, 2008 at 07:38pm

A bubu

Oui, en effet, pour l'instant, je ne vois pas ce cas...

Cordialement

Comment from bubu42

Monday, Dec 8^th, 2008 at 06:55pm

up and down

Très futé, en effet. Cela fait donc deux critères discriminants de plus qui limitent la recherche à l'intérieur de 6 catégories :
- milieu seul
- milieu + descent
- milieu + ascent
- milieu + descent + ascent
- ascent
- descent
ascent+descent sans milieu doit quand même être plus que rare, non ?

Sorting

Most recent first
Oldest first

Top of page

Legal information

Last update: