Le Blog de Myriad -



Myriad Blog 1.3.0	Thursday, Apr 18^th, 2024 at 12:56am

The Myriad team shares here its everyday life and its mood

Tuesday, May 23^rd, 2006 at 04:58pm

Projet PDFToMusic, étape 3.

Nous sommes dans l'étape qui consiste à analyser les polices de caractères présentes dans un fichier PDF.
Le format de police "Adobe Type 1C" (C pour compacté) est public. A partir de cette documentation, un extracteur et interpréteur de commande graphique a été écrit pour pouvoir dessiner grossièrement les caractères. En effet, nous avons progressé dans la reflexion sur l'association "numéro de caractère" vers "signification du caractère". Une solution serait de procéder en deux étapes :
1- Rechercher des données similaires dans une base de données, pour savoir si le caractère à déjà été rencontré.
2- Si le caractère est nouveau, tracé du caractère et reconnaissance automatique de celui-ci. S'il est reconnu, alors nous alimenterons la base de donnée utilisée en étape 1.

La reconnaissance de caractère passera peut-être par des réseaux neuronaux. Un réseau neuronal a été écrit (en MyrScript, c'est un excellent langage pour faire rapidement des maquettes) et donne des résultats intéressants...

Entretemps un nouveau type de police est rencontré, le format "Adobe Type 1". La prochaine étape sera l'analyse de ce format.

by Didier Guillion

Comments

Comment from Olivier Guillion

Wednesday, May 24^th, 2006 at 11:25am

PDF to Music, Partage de données

Il était bien dans note intention de mettre quelque chose de collaboratif en place. En fait, on pourrait imaginer que la personne pourrait n'avoir accès à la mise à jour de la base de données que si elle accepte d'envoyer ses propres données pour compléter cette base...

Comment from Jean-Armand

Tuesday, May 23^rd, 2006 at 09:55pm

(No subject)

L'idéal serait que :
- l'utilisateur puisse signaler à son logiciel que celui-ci reconnaît mal un caractère, et indiquer la correction ;
- les ajouts aux bases de données des utilisateurs puissent remonter vers une base de données de Myriad (avec l'accord de l'utilisateur), pour que celle-ci s'enrichisse progressivement.

Inutile de dire que tout cela est difficile à mettre en musique.

Sorting

Most recent first
Oldest first

Top of page

Legal information

Last update: