Myriad Blog 1.3.0 Saturday, Apr 19th, 2014 at 04:09am 

Tuesday, May 23rd, 2006 at 04:58pm
Projet PDFToMusic, étape 3.
Nous sommes dans l'étape qui consiste à analyser les polices de caractères présentes dans un fichier PDF.
Le format de police "Adobe Type 1C" (C pour compacté) est public. A partir de cette documentation, un extracteur et interpréteur de commande graphique a été écrit pour pouvoir dessiner grossièrement les caractères. En effet, nous avons progressé dans la reflexion sur l'association "numéro de caractère" vers "signification du caractère". Une solution serait de procéder en deux étapes :
1- Rechercher des données similaires dans une base de données, pour savoir si le caractère à déjà été rencontré.
2- Si le caractère est nouveau, tracé du caractère et reconnaissance automatique de celui-ci. S'il est reconnu, alors nous alimenterons la base de donnée utilisée en étape 1.
 
La reconnaissance de caractère passera peut-être par des réseaux neuronaux. Un réseau neuronal a été écrit (en MyrScript, c'est un excellent langage pour faire rapidement des maquettes) et donne des résultats intéressants...
 
Entretemps un nouveau type de police est rencontré, le format "Adobe Type 1". La prochaine étape sera l'analyse de ce format.
by Didier Guillion
Comments

Comment from Olivier Guillion Wednesday, May 24th, 2006 at 11:25am
PDF to Music, Partage de données
Il était bien dans note intention de mettre quelque chose de collaboratif en place. En fait, on pourrait imaginer que la personne pourrait n'avoir accès à la mise à jour de la base de données que si elle accepte d'envoyer ses propres données pour compléter cette base...

Comment from Jean-Armand Tuesday, May 23rd, 2006 at 09:55pm
(No subject)
L'idéal serait que :
- l'utilisateur puisse signaler à son logiciel que celui-ci reconnaît mal un caractère, et indiquer la correction ;
- les ajouts aux bases de données des utilisateurs puissent remonter vers une base de données de Myriad (avec l'accord de l'utilisateur), pour que celle-ci s'enrichisse progressivement.
 
Inutile de dire que tout cela est difficile à mettre en musique.


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013