Myriad Blog 1.3.0 Sunday, Oct 26th, 2014 at 06:30am 

Thursday, Mar 1st, 2007 at 05:12pm
ScanToMusic étape 1

 
Le projet "Super-OMeR" a enfin démarré, sous le nom provisoire de "ScanToMusic". Le but de ce programme, est, je le rappelle, d'analyser des pages de partition scannées pour en extraire les éléments constitutifs, et recréer une partition éditable (Harmony ou MusicXML). Dans la dernière étape, les algorithmes développés pour PDFtoMusic devraient pouvoir être largement utilisés.
 
Mais dans un premier temps, il faut préparer la reconnaissance optique de l'image.
Plutôt que d'utiliser de vraies pages scannées, nous partons des images obtenues par l'afficheur de PDF de PDFtoMusic :
 

 
Cette image est alors altérée pour la faire ressembler à ce qu'on aurait pu obtenir à la suite d'un -très- mauvais scan. Rotation, déformation, altération des contrastes, "taches" et bruit de fond sont appliqués :
 

 
Les premiers algorithmes de ScanToMusic doivent permettre de retrouver une image "propre", débarassée (ou presque) des problèmes de taches, de bruit et de contraste :
 

 
La prochaine étape consistera à redresser tout cela, en évaluant, puis en compensant les déformations de la page.
by Olivier Guillion
Comments

Comment from xavier Monday, Mar 5th, 2007 at 12:23am
super-omer
un super-omer qui va gérer la molette de la souris  ?  trés bonne idée  .
 
Ce  nouveau omer  pourra t'il ouvrir directement  des fichiers au format pdf ?
 
bon courage à toute l'équipe
 
 
 
 

Comment from Franck Friday, Mar 2nd, 2007 at 12:25am
(No subject)
Quote:
On peut même imaginer un système de validation automatique des résultats
Un jour, on va apprendre que c'est un système automatique qui travaille à Toulouse, et que les Guillion se dorent la pilule à Honolulu.

Comment from Didier Guillion Friday, Mar 2nd, 2007 at 08:03am
Réponses
La version 9.3 d'HA est encore en beta test, des que nous aurons épuisés les rapports, elle sera rendue publique.
 
Des scans seront utiles, bien entendu, mais plus des scans de vrais partitions papier que d'impression d'HA (ca on peut faire facilement)
 
Cordialement

Comment from Jean-Armand Thursday, Mar 1st, 2007 at 11:42pm
Toujours sur la méthode
Dans les applications de reconnaissance optique, il est toujours problématique de constituer un jeu de données suffisamment large, parce que l'on a besoin à la fois de la donnée de départ (l'image), et du résultat que l'on souhaite obtenir (la partition dans HA), et ceci en grand nombre. Surtout si l'on utilise des méthodes par apprentissage, qui ont besoin de beaucoup de données d'entrée. Et même si l'on n'utilise pas ce type de méthode, on a besoin de traiter de nombreux cas pour que le programme soit robuste.
 
C'est pour cela qu'Olivier et Didier utilisent des partitions qu'ils bruitent artificiellement, mais je pense qu'ils auront aussi besoin de vrais résultats de scan, parce que les vrais défauts d'un scan sont sans doute partiellement différents de la simulation qu'ils en font.
 
Une façon de procéder pourrait être d'imprimer des partitions HA puis de les scanner. Pour que ce soit vraiment représentatif, il faudrait que différents scanners soient utilisés. Chacun d'entre nous qui possède un scanner pourrait contribuer de quelques partitions - en tout cas pour ma part je veux bien le faire : j'imprime une partition HA, je la scanne, et j'envoie le tout (la partition HA et le scan) à Myriad.

Comment from Grorom Thursday, Mar 1st, 2007 at 09:28pm
HA béta
bonjour,
 
Je vous souhaite bien du courrage dans cette nouvelle aventure !
 
Mais ne devait-il pas y avoir une version 9.3 de HA ? La version courrante d'HA ne permet pas d'exploiter les exports de PDFtoMusic...

Comment from Olivier Guillion Thursday, Mar 1st, 2007 at 07:30pm
A Franck
Non, nous ne partons pas d'une image écran, mais des pixels calculés par PDFtoMusic lors de son rendu du PDF, ce qui correspond à peu près à un scan parfait à 200dpi.
 
L'avantage de partir de fichiers PDF, c'est que grâce à PDFtoMusic, nous savons ce que nous devons obtenir. On peut même imaginer un système de validation automatique des résultats, en comparant ce que trouve ScanToMusic avec les objets extraits du fichier PDF par PDFtoMusic  

Comment from bubu42 Thursday, Mar 1st, 2007 at 07:23pm
Bon vent !
C'est donc parti pour un nouveau projet !  
Il est donc temps d'encourager l'équipe, ce que je fais bien volontiers.
Et comme dit Franck, pour les mauvais scans, on a de quoi fournir...  

Comment from Franck Thursday, Mar 1st, 2007 at 06:05pm
Discours sur la méthode
Quote:
Plutôt que d'utiliser de vraies pages scannées, nous partons des images obtenues par l'afficheur de PDF de PDFtoMusic

Une image écran ? Qui peut le plus peut le moins, certes, mais là vous partez d'un équivalent d'une résolution vraiment très basse que personne n'utiliserait pour numériser une partition. Tant mieux si ça marche, mais pourquoi faire semblant ? Si vous avez besoins de vilains scans de partitions moches, on doit être un paquet de spécialistes à pouvoir vous en fournir...


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013