Myriad Blog 1.3.0 Wednesday, Oct 1st, 2014 at 10:38pm 

Monday, Jan 18th, 2010 at 04:54pm
Recherche de séquence mélodique ? (Partie 3)

 
Le système de recherche mélodique s'articulerait autour de 3 modules principaux :
 
1- Le "crawler". Ce programme balaie en permanence le contenu des serveurs Web. Il recherche, dans les pages HTML, les liens vers d'autres pages et vers les fichiers musicaux.  
Les fichiers musicaux sont pré-traités et stockés dans un dossier temporaire, et les adresses des autres pages sont ajoutées le cas échéant à la liste des pages à traiter.  
C'est ici qu'on règle la "portée" de l'indexation en éliminant ou en traitant les liens vers les sites extérieurs.
 
2- Le traitement des fichiers musicaux. Ce programme récupère un à un les fichiers musicaux pré-traités issus de l'étape 1, et en extrait des séquences musicales permettant une recherche (code Parsons et autre). Le résultat de ce traitement est inscrit dans une base de données. Ceci est fait par Harmony Assistant (version spéciale ou script dédié).
 
3- La recherche :  A partir de la séquence entrée par l'utilisateur, balaie la base de données et fournit les résultats de la recherche, classés par pertinence.
 
 
Si la 3e étape est nécessairement réalisée par notre serveur Web, nous réfléchissons à des systèmes qui permettraient de distribuer la charge de travail du point 2. et éventuellement 1. à des utilisateurs consentants.  
 
Pour le point 2. (traitement des fichiers musicaux), il n'y a pas de problème technique ou légal. Le fichier musical lisible ne transiterait jamais sur le réseau, et l'utilisateur ne saurait pas quel fichier il traite et n'aurait pas accès au détail des données.
 
Pour le point 1. ("crawler"), c'est plus compliqué. Si le travail est distribué parmi les utilisateurs, cela ne pourrait se faire que parmi un petit groupe de personnes de confiance. En effet, si l'ensemble du Web était balayé, le programme pourrait faire accès à des sites illégaux, ces accès étant inscrits dans les fichiers-journaux de l'utilisateur ou de son fournisseur d'accès. Nous préférons donc dans un premier temps nous occuper de cette partie nous-même.
by Olivier Guillion


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013