HomeProductsDownloadOrderSupportSearch
  
 
 Myriad Blog 1.3.0 Tuesday, Mar 19th, 2024 at 07:55am 

Monday, Jun 29th, 2015 at 05:06pm
Harmony 9.6 étape 787

 
Nous avons collecté la plupart des textes dont nous avions besoin pour alimenter notre filtre de détermination automatique de la langue.  
 
Les langues à translittération (Japonais-Romaji / Grec / Hébreu) ont été parmi les plus compliquées. En grec, nous allons devoir effectuer nous-même la translittération (la conversion de caractères grecs en écriture avec des caractères latins) car aucun long texte n'existe dans cette graphie. En hébreu, nous allons essayer de récupérer des textes sur des sites Web proposant des paroles de chansons.
 
Mais la langue qui nous  donne le plus de fil à retordre est l'occitan. Mis à part de très vieux textes (plus de 5 ou 6 siècles) en occitan ancien ou les ouvrages de Frédéric Mistral écrit en occitan "Mistralien" et non en occitan "Classique", aucun long texte roman original ou traduit depuis une autre langue, recueil de poèmes ou de chansons, rien ne semble exister gratuitement en Occitan moderne sur Internet.  
 
Nous avons donc battu le rappel des Occitanophiles, et Danièl nous a fourni des contacts prometteurs.
En attendant, nous avons commencé à aspirer un site de chansons en occitan. Mais parmi les textes de paroles, se glissent du Français, les diverses formes d'occitan, de l'espagnol, de l'italien ou même de l'allemand. Nous allons essyer d'éliminer ces langues, pour ne conserver que ce qui nous paraît être de l'occitan, en espérant que les erreurs resteront à un taux relativement faible. Nous utiliserons cette base textuelle si nous ne pouvons pas trouver mieux.
by Olivier Guillion
Comments

Comment from Bernard BOUVIER Wednesday, Jul 1st, 2015 at 03:58pm
Harmony 9.6 étape 787 Occitan
Bonjour,
 
Que vous faut-il exactement ? Textes de chansons, textes littéraires - format pdf, doc, odt ou image - combien de mots par document ? Combien de documents
 
Pour nous, ce sera essentiellement du languedocien (parlers albigeois, castrais, rouergat, quercynol).
 
Avez-vous demandé à Xavier de la Torre (que vous connaissez) ?
 
Bernard BOUVIER
Nòu Sòrres
pifraire@free.fr


Most recent first
Oldest first

Top of page
Legal information Cookies Last update:  (c) Myriad