Par hasard, nous sommes tombés sur une information qui a affecté la vie de millions de gens, et était pourtant passée presque inaperçue. Il y a quelques jours, une importante source de Spam a été localisée, et ses accès ont été coupés. Cela n'aurait pas mérité la une des journaux ...
|
|
|
| by Olivier Guillion | |
|

Nous avons reçu hier un e-mail de notre hébergeur Web, qui nous avertissait que le serveur de myriad-online.com avait été surchargé à la mi-journée, sans que le volume de données téléchargées ne montre rien de particulier. Pensant qu'il pouvait s'agir d'un bug dans un de nos script, ...
|
|
|
| by Olivier Guillion | |
|
|

Les extractions de formes élémentaires (lignes, arcs) du caractère scanné s'étant avérées suffisamment stables, nous avons commencé à implémenter un module de reconnaissance proprement dit. Une série de caractères connus (16000 caractères issus de diverses fontes) est envoyée à ...
|
|
|
| by Olivier Guillion | |
|

Pour faire suite au dernier billet, nous avons amélioré la recherche de formes élémentaires dans les images scannées. En plus des segments de droites, nous avons ajouté des arcs de cercle. Voici ce que cela donne avec les caractères pris en exemple la dernière fois. A ...
|
|
|
| by Olivier Guillion | |
|
|

Pour reconnaître un caractère, il faut pouvoir le comparer à un ou plusieurs caractères de référence, afin d'en déduire un niveau de similarité. Mais quelles données comparer? La présence de pixels allumés ou éteints à tel ou tel endroit ? Cela est trop sensible à la fonte utilisé, ...
|
|
|
| by Olivier Guillion | |
|

Toujours à la recherche de l'algorithme parfait de reconnaissance de caractère, l'intuition rejoint les conclusions de la documentation disponible à ce sujet : un tel algorithme n'existe pas. Certains sont efficaces, d'autres un peu moins, mais les meilleurs résultats finaux sont ...
|
|
|
| by Olivier Guillion | |
|

Nous sommes maintenant capables de faire à peu près ce que nous voulons sur l'aspect du caractère : en extraire un squelette, détecter les trous et les bosses, les parties indépendantes au sein d'un même caractère (par exemple les point et la virgule d'un point-virgule, ou le "e" ...
|
|
|
| by Olivier Guillion | |
|

Afin de simplifier les comparaisons de caractères , nous avons travaillé sur la squelettisation. Ce procédé permet de transformer des formes pleines en "fil de fer". Grâce à cela, on pourrait s'affranchir des épaisseurs de caractères, pour ne conserver que les données constituant ...
|
|
|
| by Olivier Guillion | |
|
|
|
Most recent first
Oldest first
|
May 18th, 2013 at 09:53am Comment from Laurent Linux multiarch May 17th, 2013 at 05:12pm Article from Olivier Guillion Harmony 9.6 et autres étape 505 May 17th, 2013 at 05:12pm Article from Olivier Guillion Harmony 9.6 et autres étape 504 May 17th, 2013 at 12:29am Comment from Cri-Cri Retour d'expérience May 16th, 2013 at 04:59pm Article from Didier Guillion PDFtoMusic 1.4 et autre May 16th, 2013 at 10:25am Comment from Olivier Guillion @Cri-Cri May 16th, 2013 at 10:25am Comment from Olivier Guillion @Cri-Cri May 15th, 2013 at 11:12pm Comment from Oliveira Avanzamos May 15th, 2013 at 11:12pm Comment from Oliveira Avanzamos May 15th, 2013 at 09:33pm Comment from Cri-Cri @ Oliveira
|
|
|
|