La reconnaissance optique de caractères s’est imposée comme une application très réussie de la technologie dans les domaines de la reconnaissance des formes et de l’intelligence artificielle. De nombreux systèmes commerciaux de reconnaissance optique de caractères sont disponibles pour une variété d’applications, bien que les machines ne puissent pas encore rivaliser avec les capacités de lecture humaines. Pour en comprendre les évolutions, il faut revenir sur son histoire, sur la façon dont elle s’est construite ainsi que sur les raisons.
Qui ne s’est pas demandé, face à une montagne de papier, comment économiser de l’espace et du temps ? Qui n’a jamais cherché pendant de longues minutes, un document en particulier dans ses archives, sans arriver à mettre la main dessus ? Il existe une technologie pour se faciliter la vie et l’archivage : l’OCR (Optical Character Recognition).
1. Définition et contours
La reconnaissance optique des caractères (OCR) s’intéresse au problème de la reconnaissance des caractères qui ont été traités optiquement. La reconnaissance optique intervient une fois le processus d’écriture ou d’impression terminé, par opposition à la reconnaissance en ligne, qui intervient au moment où les caractères sont dessinés. Pour schématiser, on pourrait dire que l’OCR consiste à scanner, comprendre et archiver dans une base de données structurée, des articles de presse des années 70 alors que la reconnaissance en ligne consiste à comprendre dès que le...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première