Démystifier les encodages

Magazine
Marque
Linux Pratique
Numéro
89
Mois de parution
mai 2015
Domaines


Résumé
Bon allez, avouez-le, vous avez déjà été embêté avec les encodages. Que ce soit sur votre site, dans votre terminal, ou dans une application, vous vous demandez pourquoi ça ne s’affiche pas comme vous l’aviez prévu. Pourquoi, par exemple, vous avez un é au lieu d’un é ?La pratique montre que cette notion reste abstraite dans l’esprit des développeurs alors qu’elle est particulièrement essentielle. Je vous propose de démystifier tout cela à travers cet article. Cela devrait lever pas mal d'ambiguïtés.

1 Un peu d’histoire

1.1 Le texte en informatique

Rappelons quelques notions élémentaires qui nous aideront pour la suite. Dans notre langage quotidien, l’unité de base est le caractère. Un caractère peut revêtir la forme d’une lettre minuscule ou majuscule, d'un chiffre, d'un signe de ponctuation, d'un espace, d'une tabulation ou même un retour à la ligne. Notre ordinateur, lui, n’est qu’une machine à calculer, bien incapable de comprendre le texte. Il ne sait que manipuler des suites de bits, autrement dit que des suites de 0 et de 1.

Aussi, afin qu’on puisse afficher ou stocker du texte, on va attribuer à chaque caractère une valeur numérique qui sera facilement manipulable en mémoire par notre ordinateur. La valeur numérique attribuée à chaque caractère est appelée un code (ou codet). L’ensemble des codes qu’on a attribué à un ensemble convenu de caractères est appelé jeu de caractères (ou character set ou charset). L’encodage est la façon...

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Mozilla Common Voice : rendre la reconnaissance vocale ouverte et collaborative

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
105
Mois de parution
novembre 2019
Domaines
Résumé

Mozilla a récemment lancé un projet pour collecter et valider des échantillons de voix permettant d'améliorer les systèmes de reconnaissance et de synthèse vocale (STT - Speech To Text - et TTS - Text To Speech). En effet, pour que la reconnaissance soit la plus fiable et la synthèse la plus réaliste possible, il faut nécessairement disposer d'un grand nombre d'échantillons vocaux. Or, la plupart des données employées par les grandes entreprises ne sont pas libres. Mozilla propose donc via son projet Common Voice de participer à l'élaboration d'une base de données libre, créée de manière communautaire.

Prise en main de Kdenlive par l’exemple : tracking de l’effet « masque automatique »

Magazine
Marque
Linux Pratique
Numéro
116
Mois de parution
novembre 2019
Domaines
Résumé

Kdenlive est un logiciel de montage vidéo multipiste libre particulièrement intuitif, mais très complet. Dans cet article, nous vous présenterons les bases du logiciel via l’application de l’effet « masque automatique ». Celui-ci permet de pixeliser une section d’une vidéo, avec suivi automatique, généralement dans le but de flouter un visage. Nous finirons par quelques outils permettant du tracking vidéo 2D.

Poddr - Vos podcasts favoris à portée de clic

Magazine
Marque
Linux Pratique
Numéro
116
Mois de parution
novembre 2019
Domaines
Résumé

Poddr est un player de podcasts libre et multiplateforme qui vous permettra de profiter de vos flux audios depuis votre ordinateur de bureau. Pour proposer un large choix de podcasts à ses utilisateurs, le développeur du projet a choisi d’utiliser l’API d’iTunes.