Mozilla Common Voice : rendre la reconnaissance vocale ouverte et collaborative

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
105
|
Mois de parution
novembre 2019
|
Domaines


Résumé

Mozilla a récemment lancé un projet pour collecter et valider des échantillons de voix permettant d'améliorer les systèmes de reconnaissance et de synthèse vocale (STT - Speech To Text - et TTS - Text To Speech). En effet, pour que la reconnaissance soit la plus fiable et la synthèse la plus réaliste possible, il faut nécessairement disposer d'un grand nombre d'échantillons vocaux. Or, la plupart des données employées par les grandes entreprises ne sont pas libres. Mozilla propose donc via son projet Common Voice de participer à l'élaboration d'une base de données libre, créée de manière communautaire.


La suite est réservée aux abonnés. Déjà abonné ? Se connecter

Sur le même sujet

Préparer un système GNU/Linux temps réel pour vos applications audio

Magazine
Marque
Linux Pratique
Numéro
118
|
Mois de parution
mars 2020
|
Domaines
Résumé

Pendant longtemps, je me suis amusé à compiler des noyaux Linux afin de paramétrer mes ordinateurs avec les options correspondantes au matériel les composant. Par la suite, j’ai découvert la possibilité d’optimiser encore plus le cœur de mes systèmes GNU/Linux avec les fonctionnalités dites « temps réel », notamment pour faire tourner des logiciels audio avec le serveur de son Jack.

Poddr - Vos podcasts favoris à portée de clic

Magazine
Marque
Linux Pratique
Numéro
116
|
Mois de parution
novembre 2019
|
Domaines
Résumé

Poddr est un player de podcasts libre et multiplateforme qui vous permettra de profiter de vos flux audios depuis votre ordinateur de bureau. Pour proposer un large choix de podcasts à ses utilisateurs, le développeur du projet a choisi d’utiliser l’API d’iTunes.

Mozilla Common Voice : rendre la reconnaissance vocale ouverte et collaborative

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
105
|
Mois de parution
novembre 2019
|
Domaines
Résumé

Mozilla a récemment lancé un projet pour collecter et valider des échantillons de voix permettant d'améliorer les systèmes de reconnaissance et de synthèse vocale (STT - Speech To Text - et TTS - Text To Speech). En effet, pour que la reconnaissance soit la plus fiable et la synthèse la plus réaliste possible, il faut nécessairement disposer d'un grand nombre d'échantillons vocaux. Or, la plupart des données employées par les grandes entreprises ne sont pas libres. Mozilla propose donc via son projet Common Voice de participer à l'élaboration d'une base de données libre, créée de manière communautaire.

Prise en main de Kdenlive par l’exemple : tracking de l’effet « masque automatique »

Magazine
Marque
Linux Pratique
Numéro
116
|
Mois de parution
novembre 2019
|
Domaines
Résumé

Kdenlive est un logiciel de montage vidéo multipiste libre particulièrement intuitif, mais très complet. Dans cet article, nous vous présenterons les bases du logiciel via l’application de l’effet « masque automatique ». Celui-ci permet de pixeliser une section d’une vidéo, avec suivi automatique, généralement dans le but de flouter un visage. Nous finirons par quelques outils permettant du tracking vidéo 2D.

Par le même auteur

Édito

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
109
|
Mois de parution
juillet 2020
|
Résumé

La société Synopsys a récemment publié un rapport de 39 pages intitulé « 2020 Open Source Security and Risk Analysis (OSSRA) Report » [1]. Cette étude, basée sur l'analyse de 1253 applications, indique que 99% des applications auditées contiennent des composants open source. Si toutes les applications analysées étaient open source, cela n'aurait guère d'intérêt, mais il faut savoir que 30% d'entre elles sont propriétaires. Il y a donc un intérêt indéniable pour l'open source qui s'immisce dans pratiquement tous les développements logiciels.

Premiers pas avec GDScript et Godot

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
109
|
Mois de parution
juillet 2020
|
Domaines
Résumé

Le langage de scripting par défaut de Godot est le GDScript. Plutôt que de se lancer dans du C# ou encore du Python comme cela est possible, autant utiliser le langage natif du logiciel (surtout quand il s'inspire de Python…).

Godot pour coder des jeux, mais pas seulement !

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
109
|
Mois de parution
juillet 2020
|
Domaines
Résumé

Godot peut être employé pour développer des jeux en 2D ou en 3D, mais il est également possible de réaliser des interfaces pour des applications plus professionnelles. Le « petit » plus sera de ne développer qu'une seule fois pour de multiples systèmes...

Créez une fake webcam pour modifier l'image de vos visioconférences

Magazine
Marque
GNU/Linux Magazine
Numéro
239
|
Mois de parution
juillet 2020
|
Domaines
Résumé

Avec le confinement, le nombre de visioconférences a augmenté de manière exponentielle. Malheureusement, seul Zoom propose de modifier l'arrière-plan de ce que filme votre caméra, masquant ainsi votre capharnaüm. Je vous propose donc d'utiliser Python et OpenCV pour créer un faux périphérique de webcam utilisable avec n'importe quelle application et sur lequel nous pourrons modifier l'image...