Kaggle, la Data Science en compétition

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
100
Mois de parution
janvier 2019
Domaines


Résumé
Kaggle permet aux Data Scientists de concourir pour transformer les données des entreprises en or. Voici la façon dont une compétition fonctionne et quelques astuces d’un « Kaggler ».

Pour comprendre pourquoi les compétitions de Data Science sont aussi populaires à la fois pour les entreprises et les Data Scientists, il faut remonter en 2006, avec Netflix qui en a été le précurseur. Le Prix Netflix était un concours ouvert pour le meilleur algorithme de filtrage collaboratif permettant de prédire les notes des utilisateurs pour les films, sur la base d'évaluations précédentes sans autres informations sur les utilisateurs ou les films. La récompense ? 1 000 000 $ US à l’équipe qui améliorerait l’algorithme de 10%.

Le 21 septembre 2009, le prix a été remis à l'équipe Pragmatic Chaos de BellKor, qui a surpassé de 10,06% l'algorithme de Netflix pour prédire les cotes. Ce faisant, Netflix a dépensé 1 000 000 $ US. Beaucoup ? Ce n’est rien comparé à ce qu’ils ont gagné : l’algorithme a été drastiquement amélioré, alors que des...

Cet article est réservé aux abonnés. Il vous reste 90% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Intelligence artificielle : la grande méprise

Magazine
Marque
Linux Pratique
Numéro
118
Mois de parution
mars 2020
Domaines
Résumé

Que ce soit dans les salons professionnels, la presse spécialisée ou même les publicités adressées au grand public, on n’échappe pas à l’intelligence artificielle. Pourtant, derrière ce terme, finalement très fourre-tout, il existe une véritable science. Mais entre l’état de l’art et ce qui existe réellement, il y a une différence qui change la donne.

AlphaFold, la réponse au problème le plus complexe de l'univers ?

Magazine
Marque
GNU/Linux Magazine
Numéro
234
Mois de parution
février 2020
Domaines
Résumé

Avec l’avènement de la biologie moléculaire au XXe siècle, l’homme a pris conscience qu’il pouvait utiliser le vivant pour l’étudier, puis pour le modifier. Le défi du XXIe siècle va porter sur l’utilisation intelligente de ce savoir pour accélérer l’évolution, et produire des nano machines, les protéines, capables de corriger tous les problèmes que nous avons engendrés. Mais pour cela, il faut répondre au problème le plus complexe de l’univers...

Réalisez vos deepfakes avec les réseaux génératifs antagonistes

Magazine
Marque
GNU/Linux Magazine
Numéro
234
Mois de parution
février 2020
Domaines
Résumé

Parmi les applications du moment les plus décriées de l'intelligence artificielle figurent celles qui consistent à falsifier des supports multimédias (vidéos, images ou bandes sons...) dont il est de plus en plus difficile de savoir s'il s'agit d'un support orignal ou corrompu. Vous avez pu vous en rendre compte par vous-même en regardant la vidéo dans laquelle Barack Obama parle comme Donald Trump [1]. Nous allons découvrir dans cet article comment utiliser les réseaux génératifs antagonistes, pour créer des images ou vidéos truquées, communément appelées deepfakes.

Keras, l'outil privilégié des data scientists

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
106
Mois de parution
janvier 2020
Domaines
Résumé

« J’aimerais expérimenter avec un réseau de neurones, mais je ne sais pas comment le coder rapidement avec TensorFlow. »Dans cet article, nous allons présenter Keras et ses principales fonctionnalités, qui en font un outil privilégié des data scientists. Après une rapide prise en main, nous vous proposerons un cas d’étude à l’état de l’art : comment tromper un réseau de neurones !

Premiers pas avec TensorFlow 2.0

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
106
Mois de parution
janvier 2020
Domaines
Résumé

Vous ne pouvez pas ne pas avoir entendu parler de TensorFlow. Mais peut-être ne savez-vous pas exactement de quoi il s'agit, ni comment l'utiliser. Dans cet article, nous faisons le point sur le framework phare de Google pour le Machine Learning.