Le Machine Learning (ML) qu’on peut traduire par apprentissage automatique ou apprentissage machine (ou encore apprentissage statistique il y a encore quelques années) est catalogué comme une des 10 technologies de rupture par la Technology Review, célèbre revue du MIT. Devenue une expression fétiche il semble qu’aucun domaine ne va y échapper et il était inévitable que la sécurité s’y intéresse, reste à le faire de manière intelligente. Nous nous proposons dans cet article de faire un tour d’horizon des possibilités qu’offre le ML. Cet article devrait vous aider à faire vos premiers pas, à comprendre plus facilement les articles de ce hors-série et enfin, à permettre au lecteur d’évaluer l’intérêt d’une solution de sécurité qui se vante de faire du ML.
« If a machine is expected to be infaillible, it cannot also be intelligent. » - Alan Turing
Le Machine Learning est classé par la célèbre revue Technology Review du MIT comme une des 10 technologies de rupture [1] et ce, depuis plusieurs années. Soit. Est-ce une mode ? Oui. Et non. C’est une véritable révolution, mais cela n’empêche pas que certaines solutions proposées à la communauté cyber sont probablement inutiles et dues à un effet de mode, c’est inévitable. Dans les domaines du traitement d’images, de la vision, du traitement ou reconnaissance de la parole ou encore de la traduction automatique, les succès sont nombreux et impressionnants. Récemment, Google a fait sensation avec AlphaGo Zero, version améliorée de AlphaGo [4], ce sont des logiciels de jeu de Go qui sont devenus meilleurs que la plupart des joueurs professionnels développés par sa filiale DeepMind. AlphaGo a donné bien des soucis aux meilleurs joueurs de cet ancestral jeu.
Le...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première
[1] https://www.technologyreview.com/lists/technologies/2018/
[3] https://fr.wikipedia.org/wiki/Apprentissage_automatique
[4] https://edubirdie.com/blog/alphago-zero-learning-scratch
[6] Y. LeCun, Y. Bengio & G. Hinton, Deep learning, Nature, vol. 521, 28 MAY 2015, disponible à : https://www.cs.toronto.edu/~hinton/absps/NatureDeepReview.pdf
[7] A. Géron : Machine Learning avec Scikit-Learn, Mise en Œuvre et cas concrets, Dunod, 2017
[8] A. Géron : Deep Learning avec TensorFlow, Mise en Œuvre et cas concrets, Dunod, 2017.
[9] https://fr.wikipedia.org/wiki/Fonction_d%27activation
[10] THE MNIST DATABASE : http://yann.lecun.com/exdb/mnist/
[11] J. Hearty, Advanced Machine Learning with Python, PACKT Publishing, 2016.
[12] P. B. Sjardin, L. Massaron (Auteur), A. Boschetti, Large Scale Machine Learning with Python, PACKT Publishing, 2016.
[13] F. Chollet, Deep learning with Python, Manning Publications Co., 2018.
[14] C. Chio et D. Freeman, Machine Learning & Security, protecting systems with data and algorithms, O’Reilly, 2018.
Pour aller plus loin
Le Web regorge de ressources. Attention à GitHub, beaucoup de codes donnés en exemple ne fonctionnent pas. On peut citer :
- Les « dépôts » de données (en plus des jeux de données qu’on trouve dans Scikit-Learn) :
- UC Irvine Machine Learning Repository : https://archive.ics.uci.edu/ml/index.php
- Kaggle, un site de challenges : https://www.kaggle.com/
- Datascience.net, idem, mais en langue française : https://www.datascience.net/fr/challenge
- Le site https://keras.io/datasets/ décrit des jeux de données prêts à l’emploi.
- Coursera qui contient de nombreux cours, tous niveaux : https://www.coursera.org/
- Idem pour EDX : https://www.edx.org/
- Si vous voulez jouer avec le célèbre jeu de données de digits du MNIST (avec Keras), avec des réseaux de neurones convolutionnels : https://machinelearningmastery.com/handwritten-digit-recognition-using-convolutional-neural-networks-python-keras/ et https://nextjournal.com/gkoehler/digit-recognition-with-keras
- Le logiciel Alligator (AnaLyzing maLware wIth partitioninG and probAbiliTy-based algORithms), co-écrit par L. Apvril et A. Apvril : http://alligator.telecom-paristech.fr/
- Le site www.fast.ai, lisez notamment l’étonnant billet : http://www.fast.ai/2018/08/10/fastai-diu-imagenet/
- Les conférences de Y. LeCun au Collège de France : https://www.college-de-france.fr/site/yann-lecun/