GNU/Linux Magazine HS n° 078 - 31/05/2015

Stockage et exploitation : des données aux « big data »

GNU/Linux Magazine HS n° 078 | mai 2015 | Tristan Colombo - Sébastien Chazallet
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

Lorsque l'on travaille avec des données, il ne suffit pas de les acquérir et de les stocker, il faut également être capable de les faire « parler ». Plus la masse d'informations augmente, plus les techniques de stockage et de traitement doivent être efficaces ; mais faut-il pour autant inventer un nouveau nom pour qualifier ces données ?

Lire l'extrait

Hadoop

GNU/Linux Magazine HS n° 078 | mai 2015 | Sébastien Chazallet
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

Hadoop est un framework permettant la création d'applications distribuées (potentiellement sur des grappes de plusieurs milliers de serveurs) et pouvant supporter de grosses montées en charge afin de traiter des volumes de données de l'ordre du petaoctet. Il est structuré autour de plusieurs composants que nous présenterons.

Lire l'extrait

HBase

GNU/Linux Magazine HS n° 078 | mai 2015 | Sébastien Chazallet
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

HBase est une base de données orientée colonnes conçue pour fonctionner de manière distribuée au-dessus du système de fichiers HDFS.Comme de nombreux produits issus de l'écosystème Hadoop, elle est inspirée de travaux menés par Google, en l'occurrence BigTable.

Lire l'extrait

Indexez vos données sans limites à l'aide de Infinispan

GNU/Linux Magazine HS n° 078 | mai 2015 | Romain Pelisse
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

Que ce soit à des fins statistiques, marketing, ou encore plus simplement pour la recherche scientifique, nos systèmes d'information doivent constamment stocker un nombre impressionnant de données, souvent de plusieurs téraoctets, tout en garantissant non seulement un temps d'accès défiant toute concurrence, mais aussi permettre de retrouver un...

Lire l'extrait

Teiid, unifiez vos données et simplifiez votre architecture

GNU/Linux Magazine HS n° 078 | mai 2015 | Romain Pelisse
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

En ces années « Big Data », ce n'est pas seulement la taille ou la quantité de données qui représente un nouveau défi, mais aussi leur nature. En effet, que ce soit pour des raisons techniques de tenue de charge ou par souci de simplicité, les données sont sauvegardées dans de plus en plus de systèmes différents. Si l'on pouvait, au début...

Lire l'extrait

Introduction au data mining en Python avec scikit-learn

GNU/Linux Magazine HS n° 078 | mai 2015 | Cyrille Rossant
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

Le data mining est un ensemble de techniques mathématiques et algorithmiques pour extraire de l'information d'un jeu de données. Tandis que la statistique classique s'attache à décrire et expliquer les données, le data mining vise à découvrir des motifs et des structures dans les données pour éventuellement générer des prédictions. Nous allons...

Lire l'extrait

Analyse statistique de données avec R

GNU/Linux Magazine HS n° 078 | mai 2015 | Laurence Arnaud
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

Cet article vous propose une rapide introduction au langage R. Celui-ci permet d'effectuer des analyses statistiques sur de gros ensembles de données. Après quelques mots sur l'installation de ce langage, nous évoquerons quelques statistiques réalisables sous R.

Lire l'extrait

Visualisation interactive de données avec VisPy

GNU/Linux Magazine HS n° 078 | mai 2015 | Cyrille Rossant
  • Actuellement 0 sur 5 étoiles
  • 1
  • 2
  • 3
  • 4
  • 5

VisPy est une librairie Python de visualisation scientifique spécialisée dans les importants volumes de données et la 3D. VisPy utilise la puissance du processeur graphique (GPU) à l'aide de la librairie OpenGL pour afficher efficacement et de manière interactive des données volumineuses et complexes. Cet article propose une vue d'ensemble de VisPy...

Lire l'extrait