Le Big Data, techniquement, comment ça marche ?

Édouard Thomas



Big Data et Machine Learning - 2e éd. - Les concepts et les outils de la data science

Pirmin Lemberger
Dunod
2016
272 pages
29.9 €

Concrètement, quel est le quotidien d’un data scientist (expert en données), que fait-il exactement ? Comment exploite-t-il les colossaux gisements de données non structurées que son entreprise a accumulées ? Voilà les questions auxquelles cet ouvrage technique de référence répond complètement. Les statistiques, l’aide à la décision, les bases de données et les systèmes informatiques sont conviés ; on les voit travailler de concert. Tous les aspects d’un projet d’exploitation de données massives sont présentés, de la collecte des données à la visualisation des résultats, en passant par la phase d’apprentissage (machine learning). Les concepts abordés font systématiquement l’objet de longs développements : rien n’est glissé sous le tapis.

Le mouvement Not Only SQL et l’écosystème Hadoop requièrent de solides connaissances en systèmes d’information pour profiter pleinement de l’expérience des auteurs. La préparation des données, les algorithmes d’apprentissage et le paradigme MapReduce permettent de comprendre pourquoi des compétences mathématiques fortes et originales sont recherchées. Même la géométrie des espaces à grande dimension est conviée pour « faire parler » les données !



Les dernières notes de lecture