mercredi, avril 09, 2014

Introduction à Apache Hadoop. Partie 1 : Généralités sur HDFS et MapReduce


Je viens enfin de rédiger mon premier tutoriel sur Apache Hadoop. Ce premier tutoriel introductif s'intéresse à présenter le système de fichiers HDFS (Hadoop Distributed File System) et le modèle de programmation MapReduce. 


Il s'agit d'un premier tutoriel sur une série de plusieurs. L'idée est de poser les bases des concepts et de pouvoir continuer sur un axe plus technique pour les tutoriels suivants. Le deuxième devrait arriver d'ici peu, il traitera de l'installation et de l'exécution d'un job MapReduce.

J'espère que ce premier tutoriel vous plaira.

Bonne lecture.