PERFORMANCE USER GROUP PARIS

Prochain PerfUG : le 24 avril

Hadoop est principalement utilisé pour le monde batch. Le paradigme MapReduce sur Hadoop ne propose pas de transformation ou de requêtage performant mais plutôt un traitement d’une forte volumétrie de données. Cependant, la performance n’est pas à négliger dans certains cas :

• lorsque la fenêtre de traitement des données devient serrée pour fournir des données à jour

• des besoins de requêtages ponctuels par des analystes peuvent arriver au travers d’outils type Hive ou Pig.

Il devient nécessaire de fournir ces données dans un temps de requêtage supportable à l’échelle humaine.

Cette session permet d’introduire les basiques d’Hadoop et de HDFS ainsi que des astuces de performance sur le stockage, le requêtage (Hive, MapReduce) ainsi que sur du paramétrage.

Le speaker de cette session est Sofian Djamaa, Software Engineer chez Criteo.

Infos et inscription sur Eventbrite.

Publié le: 15 April 2014