Spark pour les débutants: Projet Part 1

English English

Bonjour tout le monde, je vais enchaînée une nouvelle série de post consacré à un réel projet Big Data.

Contexte du projet

Big Data est un terme qui décrit l’évolution de tout montant volumineux de données structurées et non structurées.
Big Data est caractérisées par 3VS:

  •  Le volume extrême de données.
  • La grande variété de types de données.
  • La vitesse à laquelle les données doivent être traitées.

Continue reading Spark pour les débutants: Projet Part 1

Spark pour les débutants : Créer des API Rest full avec Java et MongoDb

English English

Bienvenue, nous allons découvrir dans ce tutoriel comment créer des API Rest full avec MongoDb comme base de donnée NOSQL en utilisant le langage Java. à la fin de ce tuto vous serez capable de créer vos propres API en interagissant avec une base de donnée NOSQL (mongodb). Le code de ce TP va être effectué en Java vous trouverez le liens du repo Github à la fin du tuto.

Demo Youtube

Continue reading Spark pour les débutants : Créer des API Rest full avec Java et MongoDb

Spark pour les débutants : Installation sous Windows 10

English English

Bienvenue, nous allons découvrir dans ce tutoriel l’environnement de Spark  et l’installation sous Windows 10 et nous allons faire quelques essais avec Apache Spark, afin de voir ce que permet ce Framework et d’apprendre à l’utiliser. Le code de ce TP va être effectué en Java et Scala, qui pour ce que nous allons faire est beaucoup moins lourd que Java. Pas de panique si vous ne connaissez pas ce langage : nous n’allons utiliser que des fonctionnalités très simples de Scala, et des connaissances de base sur les langages fonctionnels vous suffiront. Si ça ne suffit pas, Google is your friend.

Demo Youtube


Continue reading Spark pour les débutants : Installation sous Windows 10

Spark pour les débutants : Introduction

English English

Qu’est-ce que Spark ?

Apache Spark est un framework de traitements Big Data open source construit pour effectuer des analyses sophistiquées et conçu pour la rapidité et la facilité d’utilisation. Celui-ci a originellement été développé par AMPLab, de l’Université UC Berkeley, en 2009 et passé open source sous forme de projet Apache en 2010.

Continue reading Spark pour les débutants : Introduction