Spark pour les débutants: Tutoriels – Spark Apache streaming Twitter exemple java

English English

Dans ce chapitre, nous allons vous aider à utiliser Spark streaming pour traiter les flux tweet en direct. Rappelez-vous, Spark streaming est un composant de Spark qui fournit hautement évolutive, tolérante aux pannes de traitement de streaming. Ces exercices sont conçus comme des programmes Java. Vous trouverez les liens Gist Github dans le tutoriel.

Créer un compte Twitter développeur

Cette vidéo montrent comment créer une application twitter. Tout d’abord aller à https://apps.twitter.com/.

Continue reading Spark pour les débutants: Tutoriels – Spark Apache streaming Twitter exemple java

Spark pour les débutants: Tutoriels – Connexion à Cassandra

English English

Bienvenue, nous allons découvrir dans ce tutoriel comment connecter Spark avec base de données Cassandra en utilisant le langage Java. Le code sera fait en Java, vous trouverez les liens de Gist Github pendant du tutoriel.

Video Demo

Continue reading Spark pour les débutants: Tutoriels – Connexion à Cassandra

Spark pour les débutants : Installation sous Windows 10

English English

Bienvenue, nous allons découvrir dans ce tutoriel l’environnement de Spark  et l’installation sous Windows 10 et nous allons faire quelques essais avec Apache Spark, afin de voir ce que permet ce Framework et d’apprendre à l’utiliser. Le code de ce TP va être effectué en Java et Scala, qui pour ce que nous allons faire est beaucoup moins lourd que Java. Pas de panique si vous ne connaissez pas ce langage : nous n’allons utiliser que des fonctionnalités très simples de Scala, et des connaissances de base sur les langages fonctionnels vous suffiront. Si ça ne suffit pas, Google is your friend.

Demo Youtube


Continue reading Spark pour les débutants : Installation sous Windows 10

Spark pour les débutants : Introduction

English English

Qu’est-ce que Spark ?

Apache Spark est un framework de traitements Big Data open source construit pour effectuer des analyses sophistiquées et conçu pour la rapidité et la facilité d’utilisation. Celui-ci a originellement été développé par AMPLab, de l’Université UC Berkeley, en 2009 et passé open source sous forme de projet Apache en 2010.

Continue reading Spark pour les débutants : Introduction