[ IMPORTANT | Covid-19 ] Toutes nos formations sont maintenues et les cours en présentiel seront assurés en ligne. 15% de réduction avec le code BLENTFAMILY2020

Part Time On-Site Bootcamp

Parcours Data Engineer

Notre vision

Il est difficile de trouver des formations qui rassemblent les principales technologies Big Data sur un seul sujet, qu'il s'agisse de MOOCs ou de bootcamps. Le métier de Data Engineer, qui utilise au quotidien tous ces outils, demande d'avoir une connaissance élargie sur tous ces outils pour mener à bien un projet.

Nous avons donc voulu offrir une pédagogie unique : Blent est la seule école où tu peux te former au métier de Data Engineer sur des projets proposés par nos entreprises partenaires.

Guidé par des professionnels du secteur, tu seras dans la peau d'un Data Engineer pour résoudre des problématiques diverses et variés sur comme si tu étais en entreprise.

Bootcamp Data Engineer

Comment se déroule la formation Data Engineer ?

La formation Data Engineer est à temps partiel, parfaitement adaptée pour les salariés, entrepreneurs et étudiants. Cumulant ateliers en présentiels et exercices à distance, tu seras opérationnel sur des problématiques Big Data et tu auras une vision précise pour mener à bien les futures missions que te seront confiées en entreprise.

Participer à un projet Data Science de A à Z avec des données réelles

Échanger avec des start-up innovantes dans un écosystème stimulant

Vivre une expérience unique en se lançant dans cette aventure

Mets-toi dans la peau d'un Data Engineer

Quel est le programme de la formation Data Engineer ?

Pendant cette formation, tu découvriras les outils les plus populaires et utilisés quotidiennement par les Data Engineers. En très forte demande, le Data Engineer sait manipuler avec aisance les bases de données non structurées, mais peut également lancer des calculs intensifs sur des clusters distants.

Après plusieurs semaines à nos côtés, tu auras une vision claire de toutes les phases qui interviennent dans un projet Data Engineering, du stockage des données (S3, NoSQL) au calcul parallèle (EMR, Hadoop, Spark) en passant par le Data Streaming (Pub/Sub, Kafka, RabbitMQ).

Préparation

Bootcamp de préparation

Lorsque tu es officiellement inscrit à un Challenge (une formation appliquée à un projet), nous te donnons accès à 30h de cours pour que tu puisses apprendre les bases des langages Python et Scala, mais également quelques rappels sur les requêtes SQL ainsi que le vocabulaire réseau et quelques commandes Bash qui seront très utiles par la suite.

Cette phase de préparation est à faire à distance, 100% en ligne, avant de commencer sur notre campus, mais tu pourras poser toutes tes questions à notre équipe de professeurs sur Slack.

Langage Scala - Blent.ai
Langage Python - Blent.ai
Jupyter - Blent.ai
PostgreSQL
Bash
Git
Boxplot

Stockage

Stockage de données

Lors de cette première phase, nous aborderons le stockage des données, et notamment les différentes solutions qui existent. Nous étudierons ces solutions, tant sur le plan économique que technique, sur comment nous allons stocker des centaines de Go de données.

En plus des bases structurées classiques de la famille SQL ou du stockage persistent, nous découvrirons les bases de données orientées documents (MongoDB), les bases de données orientées colonnes distribuées (avec HBase) ainsi que les bases de données clé/valeur en mémoire dont Redis est le plus populaire. Enfin, une petite ouverture sur les bases NewSQL sera proposée pour être prêt face aux futures systèmes de gestion de bases de données.

MongoDB
Apache Cassandra
Apache HBase
Memcached
Redis
VoltDB

Processus ETL

Calcul parallèle

Une fois le stockage correctement établi, une des premières choses sur lequel le Data Engineer doit réfléchir est la bonne construction d'un processus ETL (pour Extract Transform Load) afin d'automatiser le processing de la donnée jusqu'à un Data Warehouse.

Du fait de la grande quantité de donnée à disposition, les outils de calcul parallèle, dont Hadoop et Spark sont les plus populaires, nous permettront d'effectuer un nombre impressionnant de calculs en un temps très court grâce aux clusters à disposition dans le Cloud. En complément des processus ETL, les applications dites serverless permettent aujourd'hui de lancer des calculs spécifiques sans se soucier de l'infrastructure cible.

Hadoop
Spark
AWS EMR
Serverless

Data Streaming

Flots de données en temps réel

Aujourd'hui, beaucoup d'applications alimentent les bases avec des données en temps réel (ou à flot continu). Comment peut-on efficacement appliquer un processus ETL efficace ?

Pendant cette phase intermédiaire, nous mettrons en place plusieurs solutions pour le Data Streaming, avec notamment des architectures Publish/Subscribe avec RabbitMQ. Nous verrons également Apache Kafka, qui corrige certains défauts des archictures classiques tout en apportant de nouvelles fonctionnalités.

Publish/Subscribe
RabbitMQ
Apache Kafka
Apache Flink
Amazon Kinesis

Cloud Computing

Déployer et monitorer les applications

Cette dernière étape est la plus importante : c'est elle qui définit comment les applications vont être intégrés dans une infrastructure Cloud.

Véritable institution dans le Cloud Computing, nous verrons la puissance de la conteneurisation d'applications avec Docker, et comment les solutions sur le Cloud permettent de répartir les charges de travail. Pour terminer, il est très important de s'assurer du bon fonctionnement des applications et des processus ETL à tout moment : les outils de monitoring et d'indexation de données nous seront d'une grande aide.

Docker
AWS
CI/CD
Elasticsearch
Logstash
Kibana

Pitch final

Présenter ses résultats

Une session Pitch a lieu à la fin du Challenge. Tu présenteras avec tes co-équipiers les travaux réalisés devant un auditioire composé des entreprises partenaires et de la communauté Blent.

Cette session sera succédée d'une grande soirée Recrutement Networking & Apéro.

Nos Alumnis

Qu'en pensent nos Alumnis ?

Formation Data Engineer

Qui peut participer à la formation Data Engineer ?

Dans un monde où les entreprises sont confrontées à une explosion des données, les compétences en Data Engineering sont devenues indispensable, quel que soit le secteur d'activité. Grâce à notre format basé sur des projets, chaque participant se positionne comme il veut dans l’équipe et acquiert les compétences qu’il souhaite.

Salarié

Vous voulez booster votre carrière en développant des compétences Big Data très recherchées.

Étudiant / Jeune diplômé

Vous souhaitez apprendre les outils utilisés par les Data Engineer dans la pratique et vous familiariser avec le monde de l'entreprise.

Manager

Vous souhaitez avoir un management pertinent et comprendre le quotidien des Data Engineers.

Entrepreneur

Startuper ou porteur de projet, vous êtes confronté à des problématique Big Data dans vos projets.

Accompagnement carrière

Construire une carrière dans la Data

Challenges Data Engineer

Nos prochains Challenges Data Engineer

Challenge

Construire une architecture Big Data d'application VTC

Entreprise partenaire

Du 14 avril au 16 juin

Programme

  • Hadoop / Spark
  • Apache Kafka
  • MongoDB
  • Docker

2 places disponibles

IMPORTANT - Covid-19

Toutes nos formations sont maintenues et les cours en présentiel seront assurés en ligne

Formation Paris

Frais de formation

1200€ TTC

  • Payable en une ou plusieurs fois

  • Financements possibles selon votre statut

  • Prenez RDV avec nous pour en discuter

  • Accès à vie à notre bootcamp en e-learning

  • 12 ateliers du soir avec la présence de plusieurs mentors experts

  • Un suivi carrière de votre inscription jusqu’à votre job

Vous êtes prêts à démarrer ?