Mets-toi dans la peau d'un Data Engineer

La 1ère formation en ligne basée sur un projet d’entreprise

Début des prochaines sessions
15 septembre 2020

Bootcamp Machine Learning / Deep Learning

Qu’est-ce que le Uber Online Bootcamp ?

Le premier bootcamp 100% en ligne où tu peux te former au Data Engineering sur des projets des entreprises les plus data-driven de la Silicon Valley. Accompagné de professeurs experts, tu seras dans la peau d’un Data Engineer de Uber pour résoudre des problématiques Big Data.

Maîtrise les compétences nécessaires pour être opérationnel en entreprise

Forme-toi à ton rythme où que tu sois grâce à notre format en ligne à temps partiel 100% interactif

On t’accompagne dans ta recherche de poste de Data Engineer même après la fin de la formation

Bootcamp Data Engineering

Comment se déroule notre Uber Online Bootcamp ?

Notre Uber Online Bootcamp est une formation Data Engineer de 3 mois à temps partiel, parfaitement adaptée pour les salariés, entrepreneurs et étudiants. Cumulant des classes virtuelles avec nos experts et travaux à effectuer sur notre plateforme de e-learning, tu seras en immersion dans le rôle du Data Engineer et tu auras une vision précise des pratiques des entreprises les plus data-driven.

Bootcamp de préparation

Avant le début de la formation, nous t’offrons 30 heures de e-learning sur notre plateforme pour acquérir les bases pour se lancer dans le Data Engineering.

Online Classrooms

Une fois le bootcamp de préparation terminé, on commence la pratique sur un projet d’une des entreprises les plus data-driven. Chaque semaine a lieu des ateliers du soir en ligne 100% interactif avec la présence de nos professeurs.

Mini-Challenges

Entre 2 ateliers, des travaux sont proposés sous forme de mini use cases sur notre plateforme de e-learning afin de pratiquer et continuer à apprendre à son rythme.

Mets-toi dans la peau d'un Data Engineer

Quel est le programme du Uber Online Bootcamp ?

Pendant cette formation, tu découvriras les outils les plus populaires et utilisés quotidiennement par les Data Engineers. En très forte demande, le Data Engineer sait manipuler avec aisance les bases de données non structurées, mais peut également lancer des calculs intensifs sur des clusters distants.

Après plusieurs semaines à nos côtés, tu auras une vision claire de toutes les phases qui interviennent dans un projet Data Engineering, du stockage des données (S3, NoSQL) au calcul parallèle (EMR, Hadoop, Spark) en passant par le Data Streaming (Pub/Sub, Kafka, RabbitMQ).

Préparation

Bootcamp de préparation

Lorsque tu es officiellement inscrit à un Challenge (une formation appliquée à un projet), nous te donnons accès à 30h de cours pour que tu puisses apprendre les bases des langages Python et Scala, mais également quelques rappels sur les requêtes SQL ainsi que le vocabulaire réseau et quelques commandes Bash qui seront très utiles par la suite.

Cette phase de préparation est à faire à distance, 100% en ligne, avant de commencer sur notre campus, mais tu pourras poser toutes tes questions à notre équipe de professeurs sur Slack.

Langage Scala - Blent.ai
Langage Python - Blent.ai
Jupyter - Blent.ai
PostgreSQL
Bash
Git
Boxplot

Stockage

Stockage de données

Lors de cette première phase, nous aborderons le stockage des données, et notamment les différentes solutions qui existent. Nous étudierons ces solutions, tant sur le plan économique que technique, sur comment nous allons stocker des centaines de Go de données.

En plus des bases structurées classiques de la famille SQL ou du stockage persistent, nous découvrirons les bases de données orientées documents (MongoDB), les bases de données orientées colonnes distribuées (avec HBase) ainsi que les bases de données clé/valeur en mémoire dont Redis est le plus populaire. Enfin, une petite ouverture sur les bases NewSQL sera proposée pour être prêt face aux futures systèmes de gestion de bases de données.

MongoDB
Apache Cassandra
Apache HBase
Memcached
Redis
VoltDB

Processus ETL

Calcul parallèle

Une fois le stockage correctement établi, une des premières choses sur lequel le Data Engineer doit réfléchir est la bonne construction d'un processus ETL (pour Extract Transform Load) afin d'automatiser le processing de la donnée jusqu'à un Data Warehouse.

Du fait de la grande quantité de donnée à disposition, les outils de calcul parallèle, dont Hadoop et Spark sont les plus populaires, nous permettront d'effectuer un nombre impressionnant de calculs en un temps très court grâce aux clusters à disposition dans le Cloud. En complément des processus ETL, les applications dites serverless permettent aujourd'hui de lancer des calculs spécifiques sans se soucier de l'infrastructure cible.

Hadoop
Spark
AWS EMR
Serverless

Data Streaming

Flots de données en temps réel

Aujourd'hui, beaucoup d'applications alimentent les bases avec des données en temps réel (ou à flot continu). Comment peut-on efficacement appliquer un processus ETL efficace ?

Pendant cette phase intermédiaire, nous mettrons en place plusieurs solutions pour le Data Streaming, avec notamment des architectures Publish/Subscribe avec RabbitMQ. Nous verrons également Apache Kafka, qui corrige certains défauts des archictures classiques tout en apportant de nouvelles fonctionnalités.

Publish/Subscribe
RabbitMQ
Apache Kafka
Apache Flink
Amazon Kinesis

Cloud Computing

Déployer et monitorer les applications

Cette dernière étape est la plus importante : c'est elle qui définit comment les applications vont être intégrés dans une infrastructure Cloud.

Véritable institution dans le Cloud Computing, nous verrons la puissance de la conteneurisation d'applications avec Docker, et comment les solutions sur le Cloud permettent de répartir les charges de travail. Pour terminer, il est très important de s'assurer du bon fonctionnement des applications et des processus ETL à tout moment : les outils de monitoring et d'indexation de données nous seront d'une grande aide.

Docker
AWS
CI/CD
Elasticsearch
Logstash
Kibana

Pitch final

Présenter ses résultats

Une session Pitch a lieu à la fin du Challenge. Tu présenteras avec tes co-équipiers les travaux réalisés devant un auditioire composé des entreprises partenaires et de la communauté Blent.

Cette session sera succédée d'une grande soirée Recrutement Networking & Apéro.

Certificat Blent

À la fin de la formation, tu passeras un test global qui permet d’obtenir le Certificat Data Engineer Blent à faire valoir auprès de nos recruteurs et sur ton profil Linkedin.

Nos prochaines sessions

CLASSIC

15 septembre - 1er décembre

12 semaines

Tous les MARDI
19h00 - 21h30

Postuler

Accompagnement carrière

Construire une carrière dans la Data

Nos Alumnis

Qu'en pensent nos Alumnis ?

Formation Data Engineering

Qui peut participer au Uber Online Bootcamp ?

Dans un monde où les entreprises sont de plus en plus data-driven, les compétences en Data Engineering sont devenues un atout majeur. Grâce à notre format basé sur des projets, chaque participant se positionne comme il veut dans l’équipe et acquiert les compétences qu’il souhaite.

Développeur / Data Analyst

Tu veux booster ta carrière en prenant le virage technologique du Data Engineering et du Big Data.

Étudiant / Jeune diplômé

Tu souhaites apprendre le Data Engineering par la pratique et te familiariser avec le monde de l'entreprise.

Project Manager / Product Owner

Tu souhaites avoir un management pertinent et comprendre le quotidien des Data Engineers.

Entrepreneur

Startuper ou porteur de projet, tu as la volonté d'utiliser le Big Data pour accélérer ton business.

Formation Data Engineering

Les chiffres du Uber Online Bootcamp

2

ans

140

alumnis

4

pays

98%

de satisfaction

Formation remote

Frais de formation

1499€

payable en plusieurs fois

  • 12 ateliers live 100% interactifs

  • 90 heures de e-learning accessibles à vie

  • Préparation aux entretiens techniques

  • 2 séances de coaching individuel (carrière et/ou business)

  • Un certificat Data Engineer by Blent

  • Accès aux entreprises les plus data-driven

Tu es prêt à démarrer ?