Logo Blent.ai

Le Blog Tech & Data

Parce que chez Blent, on aime partager nos connaissances, les articles vous permettront de découvrir des sujets pointus et avant-gardistes dans ce domaine qui évolue si rapidement.

Nos meilleurs articles

Blog

4 févr. 2022

Machine Learning

XGBoost est un modèle de Machine Learning très populaire chez les Data Scientists. Ayant fait ses preuves en termes de performance et de vitesse, il a récemment dominé les hackathons et compétitions de Machine Learning, ainsi que les concours de Kaggle pour les données structurées ou tabulaires.
Nada Belaidi

Nada Belaidi

Data Scientist

Lire l'article

Blog

2 févr. 2022

Cloud / DevOps

Git est un système de versions distribué, c'est-à-dire un outil qui permet le contrôle des versions d'un projet, qu'il y ait un ou plusieurs contributeurs. Ce besoin de gérer les versions est d'autant plus renforcé que les environnements sont de plus en plus décentralisés sous forme de microservices, rendant les itérations de développement de plus en plus courtes.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

10 janv. 2022

Data Engineering

Kafka est une plateforme d'agents de messages (brokers) en temps réel. Cette plateforme permet à la fois de diffuser des données à grande échelle (event streaming) et d'effectuer des traitements sur ces données en temps réel (stream processing). Depuis plusieurs années, Kafka s'impose comme la référence pour diffuser et traiter des centaines de Go de données à grande échelle, tout en assurant une haute disponibilité de services.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Tous les articles

Cloud / DevOps

Data Engineering

Machine Learning

MLOps

Blog

1 août 2023

Cloud / DevOps

Bash (qui signifie Bourne Again SHell) est un interpréteur de commandes (shell) pour les systèmes d'exploitation Linux. Il s'agit du principal langage de script et d'interface en ligne de commande utilisé dans les systèmes Linux qui permet d'interagir avec le système d'exploitation en utilisant des commandes textuelles.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

8 juin 2023

Cloud / DevOps

Kubernetes (d'abréviation K8s) est un outil extrêmement populaire dans le Cloud et qui est devenu, en quelques années, la référence en terme de déploiement d'applications dans le Cloud. Mais pourquoi (et surtout comment) Kubernetes est devenu la solution incontournable ?
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

23 mai 2023

Data Engineering

Apache Phoenix est une extension open-source de Apache HBase qui fournit une couche de requêtes SQL pour les données stockées dans HBase. Phoenix permet ainsi d'interagir sur les tables HBase à l'aide de requêtes SQL standard, sans avoir à écrire de code spécifique à HBase
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

15 mai 2023

Data Engineering

Apache Avro est un système de sérialisation de données et un format de données compact, rapide et polyvalent. Il a été développé par Apache Software Foundation et est conçu pour faciliter l'échange de données entre les différentes applications. Contrairement à d'autres formats comme CSV ou JSON, une des grandes particularités d'Apache Avro est qu'il utilise un schéma pour définir la structure des données, ce qui permet de sérialiser et de désérialiser les données de manière efficace, tout en garantissant la compatibilité entre les différentes versions des schémas.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

12 mai 2023

Data Engineering

Apache Flink est un système de traitement des données en temps réel et de traitement par lots à grande échelle. Il s'agit d'un projet open source développé par la fondation Apache, conçu pour offrir une haute disponibilité, une faible latence et une grande capacité de traitement des flux de données. Flink fournit un modèle algorithmique unifié qui permet de traiter les données en temps réel et par lots de manière cohérente. Il prend en charge des opérations avancées telles que la transformation, le filtrage, l'agrégation et la jointure de données en continu.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

9 mai 2023

Cloud / DevOps

Ansible est un outil open source de **gestion de configuration, d'automatisation et de déploiement d'application**. Il est conçu pour simplifier et automatiser la gestion de configurations complexes sur des infrastructures distribuées. Devenu rapidement un incontournable dans le monde DevOps ces dernières années, il a été adopté par de nombreuses entreprises, à la fois en raison de sa simplicité d'utilisation, de configuration, mais aussi car sa personnalisation lui permet d'être autonome quel que soit l'environnement utilisé (Cloud public, On-Premise, etc).
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

3 mai 2023

Data Engineering

Snowflake est une plateforme de Data Warehousing qui offre une solution Cloud aux problèmes de gestion, de stockage et d'analyse des données volumineuses et complexes.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

28 avr. 2023

Data Engineering

Un Data Warehouse (ou entrepôt de données en français), est un système informatique qui permet de stocker et d'analyser de grandes quantités de données provenant de différentes sources. Les données sont généralement structurées, c'est-à-dire qu'elles sont organisées selon un schéma prédéfini pour faciliter leur analyse.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

25 avr. 2023

Data Engineering

Apache Parquet est un format de fichier open-source pour le stockage de données volumineuses dans un environnement Big Data. Ce format est très apprécié des Data Engineers, car il a été conçu pour répondre aux besoins de stockage et de traitement de données massives avec une efficacité maximale en termes de performance, de compression et de flexibilité du schéma de données.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

17 avr. 2023

Data Engineering

Apache Cassandra est un système de gestion de base de données distribuées hautement performant, scalable et tolérant aux pannes. Développé initialement par Facebook et open-source depuis 2008, Cassandra est devenu populaire pour son modèle de données flexible, son architecture distribuée et sa capacité à gérer des volumes massifs de données avec une latence faible et constante. Avec ses capacités de distribution et de réplication, Cassandra est utilisé dans diverses applications, notamment pour le stockage de données de série temporelle, la gestion de contenu web, la messagerie et les analyses en temps réel.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

13 avr. 2023

Data Engineering

HDFS (Hadoop Distributed File System) est un système de fichiers distribué open source conçu pour stocker et gérer de gros volumes de données sur des clusters de serveurs. Il fait partie de l'écosystème Hadoop et est devenu en quelques années la référence pour le stockage de données à très grande échelle, notamment pour ses performances et sa tolérance à la panne, mais également pour sa facilité d'utilisation et son intégration dans toute la suite logicielle de l'écosystèeme Hadoop.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

11 avr. 2023

Data Engineering

Apache HBase est une base de données NoSQL distribuée et hautement évolutive, conçue pour stocker de grandes quantités de données. Il est construit sur Apache Hadoop et fonctionne sur le système de fichiers distribué Hadoop (HDFS). Elle est principalement utilisé pour stocker des données semi-structurées et non structurées telles que des données de journal, des données de capteurs, des données de médias sociaux et des données de télémétrie.
Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Logo Blent

60 rue François 1er

75008 Paris

Blent est une plateforme 100% en ligne pour se former aux métiers Tech & Data.

Organisme de formation n°11755985075.

Gestion des cookies

© 2023 Blent.ai | Tous droits réservés