Articles Machine Learning

Retrouvez tous nos articles Machine Learning qui vous permettront de découvrir des sujets pointus et avant-gardistes dans ce domaine qui évolue si rapidement.

Blog

20 sept. 2022

Machine Learning

Hugging Face est une startup française qui s'est fait connaître grâce à l'infrastructure NLP qu'ils ont développée. Aujourd'hui, elle est sur le point de révolutionner le domaine du Machine Learning et traitement automatique du langage naturel. Dans cet article, nous allons présenter Hugging Face et détailler les taches de base que cette librairie permet de réaliser. Nous allons également énumérer ses avantages et ses alternatifs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

12 juil. 2022

Machine Learning

spaCy est une bibliothèque open-source pour le traitement avancé du langage naturel. Elle est conçue spécifiquement pour une utilisation en production et permet de construire des applications qui traitent et comprennent de grands volumes de texte.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

4 juil. 2022

Machine Learning

Un auto-encodeur est une structure de réseaux neuronaux profonds qui s'entraîne pour réduire la quantité de données nécessaires pour représenter une donnée d'entrée. Ils sont couramment utilisés en apprentissage automatique pour effectuer des tâches de compression de données, d'apprentissage de représentations et de détection de motifs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

28 juin 2022

Machine Learning

Les réseaux neuronaux récurrents ou les RNNs en abrégé sont une variante des réseaux neuronaux artificiels qui peuvent traiter des données séquentielles et peuvent être entrainés pour détenir les connaissances sur le passé. Les RNNs sont couramment utilisés dans les domaines de l'apprentissage automatique, de traitement de langage naturel et de reconnaissance de formes.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

21 juin 2022

Machine Learning

Les réseaux neuronaux sont un sous-ensemble de l’apprentissage automatique, et ils sont au cœur des algorithmes d’apprentissage profond. Inventés par Yann LeCun durant les années 90, les CNNs sont inspirés des réseaux neuronaux biologiques, et ils sont devenus extrêmement populaires en raison de leurs performances dans les domaines de la vision et plusieurs autres domaines.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

14 juin 2022

Machine Learning

Les GANs sont des modèles génératifs : ils créent de nouvelles instances de données qui ressemblent à vos données de formation. Par exemple, ils peuvent créer des images qui ressemblent à des photographies de visages humains, même si les visages n’appartiennent à aucune personne réelle.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

8 juin 2022

Machine Learning

Au cours des dernières années, les modèles Deep Learning ont gagné en renommée pour leur capacité à traiter l’information visuelle et ils sont devenus un élément clé de nombreuses applications de vision par ordinateur. Parmi les principaux problèmes que ces modèles peuvent résoudre est la détection et la localisation des objets dans les images.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

31 mai 2022

Machine Learning

Depuis quelques années, les librairies et boîtes à outils informatiques destinées à l’intelligence artificielle se multiplient. En effet, de nombreuses entreprises ont décidé de se doter d’un service d’intelligence artificielle pour traiter leurs données et élaborer des modèles prédictifs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

24 mai 2022

Machine Learning

Dans cet article, nous allons expliquer ce que sont les algorithmes d’apprentissage automatique, leurs types et nous allons présenter les modèles les plus populaires.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

17 mai 2022

Machine Learning

Matplotlib est l’une des bibliothèques les plus puissantes et le plus utilisées en Python pour la visualisation de données. Elle permet nous permet de créer presque n’importe quelle visualisation que nous pourrions imaginer et en plus il y a un riche écosystème d’outils python construits autour d'elle et beaucoup d’outils de visualisation plus avancés utilisent Matplotlib comme bibliothèque de base.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

13 mai 2022

Machine Learning

Dans l'univers du développement logiciel, les tests sont omniprésents. Ils permettent de vérifier que le logiciel ou l'application développée adopte correctement le comportement attendu, ne produit pas de bugs ou s'intègre efficacement dans un environnement existant.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

10 mai 2022

Machine Learning

L'une des bibliothèques utiliser pour le prétraitement des données est Pandas. Si vous avez travaillé avec des données tabulaires avant, vous l'avez certainement utilisé. C'est une bibliothèque du langage de programmation Python utilisée pour la manipulation et l’analyse des données.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

26 avr. 2022

Machine Learning

Seaborn est une librairie de visualisation de données Python basée sur Matplotlib. Elle fournit une interface plus conviviale pour la création de certaines visualisations de données, notamment les diagrammes de dispersion et les histogrammes.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

19 avr. 2022

Machine Learning

L’un des obstacles les plus délicats dans l’apprentissage automatique est le surapprentissage ou le overfitting en anglais. Un modèle de Machine Learning doit être capable de généraliser, c'est-à-dire qu'il doit pouvoir prendre de nouvelles observations et prédire avec une certaine précision la variable cible associée.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

12 avr. 2022

Machine Learning

L’apprentissage supervisé est une sous-catégorie de l’apprentissage automatique et de l’intelligence artificielle. Il est défini par son utilisation d’ensembles de données étiquetés pour former des algorithmes qui permettent de classer les données ou de prédire les résultats avec précision. L'objectif est de donner un sens aux données dans le contexte d’une question spécifique.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

5 avr. 2022

Machine Learning

Les transformers, ou les modèles séquence à séquence, sont des modèles de Deep Learning qui appartiennent à une classe spéciale d’architectures de réseaux de neurones récurrents. Ils sont devenus des modèles de choix pour les Data Scientists lorsqu'ils travaillent sur du texte, remplaçant les anciens RNNs tels que le LSTM ou le GRU.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

28 mars 2022

Machine Learning

Un modèle entraîné sur un jeu de données est capable de prédire les étiquettes des éléments de ce dernier. Mais une fois testé sur d'autres éléments, ce n'est pas vraiment certain qu'il ait la bonne réponse. C’est pourquoi vérifier la capacité de l’algorithme à généraliser est une tâche importante qui nécessite beaucoup d’attention lors de la construction du modèle. Pour ce faire, on utilise la validation croisée.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

25 mars 2022

Machine Learning

Nous avons récemment eu le plaisir d'organiser un Webinar avec Labelia lab (ex-Substra Foundation). Nous avons eu la chance de recevoir Eric Boniface, cofondateur et directeur de Labelia, qui est venu nous présenter Labelia ainsi que les raisons qui ont amené à sa création.

Charles Bourrat

Charles Bourrat

Operations Manager

Lire l'article

Blog

22 mars 2022

Machine Learning

L’ingénierie des fonctionnalités ou en anglais, Feature Engineering est le processus de sélectionner et transformer les variables les plus pertinentes à partir de données brutes, dans l'objectif d’obtenir les meilleurs performances pour les modèles de Machine Learning. Cette notion est une partie indispensable du prétraitement des données et elle est reconnue pour être la clé du succès dans le domaine du Machine Learning.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

15 mars 2022

Machine Learning

La réduction de dimension est une technique très populaire, généralement utilisée par les Data Scientists pour améliorer la performance des algorithmes de Machine Learning, surtout lorsqu'on travaille avec des jeux de données à plusieurs variables. Elle permet d'éliminer les variables corrélées qui ne contribuent à aucune prise de décision. Il existe plusieurs approches pour ce faire, dont t-SNE, un algorithme d’apprentissage non supervisé connu notamment pour sa capacité à faciliter la visualisation des données non linéaires ayant beaucoup de descripteurs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

8 mars 2022

Machine Learning

L'une de ces architectures dont en parle très souvent en Computer Vision est le U-Net. Ayant fait ces preuves en termes de précision et rapidité, le U-Net est maintenant le plus utilisé pour la segmentation d'images, surtout dans le domaine d'imagerie biomédicale.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

25 févr. 2022

Machine Learning

Les modèles basés sur le renforcement de gradient et leurs variantes offertes par plusieurs communautés ont gagné beaucoup de traction ces dernières années. LightGBM, développé par Microsoft et publié en 2016, représente un exemple très populaire. Il est rapide, distribué et de haute performance. Basé sur des algorithmes d'arbre de décision, il est utilisé pour le classement, la classification et de nombreuses autres tâches de Machine Learning. Il représente aussi une excellente alternative à XGBoost.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

21 févr. 2022

Machine Learning

Si vous avez déjà travaillé avec des jeux de données contenant beaucoup de variables, vous savez que cela peut présenter des problèmes. Pour éviter tout cela, les Data Scientists ont recours généralement à l'ACP ou l’Analyse en Composantes Principales.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

11 févr. 2022

Machine Learning

SVM (Support Vector Machine ou Machine à vecteurs de support) est un algorithme d’apprentissage automatique supervisé qui peut être utilisé pour les problèmes de classification ou de régression. Toutefois, il est surtout utilisé dans les problèmes de classification.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

4 févr. 2022

Machine Learning

XGBoost est un modèle de Machine Learning très populaire chez les Data Scientists. Ayant fait ses preuves en termes de performance et de vitesse, il a récemment dominé les hackathons et compétitions de Machine Learning, ainsi que les concours de Kaggle pour les données structurées ou tabulaires.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

31 janv. 2022

Machine Learning

Pour qu'une machine soit autonome, un principe clé est de pouvoir communiquer via l'un des langages naturels des humains. Le NLP (Natural Language Processing) ou TALN en français (Traitement Automatique du Langage Naturel) est un domaine ancien de l'intelligence artificielle qui existe depuis plus de 50 ans

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

27 janv. 2022

Machine Learning

Plus anciens qu'on ne le pense, les réseaux de neurones artificiels ont façonné les dernières années en matière de tâches de reconnaissance ou même de traitement de la donnée. En effet, leurs mécaniques s'inspirant directement du fonctionnement du neurone biologique en font un modèle puissant, mais néanmoins difficile à interpréter et à analyser.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

25 janv. 2022

Machine Learning

L'algorithme des k-means (ou bien k-moyennes) est l’un des algorithmes d’apprentissage non supervisé les plus simples et les plus populaires. Il permet d’analyser un jeu de données afin de regrouper les données « similaires » en groupes (ou clusters). Ce principe est applicable dans divers domaines de l'industrie comme le domaine du marketing pour la segmentation des clients, analyse des réseaux sociaux, etc.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

20 janv. 2022

Machine Learning

L'arbre de décision est l'un des premiers algorithmes de Machine Learning que les Data Scientists apprennent au cours de leur formation. Il est utilisé pour représenter visuellement et explicitement les décisions et la prise de décision pour des problèmes de classification ainsi que pour des problèmes de régression.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

12 janv. 2022

Machine Learning

Le Random Forest est un algorithme de Machine Learning très populaire auprès des Data Scientists en raison de sa précision, de sa simplicité et de sa flexibilité. Cet algorithme peut être utilisé pour résoudre les problèmes de régression et de classification. Il est fréquemment adopté dans de nombreux domaines tels que les banques et le commerce en ligne pour prédire des comportements et des résultats futurs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

6 janv. 2022

Machine Learning

La Computer Vision est un domaine du Machine Learning qui s’intéresse à rendre possible aux ordinateurs de voir, tout en recopiant des parties de la complexité des yeux humains. La machine aujourd’hui est capable de voir, de comprendre, de mesurer et de créer des objets visuels compréhensibles et cohérents, tout cela grâce aux récentes avancées du Deep Learning.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

7 sept. 2021

Machine Learning

Dans tous les langages de programmation, on doit afficher des informations sous forme de texte. Cela ne pose pas de difficultés lorsque l'on souhaite afficher une variable de texte. Mais qu'en est-il lorsque l'on souhaite afficher des nombres avec un certain nombre de chiffres après la virgule ? Comment afficher 5 variables à la suite sans écrire des dizaines de + ?

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

31 mai 2021

Machine Learning

Dans l'univers du développement logiciel, les tests sont omni-présents. Ils permettent de vérifier que le logiciel ou l'application développée adopte correctement le comportement attendu, ne produit pas de bugs ou s'intègre efficacement dans un environnement existant. Mais de quoi s'agit-il exactement ? Comment peut-on écrire du code pour tester du code ? Et surtout, comment peut-on le faire avec du Python.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

15 mars 2021

Machine Learning

Ce sont des mots que l'on entend de plus en plus : transparence et audit des algorithmes, modèles boîtes noires ou encore interprétabilité. Ce vocabulaire n'est pas tout récent, car déjà au tout début des années 2000, des chercheurs avaient proposé des méthodes permettant d'expliquer le comportement de certains algorithmes dont le fonctionnement était opaque, difficile à traduire en terme de décisions. Par ailleurs, plusieurs secteurs d'activité comme le secteur bancaire, de l'assurance ou de la santé n'ont pas attendu pour intégrer dès le début des méthodes de transparence.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

18 déc. 2020

Machine Learning

Dans les sujets de classifications binaire, où la réponse en sortie d'un algorithme de Machine Learning est à deux valeurs possibles (0 ou 1), on parle souvent de précision et de rappel. Ces deux mesures, souvent mal comprises, ne mesurent pas la même chose et ne s'interprétent pas de la même manière. Pourtant, elles forment un score connu, le F1 Score, mais qui manque très souvent de contexte. Nous allons essayer de démystifier ces métriques ici.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

11 déc. 2020

Machine Learning

C'est quelque chose de bien connu : sous Python, pas besoin de spécifier les types des variables. Cette flexibilité permet de convertir très facilement des variables, ce qui est souvent le cas lorsque l'on manipule des données. En revanche, lorsque l'on défini des fonctions, on aimerait insister sur le fait que certains paramètres soient d'un certain type, pour éviter des incohérences, voir des erreurs dans la suite du programme.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

4 déc. 2020

Machine Learning

Dans certaines situations, il est indispensable d'afficher sur un graphique l'évolution d'une quantité en fonction de deux variables : c'est le cas par exemple lorsque l'on souhaite savoir comment le prix d'un déménagement va évoluer selon la distance entre le départ et l'arrivé, ainsi que le volume nécessaire. On rencontre également ce genre de besoin pour afficher des températures en fonction de la localisation.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

27 nov. 2020

Machine Learning

Dans la plupart des projets de Machine Learning, le jeu de données utilisé pour calibrer le modèle doit subir toute une série de transformations. Encodage de variables catégorielles, de la normalisation, du feature scaling et autres techniques spécifiques. Cependant, cette série de transformations doit être appliquée plus d'une fois.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

24 nov. 2020

Machine Learning

Tu cherches une formation en Data Science et tu es perdu face à toutes les offres qui pullulent sur internet ? Rassure-toi, c’est tout à fait normal. Une formation ça ne se choisit pas au hasard. D’autant plus si c’est dans un domaine comme la Data Science, si vaste et foisonnant qu’il en devient presque illisible.

Taieb Badis

Taieb Badis

CEO & Co-Founder

Lire l'article

Blog

20 nov. 2020

Machine Learning

Très souvent, nous avons besoin d'utiliser des boucles for pour itérer sur des listes à une ou plusieurs dimensions sous Python. Lorsque l'on débute, nous sommes tenté d'utiliser les mêmes façon d'itérer qu'en langage C, où l'on va définir une variable i qui indique la position du i-ème élément que l'on itère.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

13 nov. 2020

Machine Learning

Dans certains cas d'applications, la fonction groupby de pandas permet de regrouper les lignes qui partagent des mêmes valeurs sur une ou plusieurs colonnes, permettant ainsi de faire des aggrégations. Mais comment faut-il faire lorsque l'on souhaite aggréger non pas par valeurs, mais par paquets de lignes ?

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

6 nov. 2020

Machine Learning

Qui n'a jamais eu d'erreur en exécutant un code Python ? Une division par 0, une variable mal orthographiée ou une liste pas assez longue, on a tous déjà du comprendre pourquoi nous avons une erreur. Mais il convient de bien différencier deux types d'erreurs qui peuvent survenir en Python.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

5 nov. 2020

Machine Learning

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

2 nov. 2020

Machine Learning

Nous avons eu le plaisir d’inviter Samy, Leader Data & IA au sein du cabinet Onepoint, pour un talk passionnant lors duquel nous avons échangé sur la situation des projets Data Science dans les grands groupes.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

29 oct. 2020

Machine Learning

Tu as peut-être déjà remarqué le symbole @ à proximité des fonctions avec Python. Il s'agit de décorateurs de fonctions. Mais à quoi peuvent-ils servir ? En quelques lignes de code, nous allons voir comment créer des décorateurs de fonctions Python qui peuvent nous faciliter la vie.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

26 oct. 2020

Machine Learning

Nous avons eu le plaisir d’inviter Samy, Leader Data & IA au sein du cabinet Onepoint, pour un talk passionnant lors duquel nous avons échangé sur la situation des projets Data Science dans les grands groupes.

Taieb Badis

Taieb Badis

CEO & Co-Founder

Lire l'article

Blog

22 oct. 2020

Machine Learning

Communément, lorsque l'on fait référence à un Data Scientist, on imagine que ses journées sont remplies de création de modèles et de formules mathématiques. La réalité est en revanche plus nuancée, car il existe différents profils de Data Scientist, tout comme il existe différents profils de développeurs ou de consultants.

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article

Blog

21 oct. 2020

Machine Learning

Lors de ce workshop, nous avons présenté les erreurs à éviter quand on veut lancer une startup IA, comment développer des solutions Data efficaces (Cloud, Big Data, Machine Learning, mise en production, …) et les techniques pour recruter les bons profils aux bons postes. Voici ce qui en ressort.

Taieb Badis

Taieb Badis

CEO & Co-Founder

Lire l'article

Blog

14 oct. 2020

Machine Learning

Tu as un projet entrepreneurial qui exige des compétences en Data Science et tu hésites quant à la formation qu’il te faut ? Laisse-nous te raconter l’histoire de Pierre qui a réussi, grâce à la formation Blent, à monter sa boîte en Intelligence Artificielle.

Sofien Dahech

Sofien Dahech

Community Leader

Lire l'article

Blog

12 mars 2020

Machine Learning

On entend souvent parler du métier de Data Scientist. Mais le métier de Data Engineer est moins connu du grand public, et dans certains cas mal compris. Pourtant, ces deux métiers sont complémentaires et l’un ne va pas sans l’autre. Mais quelle est la frontière entre ces deux métiers ? Et d’abord, que font-ils exactement ?

Maxime Jumelle

Maxime Jumelle

CTO & Co-Founder

Lire l'article