← Retourner à la liste des articles
Image blog
Auteur

Par Taieb Badis

CEO & Co-Founder

Publié le 26 oct. 2020

Catégorie Machine Learning

Débrief Workshop : Data Science dans les Grands Groupes

Nous avons eu le plaisir d’inviter Samy, Leader Data & IA au sein du cabinet Onepoint, pour un talk passionnant lors duquel nous avons échangé sur la situation des projets Data Science dans les grands groupes.

Samy accompagne depuis plus de 13 ans les organisations dans leur développement et leur transformation Data, depuis la définition d’une vision stratégique jusqu’à son exécution technologique.

En particulier, il assiste des grands comptes et des startups dans l'élaboration et la mise en oeuvre de plusieurs projets.

  • La mise en place stratégies Data et modèles opérationnels cibles (pour des Data Lab et des Data Factory).
  • La conception d'architectures Data modernes (plateformes Big Data on premise ou Cloud).
  • L'élaboration de solutions IA & Data opérationnelles couvrant un large éventail de technologies à l’état de l’art.
  • L'industrialisation des projets de Machine Learning / IA (processus MLOps).

01 - Les cas d'usage

Concrètement, quels sont les cas d'usage des grands groupes ? Samy en a vu passer des dizaines, ce lui permet de clairement les identifier et voir à quel point ils ont évolués au cours du temps.

  • Marketing : “proposer le bon produit, au bon moment, au bon client sur le bon canal”.
  • Finance & Risque : anticipation du risque, fraude, estimation des revenus.
  • Ressources Humaines : améliorer le recrutement, la mobilité interne, prévenir les risques de démission (churn).
  • Santé : imagerie médicale.
  • Logistique : optimisation des stocks.
  • Production industrielle : maintenance prédictive.

02 - ML classique vs ML Ops

Dans un cadre classique de Machine Learning, le cycle de vie est linéaire : extraction et transformation des données, modélisation, optimisation puis déploiement. Mais les grands groupes doivent de plus en plus mettre à jour leurs modèles de manière automatisée.

Le MLOps est la discipline qui consiste à automatiser l'entraînement et le déploiement* de modèles de Machine Learning. Samy nous explique pourquoi c'est un véritable sujet et qu'il y a autant de ressources mises en places.

03 - Les compétences recherchées par les grands groupes

En termes de compétences recherchées par les grands groupes aujourd’hui, on retrouve en pôle position le Data Engineer. Afin de mieux comprendre ce métier, nous vous invitons à lire cet article et à visionner notre webinar sur ce métier.

Ensuite, les compétences recherchées auprès des Data Scientist ont évolué. Alors qu’auparavant, son rôle était très centré sur le Machine Learning et l’analyse des données, on demande aujourd'hui à un Data Scientist d’avoir des compétences en IT, notamment en Cloud Computing. Le “graal” de la Data aujourd’hui est ce noveau métier, le Machine Learning Engineer, dont vous trouverez la description dans notre article sur les différents profils de Data Scientists.

Voir le Webinar

Vous souhaitez vous former au MLOps ?

Articles similaires

Blog

20 sept. 2022

Machine Learning

Hugging Face est une startup française qui s'est fait connaître grâce à l'infrastructure NLP qu'ils ont développée. Aujourd'hui, elle est sur le point de révolutionner le domaine du Machine Learning et traitement automatique du langage naturel. Dans cet article, nous allons présenter Hugging Face et détailler les taches de base que cette librairie permet de réaliser. Nous allons également énumérer ses avantages et ses alternatifs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

12 juil. 2022

Machine Learning

spaCy est une bibliothèque open-source pour le traitement avancé du langage naturel. Elle est conçue spécifiquement pour une utilisation en production et permet de construire des applications qui traitent et comprennent de grands volumes de texte.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article

Blog

4 juil. 2022

Machine Learning

Un auto-encodeur est une structure de réseaux neuronaux profonds qui s'entraîne pour réduire la quantité de données nécessaires pour représenter une donnée d'entrée. Ils sont couramment utilisés en apprentissage automatique pour effectuer des tâches de compression de données, d'apprentissage de représentations et de détection de motifs.

Nada Belaidi

Équipe Blent

Data Scientist

Lire l'article