Andy Barakat est ex Data Engineer chez Stuart, et Data Engineer chez Phenix. Phenix est une entreprise qui lutte contre le gaspillage alimentaire en revalorisant les déchets des supermarchés. L’entreprise a deux moyens d’action : le don aux associations et une application B2C pour le consommateur. Elle travaille aussi sur des outils d’optimisation, de revalorisation des invendus et utilise des algorithmes de Machine Learning ou d’Intelligence Artificielle pour aider à cette prise de décision.
Quelle définition pour l’Intelligence Artificielle ? Quelles applications concrètes chez Phenix ?
L’intelligence artificielle est un bien grand mot, le grand mythe de notre temps selon un rapport de la CNIL. Ce sont simplement des statistiques, des modèles mathématiques qui, en s’appuyant sur des données labellisées, vont permettre de prédire des comportements futurs. Si on prend l’exemple des invendus alimentaires, en s’appuyant sur l’historique des invendus alimentaires et sur certains paramètres comme la météo, le jour de la semaine etc on va réussir à prédire dans le futur quels sont les produits qui ne vont pas se vendre et ainsi réduire le gaspillage alimentaire en agissant en amont de la chaîne.
Phenix dispose donc d’informations, de données sur l’historique de consommation que la marque a couplé à des variables externes comme la météo pour faire de la prévision. On parle alors d’apprentissage et des modèles d’apprentissage.
Peux-tu nous en dire un peu plus sur l’exemple que tu as cité ?
L’exemple en question est un exemple d’apprentissage supervisé. On prend une variable qui nous intéresse – en l’occurrence, le nombre d’invendus – et on va essayer de la prédire.
Il existe d’autres modèles où l’on ne sait pas exactement ce que l’on souhaite prévoir mais on sait que l’échantillon de données a un intérêt. Par exemple, les données des habitudes des consommateurs sur l’application Phenix permettent de les séparer en différents segments à qui on peut adresser des offres différentes. Pour identifier ces différents segments, on utilise des algorithmes comme du clustering qui sont des algorithmes d’apprentissage non supervisé. Pour faire simple, on ne sait pas exactement quel groupe on veut prévoir mais on sait que l’on souhaite prévoir un groupe.
Quels résultats concrets pour l’apprentissage non supervisé ?
Phenix a pu identifier des groupes d’individus assez distincts :
- des consommateurs très intéressés par l’aspect environnemental, social et éthique du modèle
- des consommateurs plus intéressés par l’aspect économique de la solution Phenix.
C’est donc deux segments qui répondent à une approche différente.
La communication est adaptée à ces différents Clusters. L’apprentissage non supervisé est clé d’un point de vue Marketing mais aussi d’un point de vue Produit car il aide au développement de nouvelles features de l’application.
Quels sont les profils impliqués dans ces modèles d’apprentissage ?
Ces modèles impliquent des Data Scientists qui, avec un background mathématiques et statistiques, vont conceptualiser les algorithmes et donc permettre la prise de décision. Ces Data Scientists sont extrêmement proches des équipes terrains opérationnelles car il faut vraiment qu’ils comprennent les données avec lesquelles ils travaillent et s’assurer qu’il n’en sorte pas de biais dans leur différent data set qui derrière amèneront les prises de décisions.
Qu’entend-on par magie et par démystification de l’intelligence artificielle ?
Aujourd’hui l’intelligence artificielle est très tendance. Toutes les entreprises en parlent et certaines recrutent des Data Scientists alors qu’elles ne disposent pas encore de données de qualité et d’infrastructures solides en terme d’architecture. Avant de déployer des grands modèles statistiques il faut s’assurer que la donnée dont on dispose est propre et de qualité. Assez souvent, les modèles les plus simples au début s’avèrent être les meilleurs car ils sont compréhensibles et facilement adaptables. C’est ce que la plupart des entreprises demandent aujourd’hui. Avoir une grande « boîte noire” sans comprendre véritablement le pourquoi du comment s’avère être très difficile à exploiter.