Artificial Intelligence

Artificial Intelligence, Deep Learning, Machine Learning

L’IA pour tirer parti des données non-structurées

Mar 6, 2024 | Ai | 0 commentaires

80 à 90 % des données d’une entreprise sont non structurées. Jusqu’à présent inexploité, ce gisement de contenu est sur le point d’être déverrouillé grâce au potentiel de l’IA générative. Explications de Gaëlle Helsmoortel, Data Strategy Director, Micropole.

Dans le domaine de l’intelligence artificielle et du machine learning automatique, la prolifération des applications basées sur les données est remarquable. Cependant, le défi réside dans la gestion de données. De fait, celles-ci qui défient la structuration conventionnelle existant dans des formats divers et non organisés.

« Dans les entreprises, une immense quantité d’informations est recueillie depuis des années, parfois même des dizaines d’années… et ces données sont en grande majorité sous-utilisées, voire non-utilisées. Ce sont les données non-structurées, explique Gaëlle Helsmoortel, Data Strategy Director, Micropole. Vous avez les écrits, les mails clients, les tickets de support, les avis laissés sur les différentes plateformes prévues à cet effet, les rapports des commerciaux et technico-commerciaux… Ce sont là autant de gigantesques opportunités d’analyser ‘la voix de vos clients’. Autrement dit, comprendre comment ceux-ci parlent de vos produits, de vos services, de votre entreprise… »

Mais pas seulement. Ces données non structurées sont aussi des opportunités d’anticiper de potentiels problèmes à venir, encore gérables aujourd’hui. En revanche, non traités, ils pourraient devenir des gouffres financiers…

Les données non structurées pour comprendre le pourquoi et le comment

Alors que les données structurées peuvent donner un aperçu du comportement des clients, autrement dit le « quoi » (noms, historique des achats et géolocalisation par exemple), les données non structurées sont mieux adaptées pour fournir aux entreprises une meilleure compréhension de l’intention et du comportement de leurs clients : le « pourquoi » et le « comment ».

C’est évidemment intéressant, mais complexe. On parle ici de volumes gigantesques. Les données non structurées représentent 80 à 90 % des données existantes et générées en continu. La variété inhérente des données non structurées présente également un défi d’association. Comment, notamment, référencer de manière croisée les images, les vidéos et le texte ? Qui plus est, la qualité des données non structurées est incohérente, en partie à cause de leur variété. Les données non structurées peuvent contenir des erreurs, des incohérences ou des informations non pertinentes, ce qui peut rendre difficile l’obtention d’informations précises. Le pré-traitement ou le nettoyage des données non structurées pour améliorer la qualité peut être une tâche chronophage et complexe. Autre souci, l’analyse. Contrairement aux données structurées, qui peuvent être interrogées et analysées rapidement, les données non structurées contiennent souvent beaucoup de texte et ne s’intègrent pas parfaitement dans une base de données.

Les données non structurées sont stockées dans leur format natif et ne sont traitées que lorsqu’elles sont visualisées. Se posent aussi des problèmes de sécurité et de confidentialité, les données non structurées peuvent en effet contenir des informations sensibles. Enfin, l’intégration. Nécessaire pour avoir une vue d’ensemble, elle peut être complexe en raison de l’absence d’un modèle de données prédéfini.

L’analyse client est un cas d’utilisation des données non structurées

« Aujourd’hui, les intelligences artificielles aident à extraire des paternes et donc du sens à des très grandes quantités de données non structurées qui sont créés quotidiennement », observe Gaëlle Helsmoortel.

Un contenu auparavant difficilement accessible au sein de l’organisation peut désormais être rendu instantanément utile et précieux, aidant les décideurs à découvrir et à susciter des actions, à créer un nouveau contenu avec la voix de leur client et à automatiser des processus à une échelle jamais vue auparavant.

« Les données non structurées sont une mine d’or d’intelligence marketing, assure Gaëlle Helsmoortel. Avec la possibilité d’analyser rapidement d’énormes quantités de données et de personnaliser des comportements de clients, vous comprendrez mieux ce que vos clients disent de vous. Ils ont l’expérience client, pas forcément celle que vous voudriez qu’ils vivent, mais celles qu’ils vivent vraiment. Et vous pouvez réellement  analyser et comprendre ce qu’ils souhaitent. Et, par conséquent, adapter vos offres, vos services. Bref, comment, in fine répondre à leurs besoins et avoir un réel avantage compétitif ! »

Tous les feedbacks de… vrais clients

Depuis des décennies, le marketing souhaite comprendre et analyser cela. Il le fait via des études qui coûtent souvent très cher et qui le marketeer, mais ce sont toujours des probabilités faites sur un échantillon plus ou moins représentatif.

« Ici, note encore Gaëlle Helsmoortel, on a tous les feedback de vrais clients. Vous avez une très grande quantité de données qualitatives, non structurées et très difficile, voire impossible pour un humain à analyser rapidement. C’est là que les IA -plus particulièrement les IA génératives- s’imposent comme la solution ! Elles peuvent analyser une quantité gigantesque de données en un temps record et les transformer en insights exploitables, facilitant la prise de décision et l’innovation ! »

Comment gérer et analyser les données non structurées

Par nature, les données non structurées n’ont pas de structure prédéfinie permettant une gestion et une analyse faciles. Par conséquent, pour analyser des données non structurées, il convient, dans un premier temps, de les gérer. A commencer par en faire l’inventaire, de voir où sont-elles. Définir ensuite l’objectif business. S’agit-il d’améliorer l’expérience client ? Identifier des problèmes produits ? Améliorer la communication à travers les blogs, les posts ? Ou optimiser le discours commercial ? Enfin, analyser les données qui seront utiles pour atteindre l’objectif : accès facile ? Qualité ? Quantité ? Type de confidentialité ?

Le choix d’un modèle de GenAI (open source ou propriétaire) suivra. On entrera alors dans le « dur » avec le prompt engineering, le fine tuning, l’intégration et le déploiement…

Les applications peuvent aller très loin. En septembre dernier, Coca-Cola lançait le Y3000, la première canette de Coca co-créée avec l’IA générative. La première édition se distingue par des couleurs et des saveurs inédites. Le processus a été réalisé en deux étapes : d’abord, un algorithme a analysé les données de plus de 200 000 produits Coca-Cola existants ou potentiels, ainsi que les tendances actuelles et futures en matière de goûts et de préférences. Ensuite, l’IA a proposé plusieurs formules possibles, parmi lesquelles les équipes de Coca-Cola ont sélectionné celle qui correspondait le mieux à leur vision du futur.

CRM, un potentiel énorme

D’une manière générale, l’IA générative occupera une position clé pour améliorer le service client et booster l’engagement des utilisateurs. Elle permettra non seulement d’améliorer l‘expérience client, mais aussi de maximiser le retour sur investissement dans le domaine de la relation client. « L’IA générative permettra de déceler très tôt si un problème existe avec un des produits ou services chez plusieurs clients, commente Gaëlle Helsmoortel. Souvent non visible car encore trop tôt, une analyse fine et à grande échelle permettra par exemple de déceler la répétition d’une même remarque dans un espace temps précis et, par conséquent, d’entamer une étude plus fine des raisons. »

On l’a compris, le potentiel est énorme. « En exploitant au mieux cette quantité de données sous-utilisées, on pourra non seulement économiser des ressources précieuses, mais aussi aligner de manière proactive les produits, le marketing et le contenu numérique avec les préférences réelles des clients. »

 

6 catégories de use case pour l’IA générative 

Génération : l’IA générative crée des premiers drafts de contenu, comme du code, des textes, des vidéos ou des images.

Extraction : l’IA générative transforme des données brutes, telles que des tableaux PDF, en formats plus facilement exploitables comme des CSV ou des Excel.

Réécriture : l’IA générative réécrit le contenu pour changer leur forme, comme traduire des textes, simplifier des concepts ou ajuster le style de communication.

Classification : l’IA générative catégorise automatiquement le contenu, améliorant l’organisation et la recherche en attribuant des sujets ou des sentiments pertinents.

Question Answering : en tant que moteur de recherche personnalisé, l’IA répond à des questions spécifiques sur des documents ou sujets, optimisant l’analyse de contenus complexes.