Analyse automatique de texte aujourd’hui, GenAI demain
SAS et Notilyze ont développé une solution basée sur l’analyse de texte. Dans une prochaine étape, le SPF Emploi explorera la GenAI pour formuler automatiquement des réponses correctes.
Trouver des informations précises peut être un processus long et complexe, surtout lorsque la base de connaissances se compose de la vaste législation belge. Par exemple, combien de fois un employé peut-il déposer un certificat médical ? Lorsqu’ils reçoivent une telle question, les juristes du SPF Emploi consultent de nombreux textes législatifs pour identifier les articles pertinents.
Qui plus est, plusieurs interprétations de la législation sont possibles, et il est crucial de garantir la cohérence des réponses. À cela s’ajoute le fait que la législation évolue constamment, obligeant les juristes à prendre en compte les nouvelles versions et interprétations.
L’analyse de texte pour filtrer les articles pertinents
Pour répondre à ces défis, le SPF Emploi a identifié un « use case » clair où la technologie apporte une valeur ajoutée importante. Dans un premier temps, le service public a opté pour l’analyse de texte, une technique qui examine de grands volumes d’information pour en extraire rapidement les éléments pertinents.
SAS et Notilyze, l’un des principaux fournisseurs de solutions technologiques et d’analyse de données, ont développé une solution basée sur l’analyse de texte.
Les juristes n’ont qu’à formuler une question, et l’algorithme recherche les articles législatifs correspondants. En termes techniques, cela s’appelle le « smart retrieval ».
Un long travail préparatoire
La technologie capte d’abord la question posée, puis identifie, grâce au NLP (Natural Language Processing), les informations de la base de connaissances qui peuvent être liées et donc pertinentes. Sur cette base, le juriste peut interpréter les informations et formuler une réponse. En combinant diverses techniques, l’algorithme peut établir un classement des textes les plus pertinents pour une recherche donnée.
Il va sans dire que ce système permet aux juristes du SPF Emploi de gagner un temps précieux, d’autant plus qu’il peut traduire automatiquement les informations en néerlandais et en français.
Cependant, il serait illusoire de penser qu’un tel système est immédiatement opérationnel. Une bonne gestion des données et l’accès à des données de qualité restent des éléments fondamentaux pour tout projet d’IA réussi. En d’autres termes, un travail préparatoire considérable est nécessaire.
Etape suivante, la GenAI
A l’horizon, la GenAI. Elle ouvrira de nouvelles perspectives pour le SPF Emploi. Une première étape est déjà en cours avec l’extraction de morceaux d’information sémantiques pertinents pour répondre à des questions spécifiques. À terme, les juristes pourraient non seulement obtenir rapidement les informations pertinentes, mais aussi recevoir une réponse préformulée sur laquelle ils pourraient travailler.
Pour y parvenir, l’algorithme devra toutefois disposer d’un contexte suffisant. Il devra, par exemple, comprendre comment un juriste traite une question pour y répondre. C’est pourquoi il est essentiel de créer des prompts qui reflètent au mieux l’univers de travail d’un juriste.
L’examen de la législation, la compréhension des interprétations, l’ambiguïté… Tous ces éléments augmentent la complexité d’une recherche. Le prompt doit structurer le travail de l’algorithme autant que possible, par exemple en obligeant le système à reformuler la question initiale, puis à définir plusieurs sous-questions. Pour chaque sous-question, le système pourra rechercher les informations pertinentes dans les textes législatifs. De cette manière, l’algorithme pourra fournir une réponse bien plus précise et fiable.
Un modèle reproductible dans d’autres services publics
Actuellement, le SPF Emploi utilise uniquement l’analyse de texte, mais l’exploration de l’IA générative est en cours. Grâce à une approche progressive et à une forte focalisation sur la gestion des données et l’intégration dans les systèmes existants, le SPF dispose déjà de bases solides pour adopter la GenAI. Cette démarche pourrait également être reproduite dans d’autres services publics.
La méthodologie de SAS se concentre sur les éléments essentiels nécessaires à la GenAI, lesquels peuvent être facilement adaptés ailleurs. Bien entendu, les données utilisées pour entraîner un modèle diffèrent d’un contexte à l’autre, mais dans la pratique, cela pourrait grandement accélérer la mise en œuvre.