Oui à l’open source, mais à quel prix ?
Les entreprises ne se rendent pas suffisamment compte de la somme d’efforts qu’implique l’open source. Il s’agit pourtant d’y réfléchir…
L’apprentissage automatique et l’Intelligence Artificielle ont renforcé l’engouement pour l’open source au sein des entreprises mais ces dernières ne réfléchissent pas suffisamment aux conséquences à long terme. L’utilisation de R et de Python gagne sans cesse du terrain parce que ces langages de programmation sont également ceux que l’on croise le plus souvent lors des études. Pour Véronique Van Vlasselaer, Customer Advisor Decision Science, SAS, cela ne pose évidemment aucun problème dans un cadre théorique, mais l’apprentissage automatique et les modèles AI doivent également pouvoir être transposés dans la pratique pour générer de la valeur. Et c’est là que le bât blesse…
«Le fait que les langages open source R et Python réussissent à s’implanter au sein des entreprises tient pour beaucoup à la formation que reçoivent leurs nouvelles recrues. La plupart des professeurs optent en effet pour des logiciels reposant sur R et Python parce que ces derniers sont aisément abordables. Les logiciels sont en outre faciles à installer : les étudiants peuvent tout simplement télécharger les applications via Internet et commencer à les utiliser très rapidement.»
Un étudiant n’est pas un expert
D’un point de vue purement académique, il est assurément intéressant de se former à l’open source, mais transposer cette idée dans le monde de l’entreprise se fait un peu trop à la légère. Nombreux sont les gestionnaires qui estiment, à tort, devoir passer à R ou Python parce qu’ils constatent que les jeunes diplômés sont versés dans ces langages. Quelqu’un qui sort tout juste de l’école ne peut en aucune façon se considérer comme un expert.
«L’expertise ne se fait jour qu’en mettant en pratique les connaissances acquises. D’ailleurs, le bagage théorique que l’enseignement supérieur confère aux étudiants devrait leur permettre d’utiliser aisément un autre langage. Les bons ‘data scientists’ ont la capacité de faire abstraction du langage !»
Beaucoup d’entreprises ne tiennent pas compte de l’ensemble des facteurs lorsqu’elles basculent vers R et Python, regrette Véronique Van Vlasselaer. Les jeunes employés sont capables de développer des modèles exotiques avec l’open source mais, au final, il faut également pouvoir en faire quelque chose en tant qu’entreprise. Or, ce genre de modèle n’a de réelle utilité pour une société qu’à condition qu’elle puisse en retirer de la valeur.
Le cycle de vie analytique
«Supposons par exemple qu’une banque désire prédire ceux qui, parmi ses clients, envisageront de passer à la concurrence, illustre Véronique Van Vlasselaer. R et Python permettent de développer un bon modèle ou algorithme qui, sur base des données historiques, identifieront les facteurs qui détermineront si une personne changera de banque. Ce genre de modèle prend en compte les informations de la base de données clientèle existante, les personnes qui ont déjà changé de banque et leur comportement. Ont-elles, par exemple, des amis qui ont changé de banque ? Leur emprunt est-il arrivé à échéance ? Ont-ils clôturé des comptes à vue au cours des mois écoulés ?»
Pour la banque, il est toutefois plus important qu’un tel modèle puisse également s’appliquer à de nouveaux clients. Quel est le risque qu’un client parte, le mois prochain, pour la concurrence ? Dès l’instant où la banque en a connaissance, elle peut décider de proposer des incitants. Elle pourrait par exemple lui offrir une carte MasterCard gratuite pendant un an. Cela lui permet d’anticiper un départ tandis que le client hérite soudain d’une raison de rester malgré tout.
Cycle de vie
«C’est ce second volet qui crée de la valeur ajoutée pour la banque, estime Véronique Van Vlasselaer. Un modèle qui fonctionne dans un cadre théorique est une bonne chose mais une entreprise ne retire de la valeur des connaissances acquises qu’à condition que le modèle puisse également être appliqué dans un environnement concret. C’est ce qu’on appelle le cycle de vie analytique, qui allie ‘développement’ et ‘déploiement’ et qui s’applique à la fois à des projets analytiques et à des projets d’apprentissage automatique et d’intelligence artificielle.»
Les jeunes recrues poussent rarement la réflexion au-delà du modèle qu’ils ont développé. Pour eux, leur tâche s’arrête une fois le premier volet – le développement – assuré. Or, l’élément majeur du cycle de vie manque encore. A savoir : transposer le modèle en production.
Absence de suivi
«Chez SAS, nous constatons que cette prise de conscience incite un nombre croissant d’entreprises à rétropédaler quelque peu. Non seulement, la mise en production de ces modèles exige pas mal de ressources IT, mais ils semblent par ailleurs ne plus convenir après quelques années. Ce qui, un jour, avait paru être le meilleur modèle possible ne l’est désormais plus. Les logiciels ou codes qui étaient jadis utilisés ont entre-temps évolué. Le principe est celui d’une communauté open source, ce qui signifie que chacun contribue constamment au développement des logiciels.»
Une société n’a que faire d’un modèle désuet. Dans de nombreux cas, l’employé concerné a depuis longtemps quitté son premier emploi, ce qui implique qu’il ne peut se charger de la maintenance et du suivi. Par ailleurs, les programmateurs open source ne se préoccupent généralement pas de documenter les codes, ce qui signifie que personne n’est en mesure de prendre le relais.
Les entreprises doivent dès lors se rendre compte que l’open source exige davantage d’efforts qu’elles ne l’imaginent de prime abord, conclut somme d’efforts qu’implique l’open source, conclutVéronique Van Vlasselaer. «Il s’agit de réfléchir à une méthode ou à une structure permettant d’éviter que chacun ne code à sa façon. SAS se fait volontiers l’artisan de l’open source et de l’industrialisation du code mais, pour ce faire, les entreprises doivent modifier leur approche. L’open source permet d’acquérir pas mal de connaissances mais cela ne signifie pas que ce soit le meilleur choix dans le cadre de l’entreprise.»
Ces articles parlent de "Data Intelligence"
Analysis, BI, Prediction, Planning, Boardroom