La reconversion, parent pauvre des politiques d…
Feuille de route d’un cas d’usage de l'IA : du POC à l’industrialisation dans le secteur de l’immobilier d’entreprise
Le secteur de l'immobilier d'entreprise a cette particularité que la plupart de ses activités reposent sur un événement très peu récurrent, à savoir le déménagement d'une entreprise. Cet événement majeur déclenche de nombreuses activités commerciales dans divers secteurs : propriété foncière, courtage, investissement immobilier, aménagement, fourniture d’énergie, restaurants d'entreprise. Ces activités reposent généralement sur des relations de longue date entre les acteurs et sur un sens aigu des affaires plutôt que sur des analyses sophistiquées. Il est intéressant de noter que le secteur de l'immobilier a été largement négligé par l'essor des technologies d'IA au cours de la dernière décennie. Peut-être parce qu’il s’agit d’une activité ancienne et authentique or alors parce qu’il n’y avait pas d’applications évidentes de l’IA jusqu’alors. Mais aujourd'hui, la consolidation des données du marché et la concurrence accrue poussent les acteurs de l'immobilier à trouver de nouvelles sources de revenus et à exploiter l'IA à cette fin. Ces initiatives sont désignées sous le terme PropTech.
L'un des cas d'usages les plus simples et les plus efficaces de la PropTech consiste à prévoir le déménagement d'une entreprise pour anticiper les opérations commerciales à venir. Si vous êtes un acteur de l'immobilier d'entreprise, la plupart de vos revenus dépendent de cet événement unique clé. Pour tirer profit de cette opportunité, il faut approcher votre prospect avant cet événement dans les délais adéquats. Pas trop tôt dans son processus de réflexion pour un éventuel déménagement, mais aussi pas trop tard pour qu'il ait encore des choix à faire.
Dans ce contexte, obtenir l’information d'un déménagement futur au bon moment offre un avantage concurrentiel majeur. Cette application de l'intelligence artificielle est très simple à expliquer et à évaluer, ce qui la rend largement populaire auprès des parties prenantes.
Dans le cadre de la mise en œuvre et du déploiement de ce cas d'usage pour l'un des plus grands courtiers en immobilier d’entreprise du marché, nous avons commencé par un projet pilote pour un périmètre limité. Ce pilote a été initialement conçu pour servir de POC, c'est-à-dire pour valider la pertinence du cas d'usage. Mais il a également servi de phase d’initialisation avant une éventuelle industrialisation de l'application. Une fois que les scripts de webscrapping, le pipeline de transformation des données et le modèle de machine learning sont construits, ils peuvent être aisément généralisés à un périmètre plus large. Ce processus d’industrialisation nous a toutefois fourni de précieux retours d’expérience qui ont fait de ce projet un parfait exemple d'enseignement de l’implémentation d'un produit de data science de bout en bout. Tout d'abord, parce qu'il mobilise toutes les étapes clés de la chaîne de valeur de la donnée. Deuxièmement, parce qu'il s'est révélé être une industrialisation réussie de par sa conception. Troisièmement, parce qu'il a fait émerger certaines des plus grandes problématiques d’actualité liées à la mise en production de modèles de machine learning.
Notre solution utilise équitablement les différentes composantes de la chaîne de valeur de la donnée. Tout d'abord, le processus d'acquisition des données représente une part importante de la valeur ajoutée du produit. Les données externes que nous collectons par webscraping, le processus d'extraction automatisée et massive de données en ligne, comprennent les actualités des entreprises, les données du marché local de l'immobilier et, surtout, les états financiers du secteur privé, qui permettent de comprendre avec précision l’état d'une entreprise.
Une fois collectées, les données externes sont réconciliées avec les sources internes, puis analysées et transformées pour s'assurer qu'elles respectent le niveau de qualité requis pour toute exploitation ultérieure. La modélisation est effectuée à l'aide d'un algorithme de machine learning de l’état de l’art afin d'atteindre un niveau élevé de précision dans les prédictions. Les pratiques standards de calibrage et de validation sont respectées pour la validation des modèles. Enfin, la visualisation des données et le déploiement sont les dernières étapes du projet qui permettent aux utilisateurs finaux d'accéder aux prédictions par le biais d'une interface ergonomique ou d'une API dédiée.
Avec le recul, il est évident que ce projet a suivi l'adage bien connu et conseillé “think big, start small, scale fast” (« penser grand, commencer petit, et agir vite »). En effet, les contraintes opérationnelles inhérentes à l'industrialisation d'un produit data ont été prises en compte et traitées très tôt avant tout travail de développement. Ces défis comprenaient la performance du modèle à long terme, la maintenabilité du produit et son acceptation par les utilisateurs. Ensuite, le pilote lancé sur un périmètre géographique et sectoriel limité a permis de valider rapidement la pertinence et la faisabilité du cas d'usage. La performance a été testée a posteriori avec des résultats commerciaux vérifiés. Enfin, le déploiement rapide sur Heka, notre plateforme de développement, a permis de passer rapidement à l'échelle supérieure.
Au cours de l'industrialisation de notre cas d'usage, nous avons abordé certaines des questions les plus difficiles liées à la mise en production de machine learning. Tout d'abord, l'automatisation est essentielle. Cela signifie que toute fonctionnalité d'un produit data, du téléchargement des données au calibrage des modèles et à l'accès aux prédictions, doit être accordée par le biais d'une API dédiée.
C'est pourquoi, lors du déploiement sur Heka, nous avons commencé par construire les API indispensables à son exploitation commerciale. Deuxièmement, les modèles de boîte noire ont mauvaise presse dans les solutions commerciales. Cela fait de l'interprétabilité de l'IA l'un des domaines de recherche les plus dynamiques du machine learning. À la demande de nos clients, nous avons rapidement intégré dans notre solution un module d'interprétation qui fournit les principaux facteurs ainsi que leurs impacts respectifs expliquant le score obtenu. Troisièmement, les modélisations du monde réel sont rapidement obsolètes. Les crises majeures telles que la pandémie Covid-19 transforment les relations économiques et les comportements des entreprises. Nous avons atténué son impact sur les performances de notre modèle en choquant ses inputs financiers ou en limitant temporairement son champ d'application aux entreprises présentant des performances suffisantes. Plus concrètement, en examinant les conséquences des crises passées, nous avons découvert que les entreprises en difficulté étaient plus à même de maintenir leurs plans de déménagement après une récession, ce qui garantit que notre modèle est toujours pertinent pour ces entreprises au terme de la crise du Covid-19.
Pour tirer parti des déménagements d'entreprise, notre solution d'IA calcule la probabilité de déménagement de vos prospects à 12-24 mois