Analyse prédictive : définition et exemples

Prédire l’avenir avec précision grâce à des formules mathématiques ? Cette ambition audacieuse semble être à la portée de l'analyse prédictive. Cette méthode d'analyse de données est un sous-ensemble du Big Data. Elle vise à prédire des tendances futures, notamment dans le secteur du marketing, des finances, des assurances et même de la santé.

Au cœur de l’analyse prédictive, on trouve les modèles. Une personne ou une unité va être mesurée pour prédire un possible comportement futur. Un exemple concret serait une police d'assurance qui anticipe les facteurs de risque d’un conducteur, en incluant dans son calcul des facteurs tels que son expérience de conduite, son âge et son état de santé. À partir de la somme de tous ces facteurs, l'analyse prédictive peut calculer le risque potentiel d'accidents, et donc le montant de la prime d’assurance.

Le data mining : la base de diverses analyses

Dans la pratique, le terme de data mining est souvent utilisé à la place de l'analyse prédictive. La plupart du temps, les méthodes de data mining jouent en effet un rôle essentiel dans le processus de recherche des approches d’analyses prédictives. L’analyse prédictive affine cependant le fonctionnement du data mining et comprend des techniques supplémentaires. Des éléments de la théorie des jeux et de l'apprentissage automatique sont notamment pris en compte. En outre, sont également utilisées dans l'application de l'analyse prédictive des méthodes d'analyse spécifiques, qui sont basées sur des algorithmes complexes afin de dégager un modèle reconnaissable à partir de toutes les contributions en apparence sans lien des médias sociaux ou articles de blog.

Remarque

Le data mining (ou exploration de données) cherche à définir des modèles en données larges à l'aide d'algorithmes et de méthodes mathématiques et stochastiques. Idéalement, les connaissances ainsi acquises peuvent être utilisées pour identifier et anticiper les tendances et des développements potentiels.

Afin de mieux comprendre les fonctionnalités de l'analyse prédictive, il est utile de disposer d'un aperçu des termes courants utilisés :

  • Analyse de régression : les interactions entre diverses variables dépendantes et indépendantes sont identifiées. Par exemple, les ventes vont dépendre du prix du produit et de la solvabilité des clients.
  • Clustering : en segmentant les données, les clients potentiels peuvent être classés selon leurs revenus ou d’autres facteurs similaires. Il s’agit d’un regroupement.
  • Analyse d'association : l'objectif est d'identifier les structures dont les variables conduisent à des résultats identiques. Cela permet de tirer des conclusions sur le comportement éventuel des clients et, idéalement, de faire des pronostics sur les futurs achats.

La particularité de l'analyse prédictive

Le fait de reconnaître des tendances dans des ensembles de données fait penser à la faculté du cerveau humain à interpréter, bien que les analyses de Big Data dépassent largement ses capacités en termes de complexité. En fait, il existe un parallèle entre les structures appliquées du data mining et les réseaux de neurones du cerveau humain, puisque les réseaux artificiels sont également capables d'identifier et de stocker des modèles à la suite de certaines séquences. Par conséquent, le data mining est fondamentalement lié à l'intelligence artificielle. Dans ce processus, les programmes informatiques apprennent de manière presque autonome grâce à des bases introduites et acquièrent de nouvelles informations en fonction des nouveaux modèles développés.

C’est ici que l’on peut observer une grande différence entre data mining et analyse prédictive. L'exploration de données classique vise habituellement à montrer les schémas structurels sur des informations et groupes existants. Cependant, l'accent mis sur un développement quasi autodidacte des calculs qui s'étend progressivement au-delà du groupe de données (et qui est donc une caractéristique de l’intelligence artificiel) joue un rôle décisif dans la définition de l'analyse prédictive. Les algorithmes déjà existants doivent être combinés pour amener de nouvelles conclusions et pouvoir prévoir par exemple des comportements d’une cible d’acheteurs potentiels. Le « condensé » de ces enquêtes est appelé Smart Customer Data.

Applications de l’analyse prédictive

L’introduction de l’analyse prédictive a déjà fait ses preuves dans un large éventail de domaines et d’industries. Outre les entreprises de haute technologie, le secteur de la santé, par exemple, utilise cette méthode pour anticiper les évolutions probables de certaines maladies. Le secteur de l'énergie est également un domaine d'application important, avec notamment le développement de réseaux électriques intelligents, les « smart grids ». La consommation d'énergie peut en effet être estimée sur la base de schémas de comportement des clients enregistrés (Smart Customer Data) afin de réguler avec précision l'apport nécessaire d'énergie éolienne et hydroélectrique.

La maintenance d’une machine est également prévue par les analyses prédictives. Ici, les données existantes d'une machine en marche sont utilisées pour prédire sa charge future et son usure. Les points faibles de la chaîne de production peuvent ainsi être rapidement identifiés et réparés, afin d’éviter par exemple un arrêt total de cette production.

Il est préférable d'utiliser l'analyse prédictive lorsque l'on dispose d’un bon nombre de paquets de données qui sont notamment très différents les uns des autres et les plus complets possibles. Tous les paquets de données sont ensuite intégrés dans l'analyse, et plus il y a de données provenant de domaines variés, plus les résultats seront précis. Voici quelques-uns des outils les plus populaires pour effectuer des analyses prédictives :

  • Alpine Data Labs
  • Alteryx
  • Angoss KnowledgeSTUDIO
  • BIRT Analytics
  • IBM SPSS Statistics and IBM SPSS Modeler
  • KXEN Modeler
  • Mathematica
  • MATLAB

Pour aller un pas plus loin, on peut également effectuer des analyses prescriptives (prescriptive analytics). Cette méthode commence là où l'analyse prédictive atteint ses limites. Le but est de comprendre des lignes directrices de comportement pour tenter de les reproduire de manière ciblée. Cette procédure est rendue possible grâce à des structures analytiques basées sur des modèles complexes et des simulations stochastiques de la méthode Monte-Carlo. Comme pour l'analyse prédictive, plus on utilise de variables connues et fiables dans ces modèles, plus les résultats seront pertinents.

En résumé

Il existe d'innombrables exemples de fonctionnement et d’applications d’analyses prédictives. La méthode dépend de la quantité et de la qualité des données. Néanmoins, les algorithmes utilisés sont de plus en plus finement maillés, ce qui signifie que les prédictions sont aussi de plus en plus précises. Ainsi, les analyses dites prescriptives évoluent également dans ce sens, pour être également de plus en plus sûres.