Quelques mots sur la Business Intelligence

La modélisation de gestion permet d’avoir un outil d’aide à la décision. Les données sont donc importantes mais comment transformer des données brutes en données intelligentes pour l’aide à la décision ?

La Business Intelligence (en français : L’informatique décisionnelle) désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d’une entreprise en vue d’offrir une aide à la décision et de permettre à un décideur d’avoir une vue d’ensemble de l’activité traitée.
Ce type d’application utilise en règle générale un Datawarehouse (ou entrepôt de données en français) pour stocker des données transverses provenant de plusieurs sources hétérogènes:

  • d’un point de vue technique: SAP, Excel, DB2, Oracle Database, SQL Server…
  • d’un point de vue fonctionnel : RH, Production, Comptabilité, Finance …

et fait appel à des traitements par lots pour la collecte et la présentation de ces informations à des fins d’analyse.

La plupart du temps, les données sont exploitées au sein d’un Cube qui permet d’agréger des données selon de nombreux axes. L’approche BI des cubes de données dits “OLAP” consiste à modifier le compromis entre l’utilisation de l’espace mémoire et la rapidité de mise à disposition de la donnée, en sacrifiant la première au profit de la seconde. De manière pratique, l’idée des cubes est de réaliser à l’avance de nombreux traitements particulièrement coûteux en temps, et de stocker les résultats pour une utilisation immédiate.

Quelques définitions:
MOLAP: cas où le cube est entièrement pré-calculé dans la base de données (plutôt utilisé dans le cas où les données changent peu ou rarement).
ROLAP: Consiste à l’inverse à calculer dynamiquement des pré-agrégations dans la base de données et de passer ensuite la donnée au module d’analyse pour le reste du traitement. L’avantage est qu’il n’y a pas de limite sur la quantité de données, mais les performances seront moindre.
HOLAP (H pour Hybride) tente d’apporter une solution intermédiaire entre les deux autres modes.

Architecture du Système d’Information Décisionnelle (SID)
La Business Intelligence propose d’utiliser les données transitant par le Système d’information, données de production le plus souvent, en informations susceptibles d’être exploitées à des fins décisionnelles.
Sur le plan pratique et technique, la Business Intelligence se compose d’une famille d’outils informatiques et de progiciels assurant le fonctionnement de la chaîne de traitement de l’information.

Les 4 fonctions de la chaîne décisionnelle
Il est coutumier de présenter les éléments et outils composant la chaîne décisionnelle en quatre catégories correspondant chacune à une fonction spécifique, à une phase du processus.

Les 4 phases du processus de Business Intelligence, de la donnée à l’information.

-1- Collecter, nettoyer et consolider les données Extraire les données des systèmes de production et les adapter à un usage décisionnel.

-2- Stocker Centraliser les données structurées et traitées afin qu’elles soient disponibles pour un usage décisionnel.

-3- Distribuer Ou plutôt faciliter l’accessibilité des informations selon les fonctions et les types d’utilisation.

-4- Exploiter ou comment assister le mieux possible l’utilisateur afin qu’il puisse extraire la substance de l’information des données stockées à cet usage.

1. Collecter : les outils d’ETL (Extract Transform and Load)
Collecter, Nettoyer et Consolider les données de l’entreprise étendue.
La collecte des données est une fonction remplie par une famille d’outils dénommée ETL pour Extract Transform load.
Le système d’information de l’entreprise ne s’est pas bâti en un temps unique. La majorité des systèmes d’information d’entreprise sont de nature hétérogène pour la plupart. Bien que la standardisation des échanges entre les divers outils informatiques avance à grands pas, la disparité des formats des données en circulation est toujours une réalité. C’est le principal obstacle technologique aux échanges étendus d’informations.
Avant d’être utilisables, les données seront formatées, nettoyées et consolidées. Les outils d’ETL permettent d’automatiser ces traitements et de gérer les flux de données alimentant les bases de stockage : DataWarehouse.
Le Master Data Management (MDM – gestion des données de référence) assure la standardisation et la traçabilité des données de référence de l’entreprise. Le Master Data Management est un projet en soi dont la finalité dépasse la constitution de la base décisionnelle.

2. Stocker : le DataWarehouse
Les bases de données de production ne sont pas utilisables pour une exploitation décisionnelle. Les données brutes ne sont pas prêtes à cet usage et par ailleurs les requêtes décisionnelles sont particulièrement gourmandes en ressources machines.
Les données, au préalable nettoyées et consolidées, seront stockées dans une base spécialisée : le DataWarehouse.

3. Distribuer les informations
L’écrasement de la pyramide et la multiplication des points de prise de décision modifient fondamentalement la gestion de l’information. L’information sera perçue en terme de flux et non d’unité de stockage. Afin de dynamiser la réactivité globale, l’information sera largement distribuée auprès de l’ensemble des partenaires. Le portail décisionnel remplit cette fonction essentielle.

4. Exploiter : Reporting, Tableau de bord, OLAP*, Datamining** …
Une fois les données stockées, nettoyées, consolidées et accessibles, elles sont utilisables. Selon les besoins, différents types d’outils d’extraction et d’exploitation seront envisagés.

*OLAP : outil permettant d’exploiter des données dans un autre outil, tel que MS Excel.
**Datamining : Exploration de données.

Qu’est-ce qu’un Datawarehouse ?
Le DataWarehouse est un système permettant aux différents acteurs de l’entreprise de disposer d’informations pertinentes et d’outils d’analyse adaptés pour les aider à prendre les bonnes décisions au bon moment
« Le DataWarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision » (Bill INMON).
Il existe trois types de données :

1) Données intégrées : 
Les données subissent des transformations afin de pouvoir être assemblées de façon cohérente.

2) Données historisées :
Le DWH conserve les données plus longtemps que le système de production.
Les évolutions des données sont tracées et historisées, contrairement aux systèmes opérationnels, qui pratiquent la mise à jour.
Selon les besoins des utilisateurs et les contraintes techniques ou de coût, différents niveaux d’historisation sont envisageables

3) Données non volatiles : 
Les informations ne sont jamais supprimées.

Limites d’un Datawarehouse

  • Le DWH ne doit pas prendre en charge des activités opérationnelles: calcul des primes des employés, documents réglementaires, etc…
  • Le DWH n’a pas vocation à prendre en charge le reporting opérationnel.
  • Le DWH n’est pas un système critique: la tolérance aux pannes est plus forte que dans le Système opérationnel SAP. Une panne ne doit pas mettre en péril un processus clé de l’entreprise.
  • Le DWH n’autorise pas des calculs trop complexes d’indicateurs, par exemple s’appuyant sur des modèles statistiques. Ces calculs pourront être effectués dans une application dédiée, plus adaptée, puis réinjectés dans le DWH.
Dans un prochain article, nous évoquerons l’outil Powerpivot. Peut-on vraiment le considérer comme un outil de Business Intelligence ? 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *