• Oct 4, 2024

Méthodologie pour déterminer si une donnée est de type référentielle ou transactionnelle

La distinction entre les données référentielles et les données transactionnelles est essentielle pour la conception et la gestion de systèmes de bases de données et d'entrepôts de données. Chacune de ces deux catégories de données joue un rôle spécifique dans la gestion des informations et le support des opérations métiers.

Définitions

  • Donnée référentielle : Ce sont des données statiques ou faiblement volatiles qui décrivent des entités ou des objets essentiels au système d'information. Elles sont souvent utilisées pour normaliser ou valider les données transactionnelles et servir de "référence" dans les bases de données.

    • Exemples : Liste des produits, liste des clients, codes de pays, codes d’unité de mesure, tables de dimension dans un entrepôt de données.

  • Donnée transactionnelle : Ce sont des données dynamiques qui représentent des événements ou des actions liées aux opérations courantes d'une entreprise. Elles sont fréquemment mises à jour et créent un historique d'activités dans le système.

    • Exemples : Factures, commandes, paiements, mouvements de stock, historiques de connexion des utilisateurs.


Étapes pour déterminer si une donnée est référentielle ou transactionnelle

1. Identifier l'origine et le rôle de la donnée

La première étape pour déterminer le type d’une donnée consiste à comprendre d'où elle provient et quel rôle elle joue dans le système d’information. Voici quelques questions clés à se poser :

  • La donnée décrit-elle une entité stable dans le temps (produit, client, pays) ou un événement ou une action (commande, facture, paiement) ?

    • Si la donnée décrit une entité stable (client, produit), il s'agit probablement de données référentielles.

    • Si la donnée décrit une transaction ou un événement (achat, commande), il s'agit de données transactionnelles.

2. Analyser la volatilité de la donnée

  • La donnée change-t-elle souvent ?

    • Si la donnée change fréquemment en fonction des événements (exemple : montants des factures ou états de commande), elle est probablement transactionnelle.

    • Si la donnée change rarement ou uniquement lors de mises à jour spécifiques (comme l’ajout d’un nouveau client ou la modification d’une adresse), elle est plutôt référentielle.

Les données transactionnelles enregistrent les événements courants et sont généralement modifiées ou créées en grande quantité de manière continue, tandis que les données référentielles sont plus stables.

3. Examiner l'utilisation de la donnée dans les processus métiers

  • La donnée est-elle utilisée pour valider ou enrichir d'autres données ?

    • Les données référentielles sont souvent utilisées comme référence pour valider ou compléter d'autres informations (par exemple, un code produit ou un ID client).

  • La donnée est-elle utilisée pour représenter une action ou un événement ?

    • Les données transactionnelles sont directement liées à des processus métiers comme la vente, l’achat, l’envoi de courriels ou les paiements. Elles constituent la base des opérations quotidiennes de l'entreprise.

4. Vérifier la relation entre les données

  • La donnée est-elle une dimension dans un modèle de données ?

    • Dans un entrepôt de données ou un modèle multidimensionnel, les données référentielles constituent généralement des tables de dimension (exemple : clients, produits, catégories).

  • La donnée est-elle une mesure ou un fait ?

    • Les données transactionnelles constituent généralement des tables de fait (exemple : ventes, commandes, livraisons).

5. Observer la granularité de la donnée

  • La donnée est-elle granulée à un niveau global ou au niveau d’un événement spécifique ?

    • Les données transactionnelles sont souvent très granulaires, capturant des détails spécifiques pour chaque événement ou interaction.

    • Les données référentielles sont moins granulaires et représentent une vue d’ensemble des entités de base (produits, clients).

6. Analyser l’historique des données

  • Les données enregistrent-elles des changements au fil du temps (audit, horodatage) ?

    • Les données transactionnelles sont généralement temporelles, avec des horodatages ou des informations permettant de suivre l’historique d’un événement ou d’une action.

    • Les données référentielles ne stockent pas d’historique d’événements, mais elles peuvent être historisées (sous certaines conditions, par exemple avec une gestion de version) pour des raisons de conformité ou de gestion des modifications.

7. Examiner la source des données

  • Les données proviennent-elles de systèmes transactionnels ou de systèmes de référence ?

    • Les données référentielles sont souvent importées ou extraites de systèmes spécialisés, comme un ERP (pour les données de produit) ou un CRM (pour les données de clients).

    • Les données transactionnelles sont générées à partir de systèmes opérationnels, tels que des systèmes de facturation, de gestion des commandes ou des points de vente.


Conclusion : Synthèse des critères de distinction

tableau distinction data referentiel transactionnel

Questionnaire type :

Voici un exemple de questionnaire type à utiliser pour déterminer si une donnée est de type référentielle ou transactionnelle. Ce questionnaire est conçu pour être utilisé lors de discussions avec les équipes métiers ou techniques, afin de clarifier la nature des données dans un système d’information.

1. Nature de la donnée

  • Q1 : La donnée décrit-elle un objet stable (ex. : produit, client, pays) ou un événement/action (ex. : commande, facture, paiement) ?

    • Stable (entité) ☐

    • Événement ou action ☐

  • Q2 : La donnée est-elle utilisée pour valider ou enrichir d'autres données (ex. : validation d'une commande via un code produit) ?

    • Oui ☐

    • Non ☐

2. Fréquence de mise à jour

  • Q3 : À quelle fréquence la donnée change-t-elle ?

    • Rarement (par ex. : mise à jour occasionnelle d’une entité) ☐

    • Fréquemment (par ex. : lors de chaque transaction ou opération) ☐

  • Q4 : La donnée est-elle générée à chaque fois qu’un événement spécifique se produit (par ex. : création d’une nouvelle commande ou d’un nouveau paiement) ?

    • Oui ☐

    • Non ☐

3. Utilisation de la donnée

  • Q5 : La donnée est-elle utilisée pour suivre des événements historiques (ex. : historique des ventes ou des transactions) ?

    • Oui ☐

    • Non ☐

  • Q6 : La donnée est-elle utilisée principalement pour décrire des caractéristiques constantes (ex. : nom d’un produit, adresse d’un client) ?

    • Oui ☐

    • Non ☐

4. Relation avec d'autres données

  • Q7 : La donnée est-elle utilisée dans une table de dimension (ex. : table de référence comme client, produit, catégorie) dans un entrepôt de données ?

    • Oui ☐

    • Non ☐

  • Q8 : La donnée est-elle utilisée dans une table de faits ou de mesures (ex. : transactions, événements) ?

    • Oui ☐

    • Non ☐

5. Historique et temporalité

  • Q9 : La donnée stocke-t-elle des informations sur un événement particulier à une date donnée (ex. : achat, paiement à une date précise) ?

    • Oui ☐

    • Non ☐

  • Q10 : La donnée conserve-t-elle un historique des modifications (ex. : horodatage d'une transaction ou d'une commande) ?

    • Oui ☐

    • Non ☐

6. Granularité de la donnée

  • Q11 : La donnée est-elle collectée à un niveau très spécifique (ex. : chaque événement est unique et enregistré séparément) ?

    • Oui ☐

    • Non ☐

  • Q12 : La donnée est-elle plutôt générale et stable (ex. : elle représente un ensemble d’informations consolidées) ?

    • Oui ☐

    • Non ☐

7. Source et provenance des données

  • Q13 : La donnée provient-elle d’un système de gestion centralisé (ex. : ERP, CRM) ?

    • Oui ☐

    • Non ☐

  • Q14 : La donnée est-elle générée par un système transactionnel (ex. : système de facturation, POS) ?

    • Oui ☐

    • Non ☐


Analyse des réponses :

  • Si la majorité des réponses cochent "Stable", "Rarement", ou "Oui" aux questions liées à la validation, table de dimension, et entités, alors la donnée est probablement référentielle.

  • Si la majorité des réponses cochent "Fréquent", "Événement", ou "Oui" aux questions liées aux transactions, historique, événements, et table de faits, alors la donnée est probablement transactionnelle.

Sources :

  1. "Master Data Management: Getting Control of Your Data" by David Loshin
    Ce livre est une référence en matière de gestion des données et définit clairement la distinction entre données référentielles et transactionnelles dans un cadre de gestion des données maîtres.

  2. Microsoft Documentation – Data Types in Databases
    Microsoft Learn - Types of Data in Databases
    Cette documentation officielle décrit les différents types de données utilisées dans les bases de données relationnelles, y compris les données référentielles et transactionnelles.

  3. "The Data Warehouse Toolkit" by Ralph Kimball
    Un ouvrage fondamental qui introduit les concepts de tables de faits (données transactionnelles) et de tables de dimension (données référentielles) dans les entrepôts de données.

  4. Gartner Glossary – Transactional vs. Referential Data
    Gartner fournit une distinction claire entre les deux types de données dans leurs définitions en lien avec la gestion des données et les entrepôts de données.

0 comments

Sign upor login to leave a comment

  • 1 499 €

Initiation à l’analyse de données pour les métiers de la finance avec Power BI et Microsoft Fabric

  • 50 Leçons

En seulement 10 heures, apprenez à exploiter Power BI et Microsoft Fabric pour analyser vos données financières, automatiser vos reporting, et créer des tableaux de bord interactifs qui vous feront gagner du temps et vous apporteront des compétences d'analyse supplémentaire dans votre quotidien.