De nombreuses entreprises réalisent des inversions importantes sur les plates-formes de données modernes. Sans embargo, il existe une question clé : qui est vraiment efficace dans cette architecture de données ? Et, sur tout, comment puis-je méditer sur cette efficacité en matière de données basées sur les données ? Sans indicateurs clairs de rendu, les organisations s’appuient sur des estimations approximatives ou sur des attentes qui ne se produisent pas encore lors de l’utilisation réelle des données.

Avant cette question, la société Denodo propose un cadre de médecine basé sur quatre indicateurs clés qui permettent d’évaluer si une architecture de données contribue à générer des entrées à partir des données ou si, par contre, cela génère des coûts sans que cela résulte évident.

Indicateur 1 : Temps d’obtention d’informations utiles (Time to Insight)

Le premier indicateur que Denodo propose d’évaluer l’efficacité d’une architecture de données à mi-temps transcurre à partir de laquelle les données sont générées brutalement jusqu’à ce que ces données se transforment en informations utiles pour les opérations quotidiennes, l’analyse stratégique ou les applications d’intelligence artificielle basées sur données.

Lorsque ce processus s’agrandit, il se peut que les données soient stockées dans des silos ou que l’architecture des données soit fragmentée. Dans ce cas, il est nécessaire de répliquer les données à grande échelle, intervenir manuellement dans les processus de données ou ajouter des étapes d’intégration de données complètes. Les conséquences les plus importantes du cadre technique : lorsque les informations dérivées des données sont tardives, les décisions sont rejetées et les entreprises perdent en compétitivité.

Pour médirlo, il est recommandé de calculer quand tardivement est disponible les informations utiles basées sur les données pour l’utilisateur final qui le sollicite. Ce « temps d’entrée » de données peut être analysé dans les tableaux de bord, les modèles analytiques et les applications d’intelligence artificielle, ce qui permet de détecter de meilleures améliorations dans les processus de données et de comparer les résultats avec d’autres outils ou lors des essais de nouvelles plates-formes de données.

Indicateur 2 : Productivité en ingénierie des données

Le deuxième KPI défini par Denodo est au centre de l’un des aspects qui influencent le plus le coût total des plates-formes de données : la productivité des équipes d’ingénierie de données. Lorsqu’il est habituel d’intervenir manuellement dans les processus de données ou de réajustements, il faudra s’occuper des structures de données fragmentées, des pipelines de données dupliqués ou d’une faible réutilisation des produits de données existants.

Cette fragmentation dans la gestion des données a également des conséquences négatives sur des aspects fondamentaux du contrôle de l’accès aux données et de la confidentialité des données. Éléments qui sont obligatoires à tenir en compte pour pouvoir fournir dans la production les produits de données qui sont établis.

Cet indicateur peut être consulté à partir des heures d’ingénierie nécessaires pour intégrer de nouvelles sources de données ou télécharger de nouveaux produits de données. Vous pourrez également analyser la relation entre le travail de gestion des données et le travail de développement qui apporte de la valeur à partir des données.

Indicateur 3 : Rentabilité de l’infrastructure

La réplication inefficace des données, les pertes d’efficacité dans le processus de données consommées pendant un certain temps, les ressources informatiques sobredimensionnées ou les écosystèmes d’outils de données redondants peuvent générer des dépenses inutiles. Par conséquent, le troisième KPI analyse le retour réel de l’infrastructure de données.

Pour cet indicateur, Denodo recommande d’analyser et de calculer le coût total de propriété (TCO), y compris tous les coûts pertinents associés aux données, comme la capacité de calcul, la conservation des données, l’intégration des données, la gestion des outils et d’autres facteurs liés à l’écosystème de données. De plus, évaluer les paramètres du coût par consultation, en cas d’utilisation ou d’utilisateur actif en ce qui concerne les données, permet d’obtenir une vision plus claire de l’efficacité et de l’évolutivité.

Indicateur 4 : Agilité et capacité d’adaptation

Le quatre indicateurs identifié par Denodo correspond à la capacité d’une organisation à s’adapter rapidement à de nouvelles exigences commerciales, à des modifications du marché ou à des exigences réglementaires liées aux données.

Dans le monde numérique, cette capacité dépend de la grande agilité des infrastructures de données, ce qui implique la possibilité de réutiliser les produits de données dans le cadre d’analyses de données distinctes, d’applications d’intelligence artificielle ou d’initiatives commerciales. Lorsque les délais d’exécution de nouveaux projets de données sont trop longs, il suffit de traiter un signal de structures rigides dans la gestion des données.

Un aspect important pour pouvoir réutiliser efficacement les produits de données est que, tant les métadonnées utilisées comme « matière première » comme les propres produits de données, constituent une capacité sémantique de données qui peut être compréhensible par les différents rôles qui interviennent dans le cycle de vie du produit de données, inclus, par bien sûr, les consommateurs de données.

Cet indicateur peut réfléchir à l’évaluation du temps qu’une entreprise tarde à mettre en marche de nouveaux projets basés sur des données, depuis la phase de conception jusqu’à son entrée en production. Vous pouvez également analyser les cas d’utilisation de produits de réutilisation de données partagées et les besoins en matière de développement indépendant des données.

« Médir tous ces indicateurs sont fondamentaux, mais la valeur réelle apparaît lorsque les organisations peuvent être optimisées. Dans de nombreux cas, le problème n’est pas la question des données, mais la complexité des architectures de données qui a du mal à accéder à elles avec agilité », affirme Bernardo Godar, directeur général pour la péninsule ibérique et l’Amérique latine et Denodo. «Pour cela, la gestion logique des données nécessite un papier important pour introduire une capacité sémantique virtuelle entre les sources de données et ceux qui les utilisent, ce qui permet d’accéder aux informations sans dépendre directement de là où elles stockent les données».

A lire également