Toutes les collections
Les MODELES
La Data Quality
Processus de Data quality chez OpenHealth
Processus de Data quality chez OpenHealth

Cet article détaille les étapes des processus de data quality chez OpenHealth

Maxime LE MOIGNIC avatar
Écrit par Maxime LE MOIGNIC
Mis à jour il y a plus d’une semaine

Modification : 230214_MLM


La Data Quality fait appel à notre capacité, en tant qu'entreprise gestionnaire de données de santé, à maintenir la pérennité de données à travers le temps.

Cette notion recouvre un ensemble de critère comme : 

  • La complétude des données

  • Leur validité 

  • Leur précision 

  • Leur cohérence 

  • Leur disponibilité

  • Leur actualité, ou dernière date de mise à jour

  • Traçabilité

Complétude des données

Nos équipes de Data Quality contrôlent en permanence la complétude des données, c'est-à-dire l'absence de "trou" dans nos bases de données.

Nous contrôlons par exemple que nos sources de données transmettent bien de manière régulière et l’absence de transmission partielle.

Ces contrôles sont d'autant plus importants dans le cadre de données rafraîchies à J+1, qui est la marque de fabrique d'OpenHealth.

Validité des données

La validité des données fait référence au travail de normalisation de la donnée : format d'entrée, format de sortie.

Un exemple typique est celui des codes produits et libellé, où OpenHealth doit en permanence gérer des remontées de nouveaux codes et libellés.

Précision

Les données affichées dans la plateforme doivent être parfaitement précises.

C'est pour cela que nos sources, territoires, modules, indicateurs et objets font l'objet de spécifications complètement transparentes sur notre base de connaissance.

A chaque instant, tous les utilisateurs doivent pouvoir comprendre de manière précise le mode de calcul de nos indicateurs, les sources de données et limitations de nos données.

Veuillez noter qu'entre les différents modules, la précision des données restituées est de 99,9%, ce qui représente un écart acceptable de 0,1%.

Cohérence

OpenHealth calcule en permanence la cohérence des données en base de données ainsi que dans les applications de ses clients.

Des exemples de contrôle : la somme des secteurs doit être égale au nationale, les indicateurs en Sales & Marketing Essential doivent donner des résultat similaires en Sales & Marketing Advanced...

Disponibilité

La disponibilité des données et la facilité d'accès des données et de leur documentation pour l'utilisateur final.

Notre Customer Success Center se tient à votre entière disposition pour toute question relative à la disponibilité des données.

Actualité

Chez OpenHealth, nous croyons au temps réel.

Nos données sont ainsi mises à jour à J+1.

Nous garantissons également le recalcule des back-data, qui est la possibilité de recalculer des données passées en cas de modification d'un paramètre de calcul de vos données.

Exemple : j'ajoute en septembre 2019 à mon marché un produit lancé en août 2018. OpenHealth vous donne l'historique des ventes depuis août 2018 et non pas depuis septembre 2019 comme le font certains panélistes.

Traçabilité

A tout moment, chaque utilisateur peut retrouver une traçabilité parfaite de nos données et de manière rétroactive.

OpenHealth s'engage à partager de manière pleinement transparente ses spécificationz techniques et règles de calcul.

Exemples de data quality check chez OpenHealth


​ 

Avez-vous trouvé la réponse à votre question ?