Flux de données numériques
Les échanges de données standardisés, automatisés et sécurisés permettent de prendre rapidement des décisions sur la base de faits probants, optimisent l’évaluation des mesures et améliorent la transparence.
Objectifs des flux de données numériques
La numérisation des flux de données a pour objectifs de garantir l’interopérabilité des systèmes d’échange de données concernant la santé et d’éviter les ruptures de média. La réalisation de ces objectifs s’appuie sur des processus de traitement standardisés et largement automatisés ainsi que sur une communication des données uniformisée et compréhensible. Pour que les données collectées par les systèmes de surveillance puissent être utilisées de manière efficace, elles doivent être fiables, centralisées et rapidement disponibles. Les évaluations et modélisations statistiques permettent d’identifier des schémas et des tendances dans des jeux complexes de données épidémiologiques. De la sorte, il est possible de :
- prendre des décisions sans délai, sur la base de faits probants ;
- évaluer l’efficacité des mesures ;
- fournir rapidement les informations pertinentes aux autorités compétentes ;
- réduire les erreurs d’appréciation dues à des évaluations statistiques et à des données divergentes ;
- combiner l’utilisation d’informations provenant des systèmes de surveillance dans les domaines humain, animal et environnemental.
Il y a lieu d’appliquer les principes suivants pour garantir la numérisation intégrale des flux de données et une communication des données claire et compréhensible :
- réduction au minimum de la saisie de données (principe de la saisie unique [once only]) ;
- transfert de données en continu sans rupture de média (de bout en bout) ;
- interopérabilité des différents systèmes de surveillance ;
- extensibilité des systèmes de surveillance et des plateformes de données ;
- garantie de la sécurité de l’information et de la protection des données, en particulier pour les données sensibles ;
- mise en œuvre de la Stratégie en matière de libre accès aux données publiques.
Compétences
L’Office fédéral de la santé publique (OFSP) coordonne la collecte et le traitement des données pertinentes, tandis que les cantons sont chargés de la mise en œuvre au niveau régional. Parmi les parties qui fournissent des données figurent notamment des laboratoires, des centres de test, des centres de référence, des médecins, des hôpitaux et des établissements de soins de longue durée.
Préparation à une pandémie
Les projets de numérisation en cours dans le domaine de la surveillance sont complétés par les initiatives de numérisation et d’intégration des systèmes prévues dans le cadre de la révision de la loi sur les épidémies (LEp ; RS 818.101) et du programme visant à promouvoir la numérisation du système de santé (DigiSanté), l’idée étant d’harmoniser les différentes procédures de déclaration sur le plan national. En se fondant sur la révision de la LEp et dans le cadre de DigiSanté, l’OFSP crée une plateforme de déclaration nationale extensible pour surveiller et combattre les maladies transmissibles (NASURE, National Surveillance and Response). À cette fin, des interfaces seront intégrées aux systèmes informatiques des hôpitaux, des cabinets médicaux et des laboratoires, dans le respect des normes internationales.
Stratégie de données
Pour garantir un traitement des données numériques efficace durant la préparation à une pandémie, il faut disposer d’une stratégie dans laquelle les données sont le produit principal. Les éléments essentiels de cette stratégie sont les suivants :
- le recours à des identifiants uniformes et à des normes internationales pour l’échange et la codification des données collectées (p. ex. Systematized Nomenclature of Medicine Clinical Terms [SNOMED CT] et Logical Observation Identifiers Names and Codes [LOINC] afin de coder les résultats des examens et des tests médicaux) ;
- l’utilisation d’un catalogue central de données et d’interfaces visant à améliorer l’interopérabilité et la transparence (comme la plateforme d’interopérabilité I14Y) ;
- la qualité des données ;
- la protection des données.
Collecte et systèmes de transfert de données
La préparation à une pandémie requiert notamment la mise en place d’un système de déclaration entièrement numérique permettant de transmettre toutes les données relatives aux infections soumises à déclaration (déclarations des laboratoires et diagnostics cliniques) via des interfaces numériques clairement définies. La numérisation de bout en bout des flux de données requiert la mise en place d’interfaces automatiques aux stades de la saisie des données brutes et de la préparation des analyses et des statistiques. Le recours systématique à ces interfaces rend obsolète le traitement manuel des données. Il faut que ces systèmes de transmission de données aient une conception technique qui respecte les exigences en matière de protection des données personnelles sensibles. Des identifiants univoques pour tous les acteurs (p. ex. numéro AVS pour les patients) garantissent l’automatisation du traitement des données. Idéalement, les systèmes permettent également l’automatisation de la validation des données. La mise en service de l’interface numérique CH-ELM pour les laboratoires constitue un premier grand pas en avant : la déclaration électronique via une interface, basée sur le format de données standard HL7 FHIR et sur une interface REST, permet aux laboratoires de transmettre automatiquement des informations concernant des maladies soumises à déclaration.
Plateforme d’analyse de données
L’automatisation du traitement des données de bout en bout exige la mise en place d’une plateforme qui se charge de la consolidation, du contrôle de plausibilité et de l’appariement de données provenant de diverses sources. Il faut à cet effet une plateforme d’analyse des données extensible, qui donne la possibilité d’automatiser des pipelines d’analyse de données et les tests afférents, de fournir le codage et de travailler collaborativement sur des codages communs. L’acquisition d’un savoir-faire spécifique en science des données est nécessaire à l’exploitation de cette plateforme et à la mise en œuvre de méthodes modernes développées dans les domaines de la statistique, de la modélisation et de l’apprentissage automatique. Pendant la pandémie de COVID-19, l’OFSP a jeté de solides bases pour la création d’une plateforme d’analyse de données dans le domaine des maladies transmissibles. Cette plateforme sera développée dans le cadre de DigiSanté (Diseases Data Analytics Platform).
Données en libre accès
Conformément à la Stratégie en matière de libre accès aux données publiques de la Confédération, les évaluations statistiques de l’OFSP doivent être publiées sans délai, sous une forme lisible par machine et dans des formats ouverts. Dans le but de rendre ses évaluations facilement accessibles et compréhensibles, l’OFSP développera graduellement son Portail d’information sur les maladies transmissibles, notamment en y ajoutant d’autres pathologies. Pour protéger la sphère privée, il envisage de recourir à des mesures techniques, comme la confidentialité différentielle (differential privacy), et de les mettre en œuvre chaque fois que possible, afin d’atténuer au maximum les risques liés à la protection des données.
Gestion d’une pandémie
Durant une pandémie, il faut disposer rapidement de données fiables et centralisées afin de prendre des décisions fondées sur des faits. Les systèmes de traitement des données doivent être extensibles à plusieurs égards afin de pouvoir absorber les sollicitations extrêmes propres à une pandémie, telles que l’explosion des volumes de données à traiter. Ils devraient ainsi être capables de :
- intégrer de nouvelles sources de données ;
- élargir ou adapter les variables collectées dans les sources de données existantes ;
- augmenter la fréquence et l’étendue des analyses et exploitations de données destinées aux parties prenantes internes et externes.
Pour ce faire, il faut pouvoir adapter de manière souple les ressources à disposition et les priorités à l’évolution de la situation. Les flux de données devraient être définis en fonction des principaux indicateurs nécessaires pour surveiller efficacement l’évolution de la pandémie.
Il est par ailleurs essentiel de respecter le principe d’une utilisation économe des données : toute variable inutile accroît la charge des systèmes, de la saisie à l’analyse. Dès lors, le jeu de données collectées afin de garantir une surveillance ciblée doit être réduit au strict minimum. Lors de la coordination avec les parties prenantes intéressées, il faut garder à l’esprit la nécessité de décharger les systèmes de traitement des données.