Accueil > « Le Big Data en santé : des perspectives nouvelles pour nos systèmes de santé »

« Le Big Data en santé : des perspectives nouvelles pour nos systèmes de santé »

Catherine Commaille‐Chapus
Directrice de la Stratégie d’OpenHealth Company



En santé comme dans tous les secteurs d’activité, les progrès technologiques ont conduit à un accroissement sans précédent de la quantité d’informations recueillies à chaque instant. Selon l’AMIA (American Medical Informatics Association), la production des données de santé devrait être multipliée par 50 d’ici 2020. Ces volumes croissants de données disponibles, alliés à la démultiplication des capacités de traitement et de stockage, font émerger un nouveau paradigme de notre système de santé. Le traitement et l’analyse des données massives, dans le strict respect de la vie privée, ouvrent des perspectives nouvelles, tant dans les domaines de la recherche, de l’épidémiologie, de la prévention, de la veille et la sécurité sanitaire qu’en termes de pilotage de notre système de santé.

Le « big data » se fonde sur la capacité à collecter, agréger et traiter des données issues d’une multiplicité de sources hétérogènes. La variété des données collectées (structurées, non structurées…) et des sources (bases publiques ‐dont SNDS1, bases privées ; données de santé, données d’environnement…), leur volume, la vélocité avec laquelle elles sont recueillies et traitées sont au cœur des démarches de « big data ». La diffusion des objets connectés ainsi que le développement des pratiques de géolocalisation contribuent à l’accroissement considérable du volume de données disponibles.

Ce qui est nouveau aujourd’hui avec les techniques du « big data », c’est cette capacité à agréger et traiter des volumes massifs de données, issues de sources différentes, doublée du fait qu’est désormais disponible un patrimoine de données numériques considérable, tant dans le champ sanitaire (données de soins, données médico‐ administratives, données produites par les patients eux‐mêmes …) que plus largement sur les conditions socio‐économiques, culturelles, environnementales qui sont des déterminants clés de la santé des populations. Ainsi, il n’est plus nécessairement besoin de produire ces données de façon spécifique.

« FINALITÉS COMPATIBLES ET RÉUTILISATION DES DONNÉES AUTORISÉES »

Le Règlement européen sur la protection des données personnelles adopté le 26 avril 2016 consacre du reste, pour la première fois, la notion de “finalité compatible”, autorisant la réutilisation des données pour une finalité autre que celle pour laquelle elles ont été collectées initialement, dès lors que cette finalité est compatible avec la finalité première.

Là où les études en santé nécessitaient jusqu’alors la collecte de données de façon ad ’hoc, sur la base de critères à partir desquels étaient renseignées les bases de données, sur des plages de temps longues et à des coûts souvent élevés, des données produites à l’occasion d’actes de soins ou à des fins de remboursement, ou encore par les patients eux‐mêmes via les objets connectés ou les réseaux sociaux sont désormais disponibles et constituent une source presque inépuisable pour la veille sanitaire, la pharmacovigilance, l’épidémiologie ou le suivi des parcours de soins. Bon usage, détection de signaux cliniques, effets indésirables, identification de schémas thérapeutiques … autant d’indicateurs qui deviennent désormais accessibles en quasi temps réel et à moindre coût.

L’analyse des données est également le support à la création d’algorithmes et de modèles prédictifs, afin de mieux évaluer un risque ou une probabilité de survenue d’un événement et d’en identifier les causalités en vue notamment de le prévenir. L’analyse des données peut par exemple permettre de prédire et donc possiblement de prévenir les réadmissions hospitalières pour des sujets âgés en particulier ; ces indicateurs se déploient aujourd’hui dans un certain nombre d’hôpitaux notamment nord‐américains avec des incitations financières fortes. De nombreux travaux sont également menés sur des modèles de suivi de la propagation spatio‐temporelle des phénomènes sanitaires comme les épidémies à partir de l’analyse des données massives.

« LE RÔLE DES DONNÉES DE SANTE DANS L’AMÉLIORATION DE LA QUALITÉ ET LA PERFORMANCE DES SYSTÈMES DE SANTE »

Les données dites « de vie réelle », c’est‐à‐dire collectées en routine à l’occasion d’actes de soins, présentent également un intérêt fort pour le pilotage des politiques de santé. Pour exemple, la couverture vaccinale des populations à risque contre la grippe saisonnière est en France très en deçà du taux recommandé par l’OMS. Le suivi des données de délivrance de vaccins en temps réel permet potentiellement de mener des actions de communication sur les populations à risque et d’évaluer l’efficacité de chacune des actions.

L’analyse des données de santé est appelée à jouer un rôle croissant pour l’amélioration de la qualité et de la performance des systèmes de santé et la progression de la connaissance scientifique. La réalisation de ce potentiel passe par la mise en place d’une gouvernance et de modes de régulation robustes et modernes, associant les pouvoirs publics, les acteurs de santé, le monde des data‐sciences, les acteurs économiques, pour permettre le plein développement de l’usage des données de santé, dans le respect des principes de confidentialité et de sécurité, au service de la santé publique et des patients.

1 SNDS : Système National des Données de Santé, créé par la loi santé du 26 janvier 2016, et regroupant notamment les données du SNIIRAM, du PMSI et du CepiDC

Retour à la Lettre N°7