la reprise

Navigate back to the homepage

Données de santé : s’orienter en 3 minutes

Mathilde Bras, Paul Christophle
5 minutes de lecture

L’épidémie de Covid-19 et le lancement de l’application StopCovid ont mis les données de santé sous le feu de l’actualité. Quelles sont ces données ? Comment sont-elles stockées et par qui peuvent-elles être utilisées ?

Selon la Commission nationale de l’informatique et des libertés (CNIL), les données de santé sont « les données relatives à la santé physique ou mentale, passée, présente ou future, d’une personne physique ». Lorsque je vais chez mon médecin et qu’il prend ma tension, ou bien quand je fais un prélèvement de sang dans un laboratoire d’analyses médicales, toutes les informations collectées et analysées sont des données de santé. Mais ces données médicales ne représentent qu’une partie des données de santé. Il existe un tout autre domaine qui produit, exploite, fait circuler les données de santé : nos smartphones. Voici des repères pour naviguer dans l’univers des données de santé en trois minutes.

1 – Le secteur public collecte des données qui sont utilisées pour l’intérêt public

Les données de santé sont principalement collectées, conservées et utilisées par des administrations publiques. C’est dans cette optique que la France a créé des bases de données dès le lancement de la sécurité sociale, qui ont été rassemblées en 2016 dans le Système National des Données de Santé, le SNDS. Ce système comprend principalement : 1. Le système national d’information interrégimes de l’Assurance Maladie (SNIIRAM) : il s’agit de toutes les données, pseudonymisées, qui proviennent des actes médicaux effectués en médecine de ville ou à l’hôpital (vos feuilles de soin et prescriptions de médicaments par exemple) ainsi que les données de l’offre de soin ; 2. Le Programme de médicalisation des systèmes d’information (PMSI) : il s’agit des données des hôpitaux (mesure de leur activité et de leurs ressources) ; 3. La base CépiDC de l’Inserm qui regroupe principalement causes médicales de décès; 4. Les données relatives au handicap de la Caisse nationale de solidarité pour l’autonomie.

L’épidémie de Covid-19 a déclenché la création de deux nouveaux fichiers, SI-DEP (géré en partenariat entre le ministère de la santé, l’APHP, Santé Publique France, les laboratoires d’analyse et les éditeurs de SI), et Contact Covid (géré par l’Assurance maladie) : 

  1. SI-DEP est une base nominative contenant les tests de détection du Covid-19 réalisés depuis le 11 mai sur la population. Le fichier est rempli par les laboratoires et tous les acteurs chargés de réaliser des tests. 
  2. Contact Covid contient l’ensemble des contacts récents d’un patient contaminé (détecté dans SI-DEP) ; ce fichier est nourri par les médecins eux-mêmes qui doivent recenser les personnes ayant été en contact avec une personne malade.

Ainsi, pour les administrations publiques, l’accès et le traitement des données de santé sont justifiés par leur mission de service public : si l’on souhaite à la fois mieux connaître l’état de santé des populations, améliorer les parcours de soin, lancer des programmes de recherche, ou lutter contre les épidémies comme celle du Covid-19, les pouvoirs publics ont besoin d’accéder à ces données.

Les accès à ces bases sont néanmoins systématiquement contrôlés : la loi prévoit que les accès aux données du SNDS doivent s’effectuer dans « des conditions assurant la confidentialité et l’intégrité des données et la traçabilité des accès et des autres traitements ». La CNIL est chargée de surveiller l’application de ces textes. En cas de méconnaissance de leurs dispositions, les responsables de traitement peuvent faire l’objet de sanctions administratives.

2 – Les données « du public » sont aussi utilisées par des acteurs privés

Les grandes bases de données de santé sont depuis longtemps ouvertes à la société et aux acteurs privés pour différents usages.

D’abord, les structures publiques et privées (à but lucratif ou non lucratif) peuvent accéder à ces données dans l’optique de réaliser des évaluations, études ou recherches comportant un intérêt public. C’est sur cet intérêt public que s’ouvre le rapport de préfiguration du Health Data Hub : « Déterminer des prises en charge adaptées et efficaces pour les maladies rares en agrégeant des observations de sources multiples. Dépister ou caractériser les états précancéreux grâce à l’intelligence artificielle. Développer les essais cliniques virtuels etc ».

Pour toutes ces études et travaux de recherche, l’accès aux données fait l’objet d’un régime d’autorisation préalable strict :

  • Le Comité d’Expertise pour les Recherches, les Études et les Évaluations dans le domaine de la Santé (CEREES) donne un avis sur les demandes d’accès à des données de santé (avis sur la méthodologie, recommandations sur le projet). 
  • Ensuite, le dossier ayant été instruit par le CEREES, il est présenté à la CNIL, qui donne l’autorisation du “traitement” de données et peut aussi diligenter des contrôles a posteriori.

C’est notamment pour faciliter cet accès et éviter la multiplication des procédures qu’a été créé le Health Data Hub, qui doit être la plateforme unique d’accès aux données pour tous ceux qui souhaitent y accéder à des fins de recherche.

Ensuite, l’ouverture d’une partie des données au plus grand nombre - autrement nommée open data - est cruciale pour l’information des citoyens (par exemple en temps d’épidémie), pour la transparence de l’action publique en matière de santé et pour la lutte contre la corruption. Quelques exemples de bases de données qui sont disponibles au grand public :

  • La base transparence santé, qui rend accessibles les informations relatives aux liens d’intérêts entre les entreprises (laboratoires par exemple) et les professionnels de santé. Cette base a été mise en place à la suite de l’affaire du Médiator. https://www.transparence.sante.gouv.fr ;
  • Les données de Santé publique France, relative à l’épidémie de Covid-19, mises à jour quotidiennement et présentées aux citoyens sur la forme d’un tableau de bord : https://www.gouvernement.fr/info-coronavirus/carte-et-donnees. Les données brutes sont accessibles ici sur le site data.gouv.fr
  • Enfin, il existe des systèmes de collecte anonyme de données pour effectuer des recherches. C’est le cas des données issues du questionnaire d’orientation dans le cadre de l’épidémie covid-19, utiles pour des recherches en épidémiologie.

3 - Des données de santé sont aussi collectées par les entreprises privées pour un usage commercial

A côté de ce système public, d’autres données de santé sont collectées par le privé quotidiennement, notamment via nos smartphones et objets connectés (montres, capteurs etc.). Les grandes entreprises du numérique ont parfaitement identifié les potentialités des données de santé dont elles espèrent bientôt tirer une importante part de leurs revenus. Selon une étude publiée en avril dernier, Apple pourrait par exemple réaliser plusieurs centaines de milliards de chiffre d’affaires dans la santé sur les dix prochaines années, en facturant le stockage dans son cloud et les logiciels d’analyse des données.

La commercialisation des données de santé est interdite par la loi française. Mais les données utilisées par les grands acteurs du numérique sont transmises avec le consentement de leurs utilisateurs et échappent à la définition large des données de santé. Au-delà des géants américains du numérique, les compagnies d’assurance et mutuelles de santé ont également des intérêts importants à pouvoir accéder à des données, nominatives ou anonymisées, des utilisateurs de leurs apps ou d’objets connectés.

Ces données collectées par des acteurs privés peuvent aussi être utiles aux acteurs publics, comme l’illustrent les plateformes de prise de rendez-vous médical ou de télé-consultation qui détiennent des données pertinentes pour analyser l’offre de soins sur le territoire, identifier des pics d’activité dans certaines professions médicales, etc. C’est la notion de données d’intérêt général qui pourrait être mobilisée pour que des services créés par des acteurs privés reversent des données utiles aux politiques publiques de santé.

Enfin, la santé est devenue l’un des principaux domaines d’application pour des technologies d’intelligence artificielle, parce que c’est un secteur qui a historiquement produit et conservé de très grandes quantités de données. Les usages de l’intelligence artificielle sont nombreux : des chatbots (agents conversationnels) pour aider les patients à s’orienter aux algorithmes de diagnostic de telle ou telle fracture ou maladie, en passant par les outils de médecine prédictive ou de visualisation d’épidémies. Plus qu’ailleurs, l’innovation technologique doit être encadrée en matière de santé, afin de garantir le respect de l’éthique et des droits fondamentaux.

Mathilde Bras, Paul Christophle, La Reprise

Plus d'articles de la reprise

Mentions légales Nous utilisons des cookies pour savoir combien de personnes visitent ce site
Link to $https://twitter.com/lareprisefrLink to $https://www.facebook.com/lareprisefrLink to $https://www.youtube.com/channel/UCexUhiK5DI16UnYQ5UjFDVQLink to $https://www.linkedin.com/company/la-reprisefr