En raison du développement continu de la médecine et de la quantité énorme de données cliniques collectées lors de sa pratique, il est urgent d’optimiser le temps de travail des cliniciens. Une manière d’y parvenir est d’analyser les données cliniques à l’aide de l’apprentissage automatique et de l’intelligence artificielle (IA) basés sur des modèles prédictifs. Ces modèles prédisent la présence ou l’occurrence future de résultats spécifiques (par exemple, une condition ou une maladie spécifique) avec des entrées spécifiques (par exemple, certaines caractéristiques du patient ou des images médicales, etc.). Bien que les résultats de cette approche soient prometteurs, le développement d’un modèle de prédiction basé sur l’IA nécessite une évaluation minutieuse de la qualité avant qu’il puisse être appliqué dans la pratique quotidienne.
En raison de la sécurité des patients et de la haute qualité de l’analyse réalisée, il est nécessaire de respecter les lignes directrices et les critères de qualité liés au développement, à l’évaluation et à la mise en œuvre des modèles prédictifs basés sur l’IA. Pour faciliter l’accès à ces lignes directrices, un groupe de scientifiques a mené une revue de la littérature basée sur 72 articles sélectionnés et a publié les résultats de leur travail dans le journal Digital Medicine (DOI: 10.1038/s41746-021-00549-7). Sur la base de l’analyse réalisée par Anne A.H. de Hond et al., six étapes ont été distinguées dans le cycle de développement, d’évaluation et de mise en œuvre des modèles prédictifs basés sur l’IA, fournissant ainsi un cadre pour l’adoption responsable de ces modèles en santé.
La première phase de l’implémentation des modèles prédictifs basés sur l’IA est la préparation des données. Cette étape a été abordée dans plusieurs domaines de l’article susmentionné (contexte médical, confidentialité des patients, taille de l’échantillon, représentativité, qualité des données, prétraitement des données et normes de codage des données), dont un résumé est décrit ci-dessous.
Contexte médical
Selon les recommandations de la littérature, avant de développer un modèle prédictif basé sur l’IA, il est recommandé de définir le problème médical et le contexte dans lequel le produit doit être utilisé. Il convient également de mener une enquête approfondie sur les normes de soins actuelles et de démontrer le but légitime de l’utilisation du modèle prédictif basé sur l’IA dans votre domaine. Les besoins des patients doivent également être analysés, tout comme les actions sanitaires entreprises (thérapies et interventions) sur la base des prédictions du modèle. De plus, il est important de se concentrer sur les critères de succès clinique, y compris une analyse des risques potentiels liés aux erreurs de prédiction. À cette étape, les développeurs doivent également évaluer les avantages du modèle prédictif basé sur l’IA, ainsi que les coûts de son développement et de sa maintenance, ainsi que les conséquences de son mauvais usage.
Confidentialité des patients
Toutes les données doivent être stockées conformément aux règles GDPR, PIPEDA et HIPAA, et doivent être en accord avec les régulations locales. Il a également été souligné que, lorsque nécessaire, des spécialistes de la protection des données devraient être consultés. Les auteurs de la publication ont accordé une attention particulière aux données déjà existantes, collectées dans un but autre que celui du modèle prédictif basé sur l’IA, et que l’équipe souhaite utiliser pour développer leur propre produit.
Taille de l’échantillon et représentativité
Certaines recommandations suggèrent de minimiser la quantité de données détenues, d’utiliser le chiffrement, ou de recourir à des méthodes de pseudonymisation ou d’anonymisation. Il est recommandé que la quantité de données collectées soit rapportée et soit suffisamment grande pour atteindre l’objectif spécifique de chaque modèle prédictif basé sur l’IA.
De plus, la représentativité est rapportée comme ayant une grande influence sur l’évaluation et la prévention du biais algorithmique et de la mauvaise calibration. Par conséquent, il est important de fournir des données représentatives de la population cible, y compris une hétérogénéité et une diversité appropriées (moment, lieu et cadre de collecte des données, sexe, âge, ethnicité, antécédents médicaux, et critères d’inclusion et d’exclusion).
Qualité des données
Les données collectées doivent subir une confirmation de haute qualité par l’inspection et la description des données manquantes. Il convient de considérer les erreurs potentielles dans les mesures ainsi que les mécanismes de nature aléatoire et systématique. De plus, il est recommandé de fournir une définition claire et une méthode de mesure de la variable, y compris la spécification des appareils utilisés pour effectuer les mesures. Il est également recommandé de vérifier davantage les données en vérifiant aléatoirement des ensembles pour détecter les erreurs. Les auteurs ont également mentionné les avantages de l’installation d’un processus de correction des erreurs lors de la création et de la mise en œuvre du modèle. Une attention particulière est accordée à la qualité des données, en particulier si elles ont été marquées manuellement. Dans une telle situation, il est recommandé de vérifier soigneusement l’expérience d’étiquetage et de discuter des cas difficiles. Il est préférable de travailler avec des experts indépendants non impliqués dans l’évaluation du modèle prédictif basé sur l’IA lors de cette étape.
Prétraitement des données et normes de codage des données
Les étapes de prétraitement des données doivent être utilisées pour préparer les données pour les phases ultérieures, ce qui peut inclure la division des données collectées en sous-ensembles tels que les ensembles d’entraînement, d’ajustement et de test. De plus, le prétraitement peut inclure l’augmentation des données, la suppression des valeurs aberrantes, le recodage ou la transformation des variables, et l’imputation des données manquantes. Toutes ces procédures doivent être décrites en détail dans la documentation procédurale.
Pour faciliter l’interopérabilité et l’adoption des modèles prédictifs basés sur l’IA dans les établissements de santé, il est recommandé que la gestion des données soit alignée sur des normes de codage appropriées et des protocoles largement acceptés.
L’ensemble du processus de préparation des données est laborieux et exigeant. En plus de la phase de préparation des données, les scientifiques ont également identifié cinq étapes consécutives : développement du modèle prédictif basé sur l’IA, validation du modèle, développement de l’application logicielle, évaluation de l’impact du modèle prédictif basé sur l’IA, et mise en œuvre dans la pratique quotidienne de la santé. En raison de l’intérêt du service de santé pour les nouvelles technologies et des possibilités indéniables des modèles prédictifs basés sur l’IA, de telles études sont d’une grande aide pour les employés impliqués dans le développement, l’évaluation et la mise en œuvre de ces modèles.
Les détails de la préparation des données ainsi que des étapes suivantes de l’implémentation des modèles prédictifs basés sur l’IA peuvent être trouvés dans l’article : Guid
elines and quality criteria for artificial intelligence-based prediction models in healthcare: a scoping review.
Données chez Cardiomatics
Cardiomatics est un dispositif médical certifié (classe IIa) systématiquement vérifié conformément à la norme ISO EN 60601-2-47:2015. Conforme au Règlement Général sur la Protection des Données (RGPD), Cardiomatics garantit la sécurité du traitement des données personnelles. En raison du développement dynamique du produit, les modèles d’IA sont évalués sur différents ensembles de tests. Tant les données que la quantité de données d’entraînement augmentent constamment. Grâce à cela, des inférences sur les performances de l’algorithme sont réalisées sur des données reflétant directement la diversité des patients, mais aussi des enregistreurs Holter. Les signaux annotés manuellement de manière précise, vérifiés par deux spécialistes médicaux indépendants, sont collectés en grands ensembles, qui sont utilisés pour entraîner l’algorithme. Conformément aux meilleures pratiques en matière d’IA centrée sur les données, nous accordons une grande importance au développement des données. En plus de la création de nouveaux ensembles de données, nous améliorons constamment les ensembles de données existants.
Rejoignez la révolution numérique en cardiologie
Les opportunités offertes par l’apprentissage automatique et l’IA en santé sont prometteuses, mais chez Cardiomatics, nous savons très bien que pour développer avec succès des modèles de prédiction complexes basés sur les données, des évaluations attentives de la qualité et de l’applicabilité sont nécessaires avant que ces modèles ne soient diffusés auprès des professionnels et appliqués dans la pratique quotidienne. Nous suivons régulièrement les dernières lignes directrices sur les critères de qualité liés au développement, à l’évaluation et à la mise en œuvre de l’IA.
Dans ce texte, nous avons partagé quelques conseils importants pour ceux qui sont étroitement impliqués dans le développement, l’évaluation et la mise en œuvre des modèles prédictifs basés sur l’IA, y compris les ingénieurs logiciels, les data scientists et les professionnels de santé.
Si vous avez lu ce texte jusqu’au bout et que vous le trouvez utile dans votre travail quotidien, peut-être que Cardiomatics est un endroit idéal pour vous ! Notre équipe ne cesse de croître ! Consultez nos offres d’emploi actuelles !