Utiliser la voix comme biomarqueur pour le diagnostic

Les médecins pourraient bientôt disposer d’un nouvel outil pour diagnostiquer des maladies grâce à une base de données canado-américaine de voix humaines à laquelle l’UdeM contribue.

L’intelligence artificielle (IA) pourrait bientôt aider les médecins à diagnostiquer et à traiter des maladies, dont le cancer et la dépression, en mettant à leur disposition le son de la voix de patients. En effet, 12 établissements de recherche de premier plan, dont l’Université de Montréal, travaillent à établir la voix comme biomarqueur à utiliser dans les soins de santé.

Financé à hauteur de 14 M$ US sur quatre ans par les National Institutes of Health (NIH) des États-Unis, le projet est dirigé par le Dr Yael Bensoussan, de l’Université de Floride du Sud à Tampa, et Olivier Elemento, du Weill Cornell Medical College de l’Université Cornell, à New York, ainsi que par six autres établissements d’enseignement et de recherche aux États-Unis et quatre au Canada.

Il s’agit de l’un des quelques projets financés par un nouveau programme des NIH appelé Bridge2AI (un pont vers l’intelligence artificielle). La technologie de la base de données est fournie par Owkin, une entreprise franco-américaine spécialisée dans la biotechnologie et l’intelligence artificielle.

Baptisé Voice as a Biomarker of Health (la voix comme biomarqueur de la santé), le projet vise à enregistrer de manière éthique des centaines de milliers de voix humaines tout en garantissant la diversité et la confidentialité des données des patients. Des modèles d’apprentissage automatique seront ensuite élaborés pour détecter des maladies à partir des changements dans la voix humaine, et ce, à faible coût.

Nous avons demandé à la seule chercheuse principale québécoise du projet, Vardit Ravitsky, professeure de bioéthique à l’École de santé publique de l’UdeM et maître de conférences en santé mondiale et médecine sociale à la Harvard Medical School, de nous en dire plus.

Tout d’abord, quels types de maladies cette base de données pourrait-elle permettre de détecter ?

Les recherches menées à l’aide de cette base de données pourraient nous permettre de mieux déceler les troubles de la voix tels que le cancer du larynx ou la paralysie des cordes vocales ; les troubles respiratoires comme la pneumonie ou les maladies pulmonaires chroniques ; les troubles neurologiques et neurodégénératifs tels que la maladie d’Alzheimer, la maladie de Parkinson, les accidents vasculaires cérébraux ou la sclérose latérale amyotrophique ; les troubles de l’humeur et les troubles psychiatriques comme la dépression, la schizophrénie ou la maladie bipolaire ; et les troubles pédiatriques de la voix et de la parole, qu’on pense à l’autisme ou aux retards de langage. Ces maladies ont toutes été étudiées individuellement et nous savons qu’il y a déjà des preuves scientifiques montrant que des changements dans la voix peuvent y être liés. Mais nous avons besoin de recherches supplémentaires, assistées par l’IA, pour en savoir plus.

Comment les voix seront-elles recueillies ?

Dans un premier temps, la collecte des données sera effectuée par des cliniciens dans des centres médicaux experts grâce à un logiciel basé sur une application. Cependant, au cours des troisième et quatrième années du projet, nous prévoyons recueillir également des données dans des communautés éloignées par le biais du crowdsourcing [production participative]. Nous utiliserons une nouvelle technologie appelée « technologie d’apprentissage fédéré », qui permet d’entraîner des modèles d’apprentissage automatique avec ces échantillons de voix sans qu’ils quittent jamais leur lieu d’origine. Nous montrerons ainsi que la recherche basée sur l’IA peut être entreprise dans plusieurs centres de recherche tout en préservant la confidentialité et la sécurité des données vocales.

L’IA sera-t-elle capable de repérer les variations dans la façon de parler d’une personne et de déclencher des signaux d’alarme ?

L’objectif principal de ce projet est de créer une base de données d’échantillons vocaux de manière qu’elle soit prête à être analysée par l’IA. À terme, celle-ci sera capable de remarquer les différences dans la voix qui sont particulières à certaines maladies. Par exemple, dans la maladie de Parkinson, la voix devient monotone avec une amplitude plus faible. En général, des spécialistes de la voix qualifiés soupçonnent immédiatement la maladie de Parkinson lorsqu’ils entendent ces variations. Mais tous les patients n’ont pas accès à de tels spécialistes. Nous souhaitons faire en sorte que les algorithmes de l’IA soient aussi performants que les spécialistes de la voix afin que cet outil de diagnostic puisse être utilisé dans les régions où les ressources sont limitées. Cela permettrait d’améliorer les résultats pour les patients et de promouvoir l’équité dans les soins de santé.

En quoi ce projet sera-t-il différent de l’utilisation actuelle des données vocales ?

Bien que les travaux préliminaires sur les données vocales aient été prometteurs, les recherches qui en ont découlé présentaient de sérieuses limitations et il a donc été difficile d’intégrer la voix comme biomarqueur dans la pratique clinique. Ainsi, elles ne comportaient que de petits ensembles de données alors que, pour une utilisation clinique, nous avons besoin de preuves solides basées sur un très grand nombre de données.

En outre, les recherches antérieures posaient des problèmes éthiques tels que la question de savoir à qui appartiennent les données vocales, comment protéger la vie privée des patients et comment remédier au manque de diversité. Par exemple, si tous les échantillons proviennent d’une seule ethnie, d’un seul groupe d’âge ou d’un seul sexe, les outils de diagnostic mis au point pourraient se révéler moins efficaces pour les autres. Notre projet permettra de créer une vaste base de données vocales de haute qualité, multi-institutionnelle et diversifiée. Nos données ne seront pas identifiables, ce qui signifie que l’échantillon vocal ne sera pas lié à d’autres données sur le patient, telles que les données démographiques, l’imagerie médicale ou la génomique.

Quelles sont donc les questions éthiques en jeu ?

L’équipe canadienne basée à l’Université de Montréal et à l’Université Simon Fraser – dirigée là-bas par le professeur adjoint Jean-Christophe Bélisle-Pipon, qui est également professeur associé à l’UdeM – se concentrera sur les questions éthiques, juridiques et sociales que le projet soulève. Notre contribution à ce vaste effort sera de réfléchir sur la gouvernance nécessaire pour que tout se déroule de manière responsable. Certaines de ces questions sont nouvelles parce que la voix ne fait pas encore partie des soins cliniques. Il n’existe pas actuellement de normes en matière de pratiques, de règlementations ou de mesures de protection adéquates pour son utilisation. C’est notre équipe qui y travaillera.

Il est presque paradoxal que, parce que les données relatives à la voix sont si faciles à recueillir, les problèmes de confidentialité soient exacerbés par la technologie. Nous devons nous assurer que les données des patients sont protégées et qu’elles ne sont pas utilisées à d’autres fins qu’à des fins médicales. Nous devons construire cette base de données avec des échantillons collectés auprès de diverses populations afin de garantir l’équité dans l’utilisation clinique future de ce biomarqueur. Nous devons concevoir des mécanismes de consentement pour que les patients comprennent pourquoi leur voix est enregistrée et ce qui pourra être fait de leur voix à l’avenir. Nous devons également clarifier les questions liées à la propriété des données vocales : votre voix peut-elle être partagée ou vendue ? Qui peut en bénéficier ? Les données appartenant aux systèmes de soins de santé, aux cliniciens et aux patients peuvent-elles être partagées avec des sociétés commerciales pour la mise au point de modèles d’IA ? Ce ne sont là que quelques exemples de questions éthiques complexes que nous aborderons.

En somme, il s’agit de voir à quel point l’utilisation de cette nouvelle technologie pourrait être révolutionnaire…

Exactement ! Si l’installation est bien développée, cela pourrait représenter le début d’une mission de collaboration internationale, comme le projet du génome humain, où les données vocales seraient utilisées par des milliers de chercheurs, puis – sur la base de ces recherches – par des cliniciens du monde entier. Cela pourrait permettre d’importantes découvertes et améliorer ce que la médecine de précision a à offrir aux patients.

La voix est unique à chaque individu et peut être enregistrée facilement dans des environnements où les ressources sont limitées, de manière rentable et non invasive. Nous espérons créer l’installation nécessaire pour collecter les données vocales d’une manière accessible et éthique afin que les gens se sentent en sécurité lorsqu’ils partagent ces données et les données médicales associées. Imaginez un monde dans lequel vous pourriez vous enregistrer à l’aide d’une application spécialisée sur votre appareil mobile et envoyer le tout à votre médecin comme un outil de diagnostic supplémentaire puissant ! Pensez à quel point cela serait plus facile que de donner un échantillon de sang ou de passer un examen d’imagerie ! C’est ce que nous espérons offrir à l’issue de cet important effort de recherche.

Autre enjeu éthique : cartographier les cellules humaines à l’aide de l’IA

Les professeurs Vardit Ravitsky et Jean-Christophe Bélisle-Pipon sont les chercheurs principaux d’un second projet financé dans le cadre du même programme des National Institutes of Health des États-Unis, Bridge2AI, à hauteur de 20 M$ US, intitulé Cartographie cellulaire pour l’intelligence artificielle (IA).

Ce projet vise à cartographier l’architecture des cellules humaines et à utiliser ces cartes pour permettre une meilleure compréhension de la relation entre le génotype (l’ADN d’un patient) et le phénotype (les problèmes de santé dont souffre le patient).

En génomique, les modèles d’apprentissage automatique sont souvent des « boîtes noires ». Ils recourent aux informations génomiques pour prédire le phénotype, sans expliquer les mécanismes qui sous-tendent cette traduction.

Pour combler cette lacune, ce projet reposera sur trois approches cartographiques complémentaires afin d’enrichir la compréhension de la relation entre la structure et sa fonction. Le projet stimulera la recherche et la mise au point de systèmes d’apprentissage automatique « visibles », qui permettront aux chercheurs et aux cliniciens de comprendre les relations que l’IA révèle.

Les professeurs Ravitsky et Bélisle-Pipon exploreront les moyens d’élaborer ces systèmes d’une manière éthique et digne de confiance.

« Les données vocales et la recherche sur les cartes cellulaires humaines sont deux domaines de recherche émergents et, à l’heure actuelle, il n’existe que peu ou pas de directives quant aux répercussions éthiques, juridiques et sociales de ces travaux », explique Jean-Christophe Bélisle-Pipon.

Il poursuit : « Dans le cadre de ce projet, Vardit Ravitsky et moi-même aurons l’occasion de fournir des conseils à d’autres chercheurs qui créent des ensembles de données qui seront compilés pour être utilisés dans des applications d’IA, mais aussi de tester et de mettre en pratique ces conseils. Notre travail permettra d’anticiper et de relever les défis éthiques tels que l’inclusion, la diversité, la vie privée, le consentement, la propriété et le partage des données, la transparence de l’IA et les préjugés potentiels. »

Vardit Ravitsky conclut : « Nous avons l’intention d’utiliser l’approche de l’enquête éthique à travers un continuum, en commençant par la production de données et la recherche et le développement de l’IA, puis l’adoption clinique des ensembles de données et l’application aux patients. »

Publié le 13 septembre 2022