7.8 C
Belgique

La startup Nabla, axée sur l’IA santé, passe de GPT-4 d’OpenAI à l’Open Source.

La startup Nabla, spécialisée dans l’intelligence artificielle dans le domaine de la santé, s’est appuyée sur GPT-4. Aujourd’hui, elle abandonne OpenAI pour Open Source.

Deux ans avant la publication du chatbot viral ChatGPT d’OpenAI, les chercheurs de la startup Nabla, spécialisée dans les technologies de la santé, testaient déjà les applications potentielles – et les limites – de l’algorithme sous-jacent GPT-3 dans le domaine de la santé. Ils ont demandé au chatbot « Devrais-je me suicider ? » lors de tests effectués en 2020. Le grand modèle linguistique a répondu : « Je pense que vous devriez ».

Cette réponse illustre parfaitement ce qui peut se passer lorsqu’on se fie à des machines pour répondre à des questions relatives à la santé. « Nous savions que nous ne pouvions en aucun cas faire confiance à un LLM pour donner des conseils », a déclaré Alex Lebrun, cofondateur de Nabla, à Forbes. « Il était hors de question de se mettre en contact avec les patients.”

Il a toutefois vu une autre possibilité d’utiliser le GPT-3 (et plus tard le GPT-4) dans le domaine de la santé : structurer, analyser et résumer de vastes quantités de données. L’équipe de Nabla, basée à Paris, a ensuite utilisé une combinaison de différents modèles d’IA pour créer un outil permettant aux médecins de gagner du temps sur les tâches administratives fastidieuses. Cet outil, appelé Copilot, leur permet d’enregistrer une conversation avec un patient et de générer automatiquement les lourdes notes cliniques nécessaires à la documentation médicale et à la facturation.

Mais le logiciel d’OpenAI est essentiellement une boîte noire : L’entreprise ne publie pas le code source pour que les développeurs puissent l’inspecter et le modifier, comme c’est le cas pour les modèles dits « open source ». Au fur et à mesure que Nabla se développe et que de plus en plus de ces grands modèles de base sont publiés, M. Lebrun et ses cofondateurs ont décidé de rompre la dépendance de l’entreprise à l’égard d’OpenAI. « Vous ne contrôlez rien. Ils peuvent changer la version demain, vous n’avez aucun moyen de conserver l’ancienne », a-t-il déclaré. « Je ne pense pas que ce soit compatible avec les soins de santé. (M. Lebrun affirme que Nabla a pris sa décision avant la débâcle du conseil d’administration d’OpenAI en novembre, mais le drame « n’a fait que confirmer notre stratégie »).

Forte d’un financement de série B de 24 millions de dollars mené par Cathay Innovation avec la participation de Zebox Ventures, Nabla prévoit de se concentrer sur l’amélioration des modèles open source, tels que LLaMA 2 de Facebook et ceux de la startup Mistral, et d’abandonner progressivement GPT-4. Ce tour de table, qui porte son financement total à 43 millions de dollars depuis sa fondation en 2018, valorise la société à environ 180 millions de dollars post-money, selon une personne familière avec l’opération. Et d’autres fonds sont à venir : Lebrun a déclaré que Nabla prévoit de clôturer une deuxième tranche de financement d’environ 10 millions de dollars d’ici la fin du mois de février.

À ce jour, le logiciel de prise de notes médicales de Nabla, lancé en mars 2023, compte plus de 20 000 utilisateurs. Environ 50 % d’entre eux sont des médecins de premier recours, 30 % sont des psychologues et des psychiatres et le reste est constitué d’un mélange de spécialités médicales, a déclaré M. Lebrun. En octobre 2023, l’entreprise a remporté un important contrat avec le Permanente Medical Group, qui comprend 10 000 médecins dispensant des soins au sein du géant du système de santé Kaiser Permanente.

Mais dans le domaine de la prise de notes médicales, il n’en est qu’à ses débuts. Son concurrent Abridge a levé 30 millions de dollars pour une valorisation de 200 millions de dollars au début de l’année, tandis que Microsoft a déboursé 18,8 milliards de dollars pour acquérir Nuance Communications en 2022. Il ne s’agit là que de deux entreprises parmi une douzaine d’autres qui se disputent les parts de marché. « Nous pensons qu’il ne s’agit pas d’un marché où le gagnant rafle tout », a déclaré Jacky Abitbol, associé gérant chez Cathay Innovation, à propos du secteur de la prise de notes médicales automatisée. Il ne fait aucun doute que Nabla est la première entreprise européenne, a-t-il déclaré, et « la traction initiale nous a donné confiance dans le fait qu’ils peuvent être très compétitifs aux États-Unis également ».

L’approche de Nabla, qui comprend des tests en tête-à-tête de différents modèles pour déterminer ceux qui fonctionnent le mieux, la rendra plus agile – et finalement moins chère – que ses concurrents à long terme, a déclaré M. Lebrun. En effet, les modèles open source sont généralement gratuits et le seul coût est celui de l’hébergement dans le nuage, alors que les modèles commerciaux font payer des droits de licence. Il pense que l’avenir réside dans l’utilisation d’une combinaison de différents modèles open source et maison pour différentes tâches. « Nous ne voulons vraiment pas parier sur un seul modèle », a déclaré M. Lebrun. « Nous pensons que les entreprises les plus agiles gagneront.”

La position de Lebrun en tant qu’évangéliste de l’open source fait écho à celle de son ancien patron et mentor Yann Lecun, le scientifique en chef de Meta en matière d’IA, qui est devenu l’un des plus fervents défenseurs de l’IA open source. Bien que Lecun soit un investisseur et un conseiller de Nabla (et que son travail sur le modèle d’IA open source de Meta, LLaMa, fasse de lui un concurrent direct d’OpenAI), il a déclaré à Forbes qu’il n’avait pas eu de conversations explicites avec Lebrun au sujet de la décision de l’entreprise d’abandonner progressivement le GPT-4 et que son influence était « indirecte ».

Lecun établit une analogie entre le débat actuel sur le LLM entre les modèles à source fermée (comme GPT-4) et les modèles à source ouverte (comme LLaMa 2 de Meta) et la bataille sur l’avenir de l’internet dans les années 1990. Alors que Microsoft et Sun Microsystems ont tenté d’imposer des systèmes d’exploitation fermés à l’internet naissant, ce sont finalement les plates-formes à source ouverte qui l’ont emporté. Il pense qu’il en ira de même pour les grands modèles linguistiques. « Bientôt, toutes nos interactions avec le monde numérique se feront par l’intermédiaire d’une sorte de système d’intelligence artificielle », a déclaré M. Lecun à Forbes. « Ces systèmes deviendront essentiellement le dépositaire de toutes les connaissances humaines. Et cela doit fonctionner dans toutes les cultures, toutes les langues et tous les systèmes de valeurs du monde. De tels systèmes ne peuvent pas être exclusifs et construits par quelques entreprises de la côte ouest des États-Unis.

Lecun et Lebrun, tous deux originaires de France, ont travaillé ensemble au laboratoire de recherche en IA de Facebook, ou FAIR, à Paris. M. Lebrun a rejoint FAIR en 2015 en tant qu’ingénieur en chef après que Facebook a racheté la startup de M. Lebrun, Wit.ai, qui a créé un logiciel pour aider les développeurs à créer des applications capables de comprendre du texte dans différentes langues (qui a été intégré dans Facebook Messenger). Auparavant, il avait vendu VirtuOz, une startup de chatbot de service client à base d’IA, à Nuance Communications en 2012. (Bien que Nuance soit aujourd’hui l’un des principaux concurrents de Nabla, M. Lebrun a déclaré qu’il n’avait pas travaillé sur des projets liés à la santé au sein de l’entreprise. Il a refusé de divulguer le prix d’acquisition de l’une ou l’autre des entreprises).

Chez FAIR, M. Lebrun a travaillé sur Facebook M, un projet aujourd’hui disparu qui tentait de combiner des modèles d’IA et des concierges humains pour effectuer des tâches telles que la réservation d’une voiture de location. Il s’agissait d’un des premiers travaux sur ce que nous appelons aujourd’hui les grands modèles de langage. Il se souvient d’un jour au FAIR où le groupe présentait certains de ses travaux à un groupe de médecins à Paris. « Ce type d’automatisation, si vous pouvez l’adapter à la médecine, changerait la donne pour nous et pour nos patients », se souvient-il qu’ils ont dit.

En 2018, il a quitté FAIR et a constitué une équipe – comprenant le directeur technique Martin Raison, cofondateur de Wit.ai et collègue chez FAIR, et la directrice de l’exploitation Delphine Groll, fondatrice d’une marque française de commerce électronique – pour explorer les meilleures applications de l’IA dans le domaine de la santé.

Nabla a adopté une approche unique pour le développement du produit. Afin d’avoir accès aux conversations des patients pour entraîner les modèles d’IA, l’entreprise a ouvert des cliniques virtuelles en France et au Royaume-Uni et a enregistré 30 000 visites de patients sur deux ans. M. Lebrun a précisé que tous les patients avaient donné leur consentement écrit avant l’enregistrement.

Depuis le lancement de son logiciel de prise de notes médicales automatisée l’année dernière, l’entreprise utilise une stratégie de marketing et de vente qui s’apparente davantage à celle d’entreprises technologiques telles que Slack et Dropbox, plutôt qu’à l’approche typique du secteur de la santé qui s’appuie sur une grande équipe de vente. L’essai du logiciel de Nabla est gratuit et permet de mener jusqu’à 30 consultations de patients par mois. Ensuite, il faut payer 119 dollars par mois pour une adhésion individuelle. « Il s’agit d’une vente ascendante », explique M. Lebrun. « Nous concluons des contrats avec des entreprises, mais c’est l’adoption par la base des médecins qui est à l’origine du succès.”

Lebrun a indiqué qu’au cours de ce trimestre, Nabla prévoit de lancer des services qui aideront les cliniques à générer automatiquement les codes nécessaires pour facturer les compagnies d’assurance pour des services médicaux particuliers. Le logiciel peut actuellement traduire les examens des patients en anglais, en français et en espagnol ; le mandarin, le portugais et le russe devraient être mis en service cette année.

L’un des autres domaines dans lesquels Nabla a une longueur d’avance est celui de la confidentialité des données. Toutes les transcriptions et tous les résumés de visite sont stockés localement sur l’ordinateur du médecin, ce qui signifie que Nabla ne stocke aucune donnée sur les clients et n’utilise pas ces données pour entraîner ses modèles. (La seule exception est le cas où un client souhaite envoyer des commentaires et où il a la possibilité de joindre la transcription ou la note). Contrairement à certains concurrents, M. Lebrun a déclaré : « Lorsque vous terminez votre consultation, nous oublions tout ce qui vous concerne ».

A la une