De Nederlandse zorgstart-up Juvoly ontwikkelt een eigen taalmodel om uiteindelijk zorgmedewerkers te assisteren in hun werk. Het model, J1, is gebaseerd op Llama 3.1-8B-Instruct en is getraind op biomedische opensourceliteratuur uit PubMed.
J1 is een taalmodel met 8 miljard parameters dat getraind is op 100 miljard tokens gebaseerd op data uit PubMed. Die gegevens zijn onder een Creative Commons BY-licentie beschikbaar. Het taalmodel is vooralsnog niet opensource omdat het op Meta's Llama 3.1 gebaseerd is en onderhevig aan de bijbehorende licentie. Juvoly-medeoprichter Thomas Kluiters legt aan Tweakers uit: "Op dit moment is Llama het beste model om experimenten op te draaien vanwege de brede ondersteuning." Voor toekomstige releases wil het bedrijf gebruikmaken van modellen met een MIT-opensourcelicentie.
Het model werkt volgens de makers het beste in het Engels, vermoedelijk omdat de trainingsdata en het basismodel ook voornamelijk Engelstalig zijn. J1 moet meehelpen bij klinisch redeneren, ofwel het beantwoorden van medische vragen. Juvoly zegt het model verder te willen ontwikkelen om ook administratieve taken zoals het schrijven van consultnotities en dataverwerking te kunnen ondersteunen.
Het taalmodel beschikt over evaluatietools en 'datacuratiepipelines' om te zorgen dat J1 nauwkeurig medisch inhoudelijke antwoorden kan geven. Het trainen van het model duurde volgens de start-up in totaal 2688 gpu-uren. Onlangs kondigde Juvoly aan dat het twee Nvidia DGX B200-supercomputers in gebruik nam, voor zover bekend als eerste bedrijf in Nederland.