Er is een Nederlands taalmodel gebaseerd op Mistral-7B offline gegaan nadat Stichting Brein contact had opgenomen. Het is onbekend om welk model het precies gaat. Het is het tweede taalmodel in korte tijd dat offline gaat.
De maker had het model getraind op 'miljarden tokens aan Nederlandstalige literatuur, nieuws en studieboeken'. Brein vroeg naar eigen zeggen om welke data dat ging, waarna de maker het model offline haalde. Het is op een Mistral-7B gebaseerd model, maar Brein noemt de naam niet. Vorige week ging GEITje offline na een verzoek van Brein.
Brein wil dat makers van modellen een vergoeding betalen als zij materiaal van auteursrechthebbenden gebruikt hebben voor training. Dat is in de AI-wereld lange tijd niet gebruikelijk geweest: ook grote bedrijven als OpenAI en Anthropic hebben het web gescraped. Onder druk van mogelijke rechtszaken hebben zij wel veelal deals gesloten met grote mediabedrijven.