Microsoft heeft zijn vorige maand aangekondigde kleine taalmodel Phi-4 onder opensourcelicentie uitgebracht. Het model staat op HuggingFace en is bruikbaar in programma's van derden door de stap.
/i/2007173780.png?f=thumblarge)
De opensourcerelease komt daarmee later dan gedacht, want bij de aankondiging in december zei Microsoft dat het binnen een week zou gebeuren. De release is onder een MIT-licentie. Phi-4 is een stuk groter dan voorganger Phi-3 mini, dat 3,8 miljard parameters telt: Phi-4 heeft er 14 miljard. De data liep tot juni vorig jaar. Veel kleinere modellen houden het bij enkele miljarden parameters, omdat ze op die manier op weinig krachtige hardware zoals telefoons en minicomputers kunnen draaien.
Het model is volgens Microsoft gericht getraind met output van andere modellen en geselecteerde documentatie zoals academische boeken en Q&A's. Bovendien heeft er veel finetuning plaatsgevonden om goed te luisteren naar prompts en om binnen de regels te blijven. Het model werkt voornamelijk in het Engels, zo zegt Microsoft, en is minder geschikt voor gebruik met andere talen.