Ontwikkelaar zet taalmodel in kernel en draait dat zonder toevoegingen

Een jonge ontwikkelaar heeft een demonstratie online gezet van een taalmodel dat draait in de kernel van een besturingssysteem. Dat werkt helemaal in C en heeft geen externe library's of programmeertalen nodig.

Het project van Ethan Zhang heet KernelGPT en het enige doel ervan is het genereren van namen, meldt Hackaday. Het besturingssysteem is te booten in QEMU en het enige dat daarna gebeurt is dat KernelGPT een lijstje namen genereert op basis van namen in de trainingsdata. Het is gebaseerd op MicroGPT. Daaruit komt het bestand names.txt, dat KernelGPT in het geheugen plaatst zodat er geen bestandsstructuur nodig is.

De ontwikkelaar baseerde de kernel op MooseOS, een zelfontwikkeld lichtgewicht besturingssysteem. Daar stripte Zhang onder meer de gui uit, zodat alleen de kernel overbleef om het taalmodel in te kunnen zetten. De ontwikkelaar zegt zelf ook dat de toepassing 'niet praktisch' is, maar is alsnog blij dat het is gelukt om het te laten werken.

Door Arnoud Wokke

Redacteur Tweakers

03-03-2026 • 13:37

19

Reacties (19)

Sorteer op:

Weergave:

Ik snap het niet helemaal, wat is hier anders aan dan het door de kernel random laten uitspuwen van de namen in names.txt? Kan een taalmodel dit beter? Er valt toch niets te voorspellen aan wat de volgende naam zou moeten zijn?
Oh jawel.

De output is niet een random sample uit names.txt, maar iets wat volgens de trainingsdata heel waarschijnlijk een naam is of zou kunnen zijn. Op https://karpathy.github.io/2026/02/12/microgpt/ vind je een lijstje van voorbeelden:
sample 1: kamon
sample 2: ann
sample 3: karai
sample 4: jaire
sample 5: vialan
sample 6: karia
sample 7: yeran
sample 8: anna
sample 9: areli
sample 10: kaina
sample 11: konna
sample 12: keylen
sample 13: liole
sample 14: alerin
sample 15: earan
sample 16: lenne
sample 17: kana
sample 18: lara
sample 19: alela
sample 20: anton\
Sommigen zijn echte namen, sommigen zijn verzonnen namen die qua patroon best wel eens een naam zouden kunnen zijn.
Sommigen zijn echte namen, sommigen zijn verzonnen namen die qua patroon best wel eens een naam zouden kunnen zijn.
Alle namen zijn verzonnen. ;)

[Reactie gewijzigd door The Zep Man op 3 maart 2026 16:39]

"omdat het kan" is het enige antwoord op je vraag vrees ik.
Het punt is denk ik vooral een taalmodel te bouwen zonder externe dependencies. Nut heeft het niet, en het bewijst ook niks nieuws.
Valt dus zo goed als onder de categorie .Geek...
Daarom werd het ook gepost om 13:37
Auteurarnoudwokke Redacteur Tweakers @borgonjonm3 maart 2026 13:54
yes je hebt me door :*)
Ik voel mij heel dom nu maar 13:37?
31337 (H4XØR), ofwel Elite (Hacker). Een vroege internetterm voor een zeer capabel iemand/hacker.

Een beetje de tegenhanger van "Leeroy Jenkins!"

[Reactie gewijzigd door pagani op 3 maart 2026 14:18]

Back Orifice, ooit is iemand gek mee gemaakt met wie ik internet deelde.

Helaas had ik daarna even geen internet meer, lol
leet hacker = 1337 H4x0r

dat is wel vrij geek toch.. :)
Althans, dat was het 25jr geleden..
oh, thnx man! weer wat geleerd :)
Google even naar 1337
Grappig! Ondanks dat het inderdaad (zoals hij dus zelf ook zegt) niet heel nuttig is, is het wel goed dat dit soort dingen gedaan worden. Ze laten mogelijkheden zien, en het kan zomaar dat er volgende week iemand een toepassing bedenkt die wel nuttig is. Zo werkt innovatie nou eenmaal.
nog even en een taal model is/wordt de kernel en voert uit wat je via de prompt wil uitvoeren als os, gui, server en db, etc.
Voor de mensen die, net als ik, MooseOS niet kende en meer willen weten (en vooral code): https://github.com/appleroll/moose-os
De ontwikkelaar baseerde de kernel op MooseOS, een zelfontwikkeld lichtgewicht besturingssysteem. Daar stripte Zhang onder meer de gui uit, zodat alleen de kernel overbleef om het taalmodel in te kunnen zetten.
Ik wilde een grapje maken in de geest van "Alles wat oud is wordt ooit weer nieuw" en "De jaren 80 hebben gebeld en ze willen hun OS-ontwerp terug" maar dat blijkt opzet te zijn. De auteur omschrijft het zelf als een OS in de stijl van de jaren 80.

Voor mij is het nieuws hier vooral dat er een ultracompacte versie van GPT is, kort genoeg dat je er zo even doorheen leest. Dat die gecombineerd is met (het skelet van) een kernel is vind ik niet heel spanned. Dat kun je in principe met ieder stuk software doen maar er zijn een hoop goede redenen waarom we dat niet meer doen.
@arnoudwokke de site heet gewoon Hackaday, aan elkaar.

https://hackaday.com/about/

Om te kunnen reageren moet je ingelogd zijn