Broncode Claude Code is naar verluidt gelekt via npm-register

Anthropic heeft naar verluidt de broncode van Claude Code gepubliceerd via een .map-bestand in het npm-register van het bedrijf. Het bestand verwees volgens de auteur van de GitHub-repository naar een onbeveiligde R2-bucket, een opslagdienst van Cloudflare, waar de volledige broncode kon worden gedownload.

Het lek werd als eerste ontdekt door Chaofan Shou en is inmiddels opgenomen in een GitHub-repository. Volgens de repo zijn 1900 bestanden en meer dan 512.000 regels code uitgelekt. Het gaat onder meer om de tools die Claude Code kan gebruiken, de opdrachten die de bot kan uitvoeren en de communicatielaag die Claude Code verbindt met ontwikkelomgevingen als VS Code en JetBrains.

Het lek bevat ook het bestand QueryEngine.ts, dat ongeveer 46.000 regels code bevat. Dit bestand beschrijft hoe Claude Code verschillende api-calls verwerkt. Het bestand tool.ts definieert alle tools die Claude Code kan gebruiken en commands.tx beheert de registratie en uitvoering van slashcommando's.

Claude Code is de AI-programmeertool van Anthropic. De tool is onder meer te draaien als standaloneprogramma, via de browser of direct in de terminal.

Update, 17.36 uur – De auteur van de GitHub-repository heeft de repository inmiddels aangepast, naar eigen zeggen onder juridische druk van Anthropic. Het artikel is in eerste instantie geschreven op basis van deze versie.

AI, Claude, Anthropic (beeld: Anthropic)

Door Imre Himmelbauer

Redacteur

31-03-2026 • 17:06

77

Submitter: TheNephilim

Reacties (77)

Sorteer op:

Weergave:

Vrijwel direct heeft iemand de source code met AI vertaald naar Python (of rust) https://bsky.app/profile/gergely.pragmaticengineer.com/post/3mieex2i5cc2e. Voelt als een koekje van eigen deeg.
Vrijwel direct heeft iemand de source code met AI vertaald naar Python (of rust) https://bsky.app/profile/gergely.pragmaticengineer.com/post/3mieex2i5cc2e. Voelt als een koekje van eigen deeg.
Waarom koekje van eigen deeg?
Anthropic ligt net als andere AI bedrijven zwaar onder vuur bij makers van content voor copyright / eigenaarschap claims.

Maar deze repository heeft de code herschreven met Python, dus er is geen sprake van auteursrechtenschending en de code kan dan niet worden verwijderd met DMCA or door rechter.

Ik vermoed hierom.
Dus ik mag een copyright boek inlezen en herschrijven?
yep zolang je paraphased en de source vermeld. Of natuurlijk als je het puur als inspiratie gebruikt voor een origineel werk, denk aan bijv Dune en Star Wars etc.

Laatst is er trouwens wel een rechtszaak geweest in de US die bepaald heeft dat een AI zelf geen auteurs rechten heeft en ook geen auteur rechten aan AI gegenereerd werk verleend kunnen worden.
Betekent dat dus, als een bedrijf AI gebruikt om code of iets te generen. Ze automatisch dit niet kunnen beschermen d.m.v. Auteursrecht ?

Dat kan een hele leuke worden.
Zie alleen al maar Youtube wat volstaat met AI gemaakte muziek mixes.. die worden miljoenen keren bekeken in hele korte tijd. De uploader vangt daar gewoon geld aan maar kan niet doen alsof het van hem is. (Kwestie van tijd voordat Youtube dus niet meer uitbetaald)


Of een bedrijf wat software laat schrijven met AI code erin, en iemand pirate die software. In hoeverre is diegene nog strafbaar?
De uploader vangt daar gewoon geld aan maar kan niet doen alsof het van hem is. (Kwestie van tijd voordat Youtube dus niet meer uitbetaald)
YouTube betaalt niet uit op basis van auteursrecht. Uploaders kunnen geld verdienen door advertenties te laten zien voor / na / tijdens hun video. Een video die vaak bekeken wordt heeft dus ook advertenties die vaak gezien worden en levert daarom geld op.

Auteursrecht komt pas om de hoek kijken op het moment dat iemand een DMCA claim doet. In theorie zouden video's gemaakt met AI dus volkomen veilig moeten zijn, omdat per definitie niemand het auteursrecht kan claimen. De praktijk blijkt uiteraard weerbarstiger, zeker wanneer grote partijen (terecht of onterecht) van mening zijn dat een uploader geld verdient aan iets dat hen toebehoort.
Wel met een toevoeging, zolang de laatste artistieke handeling door een mens is gedaan is het niet van toepassing.
Herschrijven als in: jij publiceert de uiteindelijke herschreven tekst? Of publiceer je een vorm van broncode die, indien uitgevoerd of door bepaalde software gerund, de originele (copyright) tekst reprodceert?

Ik weet namelijk zeker dat een zip van een ebook pdf/epub bestand illegaal is, tenzij je de rechten hebt. Ik kan met zo goed een stukje code produceren die diezelfde pdf/epub oplevert indien gerund.

[Reactie gewijzigd door erikieperikie op 31 maart 2026 19:09]

dat is precies wat AI doet als ik vraag om een verhaal te verzinnen over jantje die een vlinder ving.

voor je het weet heeft het 33.000 kinderboeken doorgespit om te bepalen hoe zo'n plot in zijn werk gaat en maakt daarop de basis van een hybride-verzinsel wat wij mensen dan denken dat een nieuwe generative ai creatie is.

het ordinair vertalen van taal a naar taal b zal je nog niet vrijpleiten van copyright-schending maar als je de vertaalde code vervolgens door een andere AI weer herbruikt als bron voor iets nieuws - kom je er misschien nog mee weg ook. reverse engineering uit illegale bron is niet verboden. je praat dan over cleanroom principes waarbij 1 partij de code steelt en documenteert en de ander op basis van die documentatie een nieuwe broncode schrijft en die vervolgens is gevrijwaard van claims omdat 'technische documentatie niet copyright protected is'
LOL! De bijbel laten vertalen door AI naar straattaal 8)7
Daar heb je geen AI voor nodig, dat bestaat al: De torrie van Mattie (het evangelie van Matteus)
Ja en je kunt ook de Bijbel laten filteren en alleen over laten wat feitelijk of historisch onderbouwd is. Je houdt dan zo'n beetje het humanisme over.
Nee, boekvertalingen zijn ook gereguleerd. Zelfde laken en pak.
Of was het een retorische vraag? :)
De uitvoer van een taalmodel wordt niet gezien als creatief werk. De instructie aan het model wordt gezien als een instructie aan een machine, noodzakelijk voor de werking, ook geen copywrite.

Als je de broncode neemt, deze functioneel en de technische laat beschrijven door AI en deze beschrijving gebruikt in om een nieuwe AI imstantie te instrueren om in een andere taal dan de broncode, in een andere architectuur (bijvoorbeeld van object georiënteerd naar script taal) een applicatie te laten bouwen, is er geen copyright op de resultaat code.

En schend die code de originele bron code dus ook niet.

Althans dat is mijn interpretatie, ik ben geen jurist, dit is geen juridisch advies.

[Reactie gewijzigd door djwice op 31 maart 2026 21:35]

Als je aan een AI vraagt om broncode van de ene naar de andere taal te vertalen, pleeg je hoogstwaarschijnlijk nog altijd auteursrechteninbreuk. Het is net alsof je een boek zou nemen in het Engels en dit zelf zou vertalen naar het Nederlands. Dat maakt niet dat je Nederlandse versie ineens vrij is van auteursrecht, want dat recht is een stuk breder dan zuiver de integrale tekst.

Anders zou je elke vorm van auteursrechtenschending kunnen omzeilen door ergens ook maar iets te veranderen, te zeggen dat het werk nu getransformeerd is en daarom vrij van rechten is.
Wat dus erg interessant is aan de regelgeving is dat het direct vertalen wel onder de bescherming valt, maar als je eerst een agent een volledige samenvatting laat maken van de broncode en dat als basis gebruikt om een andere agent een "vertaling" te laten maken, dan is het vrij om te gebruiken. Zo hebben de grote AI boeren het ook graag, anders zouden ze miljarden moeten betalen aan de copyright houders die ze hebben bestolen.
Jij mag inderdaad een samenvatting maken, maar je mag deze niet zomaar publiceren omdat je dan eerst toestemming van de originele auteur/uitgever moet hebben om een afgeleid werk te publiceren.

Als de output (ongeacht of het een vertaling is) teveel overeenkomt met het oorspronkelijk werk, is nog steeds het auteursrecht van toepassing en mag je het dus niet vrij gebruiken.

Daarom mag bijvoorbeeld een artiest ook niet zomaar een cover van een nummer maken ondanks dat men bijvoorbeeld de tekst aanpast (parody) of de muziek style (van pop naar country of EDM) of een boek omzetten naar een luisterboek. Omdat het gaat om een afgeleid werk, kun je het niet zomaar publiceren. Echter ons copyright systeem (thuis kopie) staat het wel toe om het werk in prive sfeer te verspreiden. Daarom mag je bijvoorbeeld een boekverslag wel aan de leraar overhandigen.

Dan is er nog een grijs gebied wanneer een quote of review overgaat in een samenvatting. Dit is vooral gebaseerd op lengte en of de uitkomst wordt verklapt. Omdat auteurs- en copyright recht een aantal tegenstrijdigheden hebben komen veel zaken uiteindelijk dan ook bij een rechter als men het niet in der minne tot een oplossing kan komen...
En toch zijn er twee gigantisch populaire boekenseries die in de basis eigenlijk exact hetzelfde zijn. Typische "hero's journey" verhaallijn.

auteursrecht is zo donders ingewikkeld dat het ook serieuze implicaties heeft voor zaken die er op lijken. Dat is met geschreven werken, maar ook met muziek en bijvoorbeeld schilderkunst. Ook games.

Er zijn gewoon een aantal basis principes waar een stuk aan moet voldoen om goed te zijn. Daarom is het ook te abstraheren naar een categorie, zoals "hero's journey".

In programmatuur is de lettelrijke code nog niet eens zo heel belangrijk. Als dev zie je juist dat er veel meer in de community gedeeld wordt dan je in bijvoorbeeld kunst en muziek ziet. Code die gratis ter bescihkiing wordt gesteld in de vorm van Libraries bijvoorbeeld. Open source code is een groot ding, maar opensource muziek ben ik zelf bijvoorbeeld eigenlijk nog nooit tegengekomen. Bootlegs en remixes worden vaak onder "fair use" geschoven en sampling is gewoon betalen of rechtszaak (of het moet echt oud zijn en public domain worden).
Dat maakt niet dat je Nederlandse versie ineens vrij is van auteursrecht
Nouja, die Nederlandse versie heeft an sich al auteursrecht.
Als je aan een AI vraagt om broncode van de ene naar de andere taal te vertalen, pleeg je hoogstwaarschijnlijk nog altijd auteursrechteninbreuk
De vraag is alleen op welke manier dat gebeurt. "herschrijf deze applicatie in Python" zal eerder een copyright ding zijn dan "maak functionele omschrijvingen van de flows die in deze codebase te zien zijn" en daarna een "gegeven deze functionele omschrijvingen, maak een applicatie die dit gedrag vertoont".

Ik heb toevallig vandaag die exercitie 4 keer gedaan, met een aantal verschillende modellen op basis van een eigen functionele omschrijving en die dan uit laten breiden en aan laten passen zodat er steeds meer afgekaderd wordt. Totaal andere UI UX bij iedere versie en compleet andere architectuur, maar wel allemaal compliant aan de functionele omschrijvingen.
Copyright geeft bescherming tegen onbevoegd gebruik. Afgeleid werk is niet zomaar bevoegd omdat het oorspronkelijke werk herschreven is in een andere taal maar omdat er slechts delen van gebruikt zijn. En dat bewijst de bewering niet. Aan de andere kant tonen de meeste ai-bedrijven ook niet aan dat ze werkelijk maar delen verwerkt hebben om te gebruiken. Maar dat maakt dit geheel vertalen nog niet tot een vergelijkbare verwerking als waar men kennelijk ontevreden over is hoe het bedrijf met andermans content om gaat.
Onzin. Afgeleid werk en dus 100% beschermd door het originele auteursrecht.
Ooit ingelezen hoe de IBM bios werd omgezet naar een technische specificatie door engineer nummer 1 met kennis van de IBM bios en vervolgens deze specificatie heeft overgedragen aan een andere engineer die geen kennis had van de IBM bios, maar wel van hardware, interrupts, etc en de technische specificatie omzette in een functionele bios

Het bedrijf: Phoenix en hun truuk was volledig legaal en bevestigd door het gerechtshof.

En zo draait AI ook om die hete brij heen. AI 1 schrijft een specificatie, AI 2 implementeert de specificatie. Het is nogal een grijs gebied, want beide AI's zijn getrained met code en dat is weer niet te herleiden, etc etc. Maar het juridische vehikel is zeker aanwezig (helaas)
In de serie Halt and Catch Fire wordt op een mooie manier verteld hoe dat in z'n werk ging. Aanrader.
Enige idee waar/hoe deze te kijken? The usual suspects bieden deze niet aan?
Ik zie dat de serie inderdaad inmiddels nergens meer op in Nederland beschikbare streammingdiensten te kijken is, erg vervelend. Dan maar kijken of er ergens nog een mooie dvd set te scoren is of andere middelen die ik hier beter niet kan noemen ;)
Ja, en dat was expliciet niet mechanisch. Daar had je twee gescheidenteams met ingenieurs. Dat was de essentie waarom het legaal was. Daardoor was het geen afgeleid werk.
Maximaal misbruik maken van zaken die niet expliciet beschreven staan in de wetteksten of hogere beroepen. Dat is in principe de essentie van elke bigtech advocaat toch?
Bijzonder dat dit wordt omhoog geduwd want zo kan het toch helemaal niet werken. Er zijn specifieke copyright regels over wat je met iets mag doen, aanpassen, publiceren, commercialiseren. Het is niet omdat je een oorspronkelijk werk vertaalt dat je dat zomaar mag.
Zo werkt dat niet, de pythoncode is op basis van de originele code vertaalt, niet handmatig via reverse engineering opnieuw geschreven. Volgens jouw logica zou een engels boek dat jij vertaalt zonder toestemming van de originele schrijver je zomaar zou mogen pubiiceren, think again...
Vele mensen zien deze AI modellen als het stelen van werk van anderen maar dat is lastig hard te maken doordat de output getransformeerd is. Nu wordt het werk van Antrhopic gestolen en getransformeerd tot iets anders. Ik zie de ironie wel.
"Vele mensen". Het IS diefstal, en in geval van de Anthropic boeven hebben die geschikt. Onderdeel van de schikking is ook het verwijderen van deze boeken uit de trainingset.
De kans lijkt mij heel groot dat het nog altijd het auteursrecht van Anthropic schendt. In Nederland staat dat in artikel 13 van de Auteurswet, een verveelvoudiging is namelijk ook:"iedere geheele of gedeeltelijke bewerking of nabootsing in gewijzigden vorm, welke niet als een nieuw, oorspronkelijk werk moet worden aangemerkt". In de Verenigde Staten is er een vergelijkbare bepaling in de vorm van 17 USC § 106.
Transformeren maakt het niet per definitie legaal idd. Andere voorbeelden zijn misbruik van door werknemer gestolen bedrijfsinformatie door een concurrent, of gebruik van data van bv. KvK door derden voor het leveren van een dienst rondom afgeleide van deze dataset. In laatste geval zou je alles wel kunnen scrapen en aanbieden als dienst (vlg mij was er ook zaak rondom al die meta-zoekengines van veilingsites die opeens niet meer mochten).
nabootsing in geweizigde vorm betekent echter niet dat ik geen hamburger restaurant mag starten met een zooi veschillende kip en hamburgers en kleine stukjes gefrituurde kip in deeg.

ik mag er geen grote gele M op het dak zetten of mijn burger the Big Mac noemen

maar verander ik het concept een beetje en noem ik mijn hamburger de Big Momma en mijn pittige kipburger the Angry Chickin dan is het in het kader van copyright al snel geen Mc Donald nabootsing meer ook al zal dat in de hoofden van gewone burgers[1] totaal anders zijn..


[1]pun intended
Irrelevant. Een bedrijfsconcept wordt niet beschermd door auteursrecht.
Maar een functionele omschrijving van een applicatie ook niet.

De grap is dat iedereen dit namelijk ook gewoon had kunnen doen vanuit de applicatie zelf. Alleen kost dat veel meer werk.

Zo kan ik perfect een conceptuele kopie maken van Spotify vanaf scratch, puur door de functionele omschrijvingen uit te werken naar een applicatie.

Heck, kijk naar Kick.com Dat is een regelrechte kopie van twitch en daar heeft men gewoon nog een bedrijf van weten te maken.
Dit lijkt simpelweg een reguliere source map te zijn. Bij het gebruik van TypeScript of vergelijkbare build-tools leggen deze bestanden de koppeling tussen de uitgevoerde JavaScript en de originele broncode, puur om debugging te vergemakkelijken. Typisch gezien zet je dit inderdaad uit op je productie (of op z'n minst heb je inlineSource uit staan). De betreffende JavaScript code was dus al (waarschijnlijk) lokaal aanwezig (in de betreffende cli.js), dus de logica was technisch gezien al toegankelijk; de source map maakt het alleen een stuk leesbaarder. Een interessante vondst, maar in de praktijk kon je die code hiervoor ook al prima aanpassen en draaien. Niet alsof er "echt" nieuwe code gelekt lijkt te zijn.

[Reactie gewijzigd door AlRoke op 31 maart 2026 18:00]

300 lines aan imports jezus
Volgens Anthropic zelf is het een zeer goed voorbereide 1 April grap. :+

https://www.reddit.com/r/vibecoding/s/l1WTAC8OSG
Lol wat een clickbait. NPM is niet gehackt, alleen het gebruikersaccount dat een specifiek project beheert (axios)
Axios wordt wel door meer dan een half miljoen projecten gebruikt. Waaronder de projecten waa de YouTuber in de video naar refereert, projecten die nagenoeg iedereen wel een keer heeft gebruikt als hun nodeJS applicatie http-berbindingen maakt - wat zo goed als alle nodeJS applicaties doen.

Uiteraard heb ik gecheckt, de NodeJS secirity proxy die ik in 2017 schreef en die sinds dien op honderden websites gebruikt wordt gebruikt Axios niet, maar gewoon de native http-implementatie. Ik kies bij voorkeur geen imports anders dan die bij de taal zelf zitten.

[Reactie gewijzigd door djwice op 31 maart 2026 21:52]

"De broncode" gaat hier om een wrapper, niet om Opus of Sonnet
Gaat het niet om de code van de tool?
Claude Code is de AI-programmeertool van Anthropic. De tool is onder meer te draaien als stand-alone programma, via de browser of direct in de terminal.
Dus het invoerscherm waar je je commando intypt en alle tools die je kunt gebruiken in je AI. Er zijn al vele plugins voor VS Code, dus tenzij Claude Code nog speciale functies heeft, is de meeste functionaliteit al bekend en ook elders op een of andere manier beschikbaar.
Als die code die gehost is binnen enkele uren geport kon worden naar Python, dan lijkt het mij dat het niet zoveel voorstelt.

Zolang het LLM model niet gelekt is, dan is de IP van Anthropic nog veilig. Want dat is hetgeen wat de code genereert en de kennis bevat.
Dat lijkt mij inderdaad de wrapper te zijn. Want de LLM zelf draait op servers en niet lokaal op een apparaat. Claude Code doet requests naar die servers.

[Reactie gewijzigd door Mayonaise op 31 maart 2026 17:51]

En bevat de magische saus voor tool calling. Het zal binnenkort wel een stortregen aan prompt-engineering worden om claude-code gebruikers via tool calling te hacken. Zo van, developer tikt in "Claude, maak in react xyz" -> Claude doet een tool-call met een browser. De resultaten worden omgevormd tot je xyz die je vroeg inclusief een gratis backdoor die ook op de bron stond. Maar hackers vinden dat Claude code ^H niet goed escaped, dus liet claude code de ontwikkelaar alleen het goede stuk zien ter goedkeuring (beetje fictief hoop ik, ik denk dat ^H niet echt zal werken, aan de andere kant: met al dat gevibecode weet het tegenwoordig ook niet meer).
De meeste innovatie van dit jaar vind plaats in de wrappers en niet perse in de LLM
De tool calling is ook al niet meer speciaal. Dat is meer een evolutie van iets als LangChain, wat al sinds het begin van de AI boom aanwezig is. Een tool als OpenClaw zal ook net zo capabel kunnen zijn.
Claude Code is waarom de meeste mensen de afgelopen maanden overstappen naar Anthropic. Het werkt veel beter dan vergelijkbare tools van de concurrentie. Door deze blunder zullen zij nu makkelijker op hetzelfde niveau kunnen komen.
De titel beschrijft ook Claude Code.
Er staat toch duidelijk in het artikel dat het om claude code gaat? Dat is de tool niet de LLM's.
Dat wat op Github staat, is niet de originele gelekte bestanden. Dat mag je immers niet publiceren, want beschermd onder copyright. Maar omzettingen in andere programmeertalen (afgeleid werk) vallen niet onder Amerikaans copyright, dat veel letterlijker opgevat is dan het Europese, en niet het moreel/conceptueel eigenaarschap als basis heeft zoals bij ons. Daarom staat in de bovenvermelde repository het lek, geport van Typescript naar Python (middels Codex).
Dat klopt totaal niet. Elke gecompileerd binary is omgezet in assembly en desondanks beschermd. Geen enkele discussie over mogelijk: automatische vertaling laat het originele auteursrecht in stand. VS en EU zijn daarin identiek.
Er zijn partijen die dat denken te omzeilen (legaal) door een AI op basis van de broncode een instructieset te laten schrijven waaraan een programma moet voldoen. Vervolgens kan een (andere) AI op basis van die instructies de software schrijven. Die software zal niet identiek zijn, maar functioneel wel hetzelfde werken mits je een goede AI hebt. Men claimt dat het schrijven van instructies op basis het origineel niet illegaal is. Harry Potter herschrijven mag niet, maar een lijstje maken waarin je uitlegt dat de hoofdpersoon met een toverstaf magische dingen doet en naar een school gaat wat een kasteel is, dat mag wel. Maak die omschrijving uitgebreid genoeg en een AI zal er iets van kunnen maken. Dan is het geen Harry Potter maar Barry Lotter en dan wordt het wat copyright betreft ineens een stuk interessanter / moeilijker. In veel gevallen hoeft de 'kopie' niet eens 1 op 1 hetzelfde te zijn. Zolang het maar functioneel doet wat het moet doen mag iedere regel code anders zijn.
Dan is het geen Harry Potter maar Barry Lotter en dan wordt het wat copyright betreft ineens een stuk interessanter / moeilijker.
#BarryPooter

Maar dat is meer satire/komedie ;)
Vergeet de beursgang in oktober dan maar....
Zo te zien is nog niet alles gelekt en ik denk dat we daardoor vooral moeten afwachten wat de experts van de code zelf vinden. Uiteraard is het een domme fout, maar ik denk dat deze info best handig kan zijn om het bedrijf op waarde te schatten en te kijken of ze ook handelen naar wat ze zeggen.
dat is "klode"

Zonder gekheid, zou dit een menselijke fout zijn gekomen of is er iets door hun eigen AI 'aangepast'

[Reactie gewijzigd door divvid op 31 maart 2026 17:10]

we gaan het nooit weten denk ik. Beide zijn mogelijk. De LLM maakt ook heel menselijke fouten :)
Het lek bevat ook het bestand QueryEngine.ts, dat ongeveer 46.000 regels code bevat.
Hoeveel regels?!

Daar heb je inderdaad AI voor nodig om alles bij te kunnen houden :X :p
Ze kennen daar niet de DRY methode niet denk ik, haha
WET: Write Everything Twice of We Enjoy Typing

Is ook gewoon een valide strategie. Zeker in zo'n volatiele markt als AI.
WET embraces repetition for initial speed and simplicity, often postponing abstraction until necessary
De AI schrijft de code, dus daar hoef je je niet meer mee bezig te houden.
De LoC is weer een metric geworden. :Y)
Het zijn vooral tools dus hebben veel json overhead.
Ik verwacht dat het sneller is als dat soort files gecompileerd worden tot 1 bestand

Om te kunnen reageren moet je ingelogd zijn