Een omslag voor cybersecurity: Claude Mythos is té goed in lekken vinden

Claude

In de AI-race van de afgelopen jaren was telkens een constante: bedrijven brachten hun AI-modellen altijd meteen uit. Soms was dat alleen voor betalende klanten of in een andere beperkte vorm, maar elk nieuw model was meteen beschikbaar. Dat is anders met Claude Mythos van Anthropic. Het bedrijf besloot zijn nieuwste model niet uit te brengen vanwege het risico op misbruik door hackers.

Tijdens het testen bleek Mythos goed te zijn in het vinden van zerodaykwetsbaarheden, lekken in software die nog niet bekend waren. Dat gebeurde bij alle grote besturingssystemen en browsers. Zo vond het model lekken in OpenBSD die er al decennia in zaten en een lek in FFmpeg dat er al meer dan vijftien jaar in zat. Tot nu toe hadden beveiligingsonderzoekers én geautomatiseerde tools die over het hoofd gezien.

En dus komt Claude Mythos alleen beschikbaar voor aanbieders van software, zoals Amazon en Google. De bedoeling is om dit krachtige model voorlopig buiten bereik van kwaadwillenden te houden, om ze zo een voorsprong te geven bij het vinden en verhelpen van kwetsbaarheden in belangrijke software. Als het vinden van lekken en schrijven van exploits geautomatiseerd kan, wat betekent dat voor de wereld van software en cybersecurity?

Anthropic Claude Mythos

Waarom Claude Mythos niet direct uitkomt

Claude Mythos is niet gemaakt voor het vinden van zerodays, zegt Anthropic. Het is een gevolg van de betere prestaties bij redeneren. Kennelijk was dit een keerpunt in schaal of training van het model, want Opus 4.6 was hier helemaal niet zo goed in. Mythos wel, want het model heeft tijdens de training al duizenden zerodays gevonden. "We hebben duizenden extra ernstige en kritieke kwetsbaarheden geïdentificeerd die we op verantwoorde wijze openbaar maken aan opensourceontwikkelaars en closedsourceleveranciers", zegt Anthropic. "We hebben een aantal professionele beveiligingsbedrijven ingeschakeld om ons te helpen bij dit openbaarmakingsproces. Zij controleren elk bugrapport handmatig voordat we het versturen, zodat we alleen kwalitatief hoogwaardige rapporten naar de ontwikkelaars sturen."

Niet alleen kan Mythos zerodays vinden, maar het kan ook exploits schrijven om misbruik te maken van die lekken, claimt Anthropic. "We hebben gezien hoe Mythos Preview binnen enkele uren exploits schreef waar ervaren penetratietesters volgens eigen zeggen weken over zouden hebben gedaan."

Dat betekent dus dat ook beginners zonder ervaring exploits kunnen gaan maken voor alle software, zo redeneert Anthropic. In handen van kwaadwillenden die zelf al veel kennis hebben, is Mythos mogelijk een nog krachtiger hulpmiddel.

Claude (bron: Anthropic)

Kan Claude Mythos uitlekken?

Anthropic is vaak eerlijk gebleken over de kwaliteiten en gebreken van de eigen Claude-modellen, maar zelfs als het bedrijf in dit geval overdrijft, zullen veel partijen Mythos in handen willen krijgen. Daarom is de toegang afgeschermd, hoewel Anthropic niet immuun is gebleken voor lekken: de broncode van Claude Code lekte onlangs nog uit.

Daarom zijn er maatregelen genomen om de toegang te beperken tot veertig organisaties. Slechts een deel van die lijst is openbaar. De hele lijst houdt Anthropic geheim, maar het zijn in elk geval bedrijven die samen een groot deel van de software van het internet beheren.

Categorie	Organisaties
Cloud & Platform	Amazon Web Services (AWS), Google, Microsoft
Hardware & Chips	Nvidia, Broadcom, Apple
Netwerken & Cybersecurity	Cisco, Palo Alto Networks, CrowdStrike
Opensource	The Linux Foundation
Financiële Dienstverlening	JPMorganChase

Anthropic probeert daarbij Mythos zoveel mogelijk in eigen hand te houden. Mythos is niet te draaien op eigen hardware en de weights blijven geheim. Via Project Glasswing hebben bedrijven toegang, maar dat verloopt via afgesloten enterpriseomgevingen zoals Amazon Bedrock, Microsoft Foundry en Google Vertex AI. Vermoedelijk gelden er ook strenge contracten voor de bedrijven en organisaties om lekken te voorkomen.

Een grote kwetsbaarheid in het verhaal zit in de relatie met de Amerikaanse regering. Die is niet zo goed. Het bedrijf stond zelfs op de zwarte lijst, maar moet daar van de rechter weer vanaf, omdat het geen bedreiging vormt voor de nationale veiligheid van de Verenigde Staten.

De huidige regering van de Verenigde Staten is onvoorspelbaar en is bereid om van alles in te zetten in onderhandelingen, waarbij bedrijven deel worden van het geopolitieke spel. Nu heeft Anthropic laten zien dat het de eigen principes veel waard vindt, maar áls de huidige regering vindt dat een ander land toegang moet krijgen tot Mythos Preview, is het de vraag of Anthropic dat kan tegenhouden.

Een andere vraag is filosofischer van aard: Anthropic heeft nu gekozen welke bedrijven en organisaties wel en geen toegang krijgen tot Mythos. Daar zullen ongetwijfeld goede redenen voor zijn, maar de vraag is ook op basis waarvan die keuze is gemaakt. De focus lijkt bijvoorbeeld te liggen op Amerikaanse bedrijven, of misschien zelfs westerse bedrijven.

Er zijn ook veel techgiganten in andere delen van de wereld, zoals China, die zouden kunnen profiteren van toegang tot Mythos. Het ligt, gezien de waarden van Anthropic, voor de hand dat die geen toegang hebben tot Glasswing, maar dat betekent ook dat een bedrijf bepaalt welke partijen zich wel kunnen voorbereiden op deze nabije toekomst en welke niet.

Omdat dit een nieuw fenomeen is, zijn er geen regels over hoe Anthropic tot die keuze komt. Het ligt voor de hand dat als een volgende doorbraak van deze schaal bij een ander bedrijf ontstaat, de keuze anders zal zijn. Zo heeft Elon Musk andere ideeën over wat goed is voor de wereld, maar die wil xAI voorzien van enorme rekenkracht met zijn Terafab-fabriek. Doorbraken zouden in theorie ook plaats kunnen vinden in China, waar bedrijven als Alibaba en DeepSeek proberen AI beter te maken.

Dit is mogelijk een vraag zonder antwoord, maar het is een gevolg van de AI-race waar veel mensen al over hebben nagedacht. AI-bedrijven met voorsprong hebben macht en daarmee ook een grote verantwoordelijkheid.

En hoe nu verder?

Anthropic schat in dat het zes maanden tot een jaar duurt voordat andere AI-modellen kunnen wat Claude Mythos nu kan. Dat kan grote gevolgen hebben voor aanvallers én verdedigers in cyberveiligheid. Daarom moeten bedrijven ervaring opdoen met het gebruik van AI-modellen voor het vinden van kwetsbaarheden en exploits. "We hebben gemerkt dat het tijd kost voordat mensen deze tools leren kennen en gebruiken. We zijn er zelf ook nog steeds mee bezig. De beste manier om klaar te zijn voor de toekomst is om het heden optimaal te benutten, zelfs als de resultaten niet perfect zijn."

Kunstmatige intelligentie / AI. Bron: Tadamichi/iStock/Getty Images Plus

Zo zal het lastiger worden om alle bugs handmatig te beoordelen, omdat er met de komst van AI-modellen die hier goed in zijn veel meer bugmeldingen zullen zijn. "Naarmate modellen beter worden, zal de hoeveelheid beveiligingswerk drastisch toenemen, waardoor alles wat handmatige triage vereist waarschijnlijk baat zal hebben bij het gebruik van modellen op grotere schaal."

Ook zal het wat vragen van de teams die updates uitbrengen, zegt Anthropic. "Dit betekent dat softwaregebruikers en -beheerders de implementatietijd van beveiligingsupdates moeten verkorten, onder andere door de periode waarin patches moeten worden toegepast te verkorten, automatische updates waar mogelijk in te schakelen en afhankelijkheidsupdates met CVE-fixes als urgent te behandelen in plaats van routineonderhoud. Momenteel worden out-of-bandreleases alleen uitgebracht voor beveiligingslekken die in de praktijk voorkomen, terwijl de rest wordt uitgesteld tot de volgende cyclus. Dit proces moet mogelijk veranderen. Het kan ook nog belangrijker worden dat fixes naadloos kunnen worden toegepast, zonder herstarts of downtime."

Zelfs als de veertig bedrijven in Project Glasswing op tijd klaar zijn voor de toekomst, is de rest van de wereld dat niet. Als Anthropic gelijk heeft en de wereld van cyberveiligheid gaat veranderen met de komst van Mythos en andere nieuwe AI-modellen, dan lijkt het erop dat de wereld daar niet klaar voor is. "Wij vinden het alarmerend dat de wereld op weg lijkt te zijn naar snelle ontwikkeling van systemen die supermenselijke capaciteiten kunnen leveren, zonder dat er sterkere mechanismen zijn ingevoerd om adequate veiligheid in de hele sector te garanderen."

Er is wel licht aan het einde van de tunnel, vindt Anthropic. "Op de lange termijn verwachten we dat defensiemogelijkheden de boventoon zullen voeren: dat de wereld veiliger zal worden, met beter beveiligde software – grotendeels dankzij code geschreven volgens deze modellen. Maar de overgangsperiode zal vol obstakels zitten."

_{Redactie: Arnoud Wokke • Eindredactie: Monique van den Boomen}

IT-banen

Reacties (105)

NiGeLaToR

10 april 2026 08:13

Kritiek is er ook: eens in de zoveel tijd roept men dat ze iets niet kunnen lanceren omdat het té gevaarlijk zou zijn. Zoals 7 jaar terug: GPT-2.

Goed voor de beurskoers en je hoeft er niets voor te lanceren. Vraag is in hoeverre dit grenst aan vaporware of daadwerkelijk superscary evil mastermind AI tech is

JustRob @NiGeLaToR • 10 april 2026 08:38

Je hoeft niet naar het bericht te luisteren, maar moet wel naar de trend kijken. LLMs worden gewoon beter in het detecteren van kwetsbaarheden en nabouwen van malware. Er is genoeg anecdotisch materiaal en bewijs te vinden van security experts die met Opus 4.6 al een heel eind zijn gekomen. Daarnaast zijn een aantal van de claims vrij eenvoudig te repliceren áls Mythos wordt vrijgegeven (zoals de 100% CTF), dat was bij de claims van GPT-2 niet zo concreet.

Maar zelfs als het niet helemaal waar is, ziet de security sector deze trend allang en is het puur wachten tot wanneer dit punt bereikt gaat worden. En organisaties moeten zich daar nú op gaan voorbereiden, maar dat zal 99% waarschijnlijk toch niet doen tot het fout gaat.

verder is het vooral belangrijk dat dit soort tools juist meer een voordeel zijn voor ontwikkelaars dan aanvallers, want als het écht zo goed wordt (of mogelijk als is), dan kan software ook vanaf de grond op veiliger gebouwd worden. Dus het is dan waarschijnlijk een paar jaar even kut met patches en breaches die als een tsunami over ons heen komen, maar daarna zou het allemaal een stuk veiliger moeten worden (theoretisch). Dat is overigens ook wat Anthrophic in hun bericht stelt (en in de laatste alinea vh artikel staat)

Henk1827 @JustRob • 10 april 2026 11:34

het puur wachten tot wanneer dit punt bereikt gaat worden.

Het gaat altijd fout bij dit soort aannames. Je extrapoleert tot een punt waarvan we helemaal niet weten of we dat gaan bereiken. Hetzelfde vehaal met dat alle softwareontwikkelaars zouden worden vervangen door Opus. “Het is puur wachten tot Bitcoin alle centrale banken wegvaagt”. Ander onderwerp, zelfde onzin.

blikje82 @Henk1827 • 14 april 2026 11:48

Sorry, maar de aanname "dit gaat toch nooit gebeuren" is vanuit het oogpunt van cybersecurity een potentiële ramp. Het tegenovergestelde slechts zonde van het geld en de tijd. Zowel quantum computing als A.I. technologie zijn daarin al een tijdje een serieuze dreiging.

Dat is ook niet zo gek want digitale beveiliging is nog meer een illusie dan beveiliging in de echte wereld. Als iemand het echt wil worden er nieuwe lekken gevonden of via infiltratie in open source toegevoegd. In deze is de A.I. eigenlijk niet de dreiging, de dreiging is simpelweg aanwezig in het bestaan van vele lekken. A.I. is de uitkomst om code beter te bewaken, maar als je het nu uitrolt is het een feestje voor de kwaadwillenden.

Iced Maggot @JustRob • 10 april 2026 08:59

Kut is nog zacht uitgedrukt :-)

Als deze zerodays in nieuwe ransomware gaan geïntegreerd worden, gaat er nog veel miserie op ons afkomen.

Hopelijk kan het patchen volgen op het vinden van deze zerodays door ai.
Want patchen zal wss pak trager gaan dan het vinden.

Verwijderd @Iced Maggot • 10 april 2026 12:31

Iedereen die de laatste jaren zijn development heeft afgestemd op kubernetes, containers, pipelines en snelle patching gaat er relatief gezien vlot doorheen gaan. Diegenen die nog zijn blijven hangen in oude excuses "ja maar complex, bang voor dingen breken", gaan nu effectief hun systemen zien breken maar dan wel door exploitatie. Maar goed, die mensen zijn het gewend om in de slachtoffer rol te zitten ipv. ownership te nemen.

elmuerte @Verwijderd • 10 april 2026 13:26

Iedereen die de laatste jaren zijn development heeft afgestemd op kubernetes, containers, pipelines en snelle patching gaat er relatief gezien vlot doorheen gaan.

En exact deze setup is recentelijk meerdere keren succesvol aangevallen met verschillende supply chain attacks. o.a. nieuws: Aanvallers verstoppen infostealer in kwetsbaarhedenscanner Trivy

Iedereen die je verteld dat je simpel over moet gaan naar X en dat dan je problemen magisch opgelost zijn hebben of geen kennis van zaken, proberen je iets te verkopen, of proberen je te misleiden.

"No Silver Bullet"

Nattekat @elmuerte • 10 april 2026 13:34

Ik denk dat bovengenoemde comment niet zo zeer over specifiek over de specifieke technologieën gaat, maar over hoe CI/CD geintegreerd is in een organisatie. Containers in combinatie met Kubernetes kom je daar in de praktijk bijna altijd op uit, maar er zijn meerdere wegen die naar Rome leiden. In mijn organisatie werd er ook op eens van hogerop geroepen dat we naar Kubernetes moeten, en wij hebben ondanks onze hele sterke wens om de processen te moderniseren daarvoor op de rem getrapt.

Iedereen met kennis van zaken zal zeggen dat het een goed einddoel is, maar het pad ernaartoe is minstens zo belangrijk. Het is niet of-of, het is en-en.

Verwijderd @elmuerte • 10 april 2026 16:22

Vandaar ook mijn woordkeuze "relatief gezien vlot". Diegene die dat niet doen daarentegen

Voel je vrij om niet met dev pipelines te werken, kan je het lekker allemaal traag & manueel doen

[Reactie gewijzigd door Verwijderd op 10 april 2026 16:23]

xorpd @Iced Maggot • 10 april 2026 12:38

Als A.I. een exploit kan schrijven, kan het ook deze dichten.

Iced Maggot @xorpd • 10 april 2026 14:32

Al dat vibe coding gedoe :-)

Een patch moet gewoon heel grondig en doordacht getest worden.

Anders krijg je zo van die windows patches die ander zaken breken. En die ze weer moeten intrekken, want meer miserie dan de patch op zich. Daardoor denk ik dat je dat niet zomaar aan AI kan overlaten.

imqqmi

@JustRob • 10 april 2026 12:31

Dus het is dan waarschijnlijk een paar jaar even kut met patches en breaches die als een tsunami over ons heen komen, maar daarna zou het allemaal een stuk veiliger moeten worden (theoretisch).

Tot het volgende model weer meer lekken vind die het vorige niet kon voorkomen/patchen/vinden. Blijft een kat en muis spelletje waarschijnlijk.

Wellicht is het een goed idee om te bekijken of de cloud met al haar aanvals vectoren dan nog wel een houdbare situatie is en of je dat dan nog wel moet willen. Alles binnenshuis heeft ook nadelen maar is dan wel veel meer verspreid.

JustRob @imqqmi • 10 april 2026 14:02

Ik denk dat een cloud vendor meer capabilities heeft om snel patches door te voeren dan een organisatie waar jan de sysadmin-man vrijdagmiddag om 14:00 naar huis gaat om z'n kinderen van school te halen.

imqqmi

@JustRob • 12 april 2026 22:29

tenzij de stroom aan 0 days zo groot is dat er niet tegen te patchen valt.

pietvelleman @JustRob • 10 april 2026 16:04

"dit soort tools juist meer een voordeel zijn voor ontwikkelaars dan aanvallers, want als het écht zo goed wordt (of mogelijk als is), dan kan software ook vanaf de grond op veiliger gebouwd worden."

Ik hoop en verwacht dit zelf ook.

Ik ben geen software expert...
Maar zijn er niet heel veel software/systemen die feitelijk - in de basis - nog gebaseerd zijn op code en architectuur-keuzes uit de jaren 80/90?

Een volledige rewrite is te complex, maar wellicht met de juiste AI tools wordt het straks wel mogelijk. Èn noodzakelijk, omdat "patch op patch" straks niet meer houdbaar is (en nu eigenlijk ook al niet!).

Sommige mensen zijn bang dat veel developpers hun baan verliezen. Ik denk dat de komende jaren er ongelofelijk veel werk op developpers af gaat komen!

bzuidgeest @NiGeLaToR • 10 april 2026 08:37

Heb je wel eens met opus gewerkt? Een volgende generatie die ook maar een beetje beter is, is zeker geen vapor ware.

necessaryevil @bzuidgeest • 10 april 2026 11:01

De term vaporware heeft niets te maken met de prestaties. Vaporware is een product dat aangekondigd is, maar et iiiiiiiiin product dat niet op de markt komt of erg lang is uitgesteld. Wikipedia

Misschien dekt "hot air" de term die je bedoelt.

Amanoo @bzuidgeest • 10 april 2026 19:30

Ik krijg overigens genoeg bullshit uit Opus 4.6. Maar het is zeker niet altijd incompetent. Soms zelfs best heel goed.

bzuidgeest @Amanoo • 10 april 2026 22:14

Alles is afhankelijk van je vraag en hoeveel training er op je vraag is.

Tuurlijk is het niet perfect en niet foutloos, maar het is het beste model of de markt dat ik ken. Alleen gpt 5.4 komt voor mijn doelen in de buurt.

Het beeld word ook een beetje vertekend doordat ik augment code gebruik. Die verrijken de ai met een speciale context engine voor betere begrip van large code bases. Ik heb geen aandelen, maar ik merk dat de extra context db en behoorlijke plus is op de toch al geweldige opus , sonnet, gpt modellen.

Amanoo @bzuidgeest • 11 april 2026 15:05

Wat betreft beste model, ik heb inderdaad wel met Opus het meeste succes van alle AI's.

Augment Code ken ik nog niet. Ik doe soms wel wat dingen met AI zoals Opus binnen een IDE. Onder andere via Antigravity.

Thijzer @NiGeLaToR • 10 april 2026 09:14

Ik volg jouw redenering, en dit is een terechte opmerking, maar ik heb toch het gevoel dat Anthropic anders in elkaar zit dan openAi. Opus 4.6 van Anthropic heeft zijn plaats als coder bewezen, dus het zou goed kunnen dat wat men beweert waar is. Check zelf even het freeBSD CVE bug rapport https://nvd.nist.gov/vuln/detail/CVE-2026-4747 freeBSD wordt beschouwd als een Uber stabiel OS.

Het bijzondere is dat Anthropic of Dario Amodei de oprichter hier soms over schrijft in zijn blog, en dan zijn visie hierop zeer alarmerend is maar weinig tastbaar heeft... Vervolgens komen de releases van de nieuwe modellen en staan alle software ontwikkelaars / gebruikers van Claude code even stil bij hoelang ze nog een job hebben.

elmuerte @Thijzer • 10 april 2026 10:07

freeBSD wordt beschouwd als een Uber stabiel OS

Dat is OpenBSD.

[Reactie gewijzigd door elmuerte op 10 april 2026 10:08]

DrPoncho @NiGeLaToR • 10 april 2026 08:17

Al is het een fractie beter dan Opus, dan is het al geen 'vaporware'.

magic45 @NiGeLaToR • 10 april 2026 09:31

Ik zou je willen aanraden om de System Card van Mythos te lezen dat kan hier.

Met name vanaf pagina 54 heb ik ergens de hoop dat het alleen maar opgeblazen marketing is...zo niet, riemen vast, helm op en ogen dicht....

In our testing and early internal use of Claude Mythos Preview, we have seen it reach unprecedented levels of reliability and alignment, and accordingly have come to use it quite broadly, often with greater affordances and less frequent human-interaction than we gave prior models. However, on the rare cases when it does fail or act strangely, we have seen it take actions that we find quite concerning. These incidents generally involved taking reckless excessive measures when attempting to complete a difficult user-specified task and, in rare cases with earlier versions of the model, seemingly obfuscating that it had done so.

3raser @NiGeLaToR • 10 april 2026 11:01

Het interessante aan vrijgave aan de Linux Foundation is dat je mogelijk aan het aantal fixes van kritieke lekken kan zien of Anthropic heeft overdreven of niet. Mogelijk dat er nog wel wat lijstjes worden vrijgegeven over welke lekken Mythos gevonden heeft.

sdziscool @NiGeLaToR • 10 april 2026 11:11

Kijk, ik begrijp dat we op tweakers graag skeptisch zijn, vooral over dit soort technologieen die (gerechtvaardigd) controversieel zijn. Maar we moeten het niet maar blijven afdoen als 'niets anders dan een taalmodel' en denken dat het allemaal vaporware is omdat chatGPT 3.5 soms fouten maakte. We zitten echt in een stroomversnelling en ik denk niet dat de wereld nog zonder LLMs gaat zijn, behalve als er toevallig iets nog beters om de hoek komt kijken.

Het is tijd om de ogen te openen en gaan accepteren dat die LLMs toch verdomd veel kunnen, goed en slecht. Perfect zijn ze niet, zekers, maar als je hiervan weg kijkt gaat de wereld op gegeven moment langs jou racen zonder dat je er wat aan kan doen.

ThomasBaas @NiGeLaToR • 10 april 2026 12:30

In dit geval is het niet beursgenoteerd dus die reden kan je al wegstrepen, maar zou wel goed voor business kunnen zijn als bedrijven een partij willen kiezen

Klauwhamer @NiGeLaToR • 10 april 2026 13:52

Natuurlijk zal er kritiek zijn en heeft Anthropic een incentive de engine beter voor te doen dan ze is, maar dit document zal iedere tweaker toch doen fronsen. Het is een longread, maar wel een die de moeite waard is. Want het is wel ineens een divisie hoger dan voorheen.

Frij5fd 10 april 2026 08:07

Deze ontwikkeling lijkt me voor open source software problematisch (meer dan voor closed source). Veiligheidsdiensten met toegang tot deze tool kunnen sneller zero day-bugs vinden en daar voordeel mee behalen, terwijl de ontwikkelaars van open source software geen toegang hebben. Bedrijven kunnen voor hun closed source software wel ervan profiteren (tegen betaling uiteraard).

Overigens is Anthropic in de VS in hoger beroep net toch weer in de hoek gezet als staatsonveilig, waardoor overheidsinstellingen van deze tool niet gebruik zouden mogen maken.

bzuidgeest @Frij5fd • 10 april 2026 08:36

The Linux Foundation heeft toegang en kan open source projecten doorlichten. En open modellen als deep seek kunnen het uiteindelijk ook.

Open source kan makkelijk gefixed worden. Closed source moet je maar afwachten en kan je niets mee. Ik denk dat open source dus juist in het voordeel is. De ai kan het gat vinden en meteen dichten voor iedereen.

En er zijn nog steeds genoeg ontwikkelaars die zich te goed voelen voor ai tooling, die hebben wel een probleem straks.

R_Zwart @bzuidgeest • 10 april 2026 08:43

Daarentegen heb je in geval van closed source in een zakelijke omgeving weer de contractuele druk dat gevonden vulnerabilities binnen een bepaalde tijd gefixt moeten zijn. Die hebben wij in ieder geval wel met al onze klanten in de contracten staan. Als je als bedrijf zelf open source SW in je netwerk implementeert moet je maar hopen dat een bug gefixt wordt als je zelf niet de developercapaciteit hebt.

Het is niet zo zwart-wit allemaal.

bzuidgeest @R_Zwart • 10 april 2026 08:48

Contractuele druk? Laat mij niet lachen.

Als je open source implementeert kan je nog fixen anders moet je wachten tot Microsoft of sap of of of reageert, wat voor contract je ook hebt.

MarcMK2 @bzuidgeest • 10 april 2026 10:01

Afhankelijk van de grote van het contract is dit echt wel contractuele druk. Een mkb bedrijf kan dit niet doen maar een fortune 500 kan dit wel afspreken in een contract.

bzuidgeest @MarcMK2 • 10 april 2026 10:02

Ik denk dat je microsoft e.d. te veel credit geeft. Die staan in diezelfde F500

Die F500 zitten net zo vast aan microsoft en volgen is goedkoper dan moeilijk doen.

[Reactie gewijzigd door bzuidgeest op 10 april 2026 10:03]

Stukfruit

Kunstmatige intelligentie

@Frij5fd • 10 april 2026 08:52

Deze ontwikkeling lijkt me voor open source software problematisch (meer dan voor closed source).

Tot er een partij komt die het bekijken van bijvoorbeeld bytecode makkelijker maakt. Dan zit je een niveau lager en pak je er de meeste closed source oplossingen mee.

Uiteindelijk is er altijd een representatie van code te vinden omdat het ook gedraaid moet kunnen worden, dus dat geeft je per definitie een mogelijkheid om er dit soort zaken op los te laten.

Het is waarschijnlijk zelfs makkelijker omdat die representaties compacter zijn.

Bart.net

@Stukfruit • 10 april 2026 12:16

Het gaat er in deze discussie niet over of de code open of closed source is, maar of de ontwikkelaar de financiële middelen heeft om een (potentieel) dure tool te gebruiken.

Bedoel je met het bekijken van bytecode disassamblers zoals de klassieke ida en de moderne DeapDi?

Stukfruit

Kunstmatige intelligentie

@Bart.net • 10 april 2026 12:26

Disassembly is er om het leesbaar te maken voor mensen, dus dat is een vertaalslag die in de toekomst niet eens nodig zou moeten zijn.

Al hangt het met huidige research vaak nog grotendeels af van een "taal" in één of andere vorm. Meer info over hoe het model in dit artikel het aanpakt zou dus interessant kunnen zijn, maar gezien de focus op programmeertaal vermoed ik dat hier nog geen sprake van is.

Voor beiden geldt trouwens ook m'n andere reactie.

xorpd @Stukfruit • 10 april 2026 12:34

Bytecode gemaakt door een compiler is 1 op 1 om te zetten naar een Abstract Syntax Tree. Het voordeel is niet dat het compacter is, maar makkelijker te analyseren (de output van een parser is een AST).

Stukfruit

Kunstmatige intelligentie

@xorpd • 10 april 2026 12:58

Maar dan ga je weer terug naar het land der talen en afgeleiden daarvan. Wat ik bedoelde is iets anders.

Al vermoed ik dat het wel op verschillende niveaus nodig zal blijven, want alleen op basis van rauwe opcodes en varianten krijg je inderdaad niet de fouten op hoger niveau mee.

tedades @Frij5fd • 10 april 2026 09:03

Er is nu natuurlijk veel nadruk op software, maar mochten dit soort modellen ook massaal problemen gaan vinden in hardware dan hebben we ook een groot probleem. Je kunt die problemen soms met een firmware update oplossen, maar in praktijk is zoiets uitrollen kan een uitdaging zijn. Vooral als het een component is dat is gebruikt is in een product die jezelf niet onder beheer hebt. Bijvoorbeeld een bluetooth chip in een draadloze koptelefoon, daar moeten de makers van die koptelefoon een update uitrollen. Als zo'n leverancier dat niet doet of zelfs niet meer bestaat dan gaat dat natuurlijk niet gebeuren.

Maar als er echt een probleem in de hardware zit, een die je niet met een firmware-update kunt oplossen, dan heb je nieuwe hardware nodig. En tegenwoordig is dat bijna niet meer te doen, want een chip redesign kost je bakken met geld. Dus, dan gebruik je maar een andere chip; de oude is dan maar 'stuk'. Waardoor ook een hele reeks (onverkochte) producten waardeloos worden.

xorpd @tedades • 10 april 2026 12:36

Voor zulke gevallen ontwikkelen we een workaround. Zie b.v. de F00F bug.

tedades @xorpd • 10 april 2026 17:42

Ik heb het eerder over dit soort issues: nieuws: Miljoenen bluetoothapparaten met Google Fast Pair zijn vatbaar voor hack

Als er geen patch is of gemaakt kan worden, dan heb je het probleem dat ik omschreef. Als je vandaag een nieuwe chip gaat ontwerpen moet je dus met dit soort scenarios rekening houden. Voordat je chip op de markt is heeft iemand straks al een exploit gemaakt.

Ozzy @Frij5fd • 10 april 2026 11:59

Het is dubbel, want als je Mythos onderdeel maakt van code reviews / pull request proces dan wordt open source (en closed source net zo goed) juist veiliger, omdat het gedetecteerd wordt voordat het zero days kunnen worden.

Het is wel problematisch dat een select aantal bedrijven toegang heeft tot dit soort tools. De organisaties die geheim biljven zullen met een enkele uitzondering de 3 letter enforcement organisaties zijn, hoe slecht ze ook publiekelijk liggen bij de overheid op dit moment.

Dat gevaar zit hem dus vooral in de volgorde. Als het nu publiek wordt, dan zijn hackers er als de kippen bij om gaten in bestaande software te vinden, maar als ontwikkelaars het in kunnen zetten voordat software wordt gedeployed dan is het juist een grote stap in het veiliger maken van software.

En hoewel het complotterig is/klinkt, denk ik dat die eerder genoemde veiligheidsdiensten dit dus liever ook niet algemeen uitgerold willen zien worden, omdat het ook hun werk bemoeilijkt.

ShDT 10 april 2026 08:13

‘Zegt Anthropic‘ staat centraal in dit artikel. Marketingsausje er over heen en voila, Linkedin ontploft. De soep wordt niet zo heet gegeten, toch?

Mjappio @ShDT • 10 april 2026 08:28

De nuance die ik met name mis in dit artikel is het feit dat ik uit andere bronnen opmaak dat het wel om een whitebox gaat. Dat zegt dus zeker iets over de temperatuur van de soep imo.

bzuidgeest @ShDT • 10 april 2026 08:32

De zero days verschijnen in de relevante projecten en ik kan dichtbij komen met de huidige modellen als opus. Het beste wat je er van kan zeggen is dat de hele wereld het straks kan.

l0rien 10 april 2026 08:22

Dit is wel een revolutie op DevSecOps gebied. Huidige analyse tools zijn vaak relatief eenvoudige pattern matchers welke zeker ook laaghangend fruit oppikken maar de betere security analyst wist daar omheen te werken.

Moderne exploits gebruiken vaak combinaties van kleine kwetsbaarheden samen om tot een uitbraak te komen. Als dit nu ook kan met dit soort tools is dat echt nieuwe terrein wat tot nu toe voorbehouden was aan kleine groepen met veel expertise. Zoals altijd kan het voor goed en voor kwaad ingezet worden. De poging de originele ontwikkelaars een voorsprong te geven hoort bij responsible disclosure principes dus volgt Anthropic daarmee standard practices.

M3m3nt0m0r1 10 april 2026 08:17

Leuk zo'n achtergrondartikel, maar heeft iemand enig bewijs dat wat ze beweren ook daadwerkelijk klopt?
Informatie vrijgegeven vanuit het bedrijf zelf zegt niet zo heel veel zonder onafhankelijke testen.

duvekot @M3m3nt0m0r1 • 10 april 2026 08:22

Een aantal voorbeelden die genoemd zijn in het verslag van the Red team:
https://red.anthropic.com/2026/mythos-preview/

Zijn ook al terug te vinden in bug fixes van de software. Het voorbeeld in OpenBSD en FFMPEG zijn bevestigd.

Mania-92 @duvekot • 10 april 2026 08:37

Dat er daadwerkelijke bugs zijn gevonden, die inmiddels gepatched zijn door open source projecten. Bewijst helemaal niet dat deze a) door Mythos gevonden zijn en b) dat andere modellen dat niet zouden kunnen.

duvekot @Mania-92 • 10 april 2026 08:42

Wel als de bug in detail genoemd en geanalyseerd is in dat document van het Antropic Red team .. en dat ze zelf aangeven alleen daarin te kunnen melden in detail als het probleem al verholpen is in de betreffende software.
En ook dat de tijdslijnen van de melding en oplossing kloppen met wat Antropic zegt. Dus er is een onafhankelijke route die de twee aan elkaar koppelt.

Mania-92 @duvekot • 10 april 2026 08:50

Dat bewijst alleen dat anthropic de bug heeft gevonden en heeft gemeld. Niet dat ze deze a) met Mythos hebben gevonden en b) dat het met andere modellen niet zou kunnen.

CoreData @Mania-92 • 10 april 2026 10:59

Jeetje, er zijn toch mensen die altijd van alles moeten denken dat ze fake news verkocht worden…

Mania-92 @CoreData • 10 april 2026 11:41

Ik denk helemaal niet per se dat het fake news is. Het kan prima waar zijn, maar het kan ook niet waar zijn. 'Extraordinary claims require extraordinary evidence'.

Amanoo @Mania-92 • 10 april 2026 19:37

Je mag wel een beetje aannemen dat ze het in ieder geval met een vorm van Claude hebben gevonden. Dat is immers hun ding. En tja, dan kunnen ze Sonnet versie 1 hebben gebruikt, en dus geen Mythos. Maar waarom zouden ze, als ze ook nu hun fancy nieuwe AI hebben?

Of je moet ons willen vertellen dat ze het net de hand hebben gezocht. Dat.... kan, misschien hebben ze hele goede bug hunters ingehuurd om alles te neppen. Maar ik ben niet overtuigd.

:murb: @duvekot • 10 april 2026 08:57

Antropic Red is van Anthropic, Anthropic, de maker van Mythos... zijn zij onafhankelijk?

bzuidgeest @M3m3nt0m0r1 • 10 april 2026 08:31

De lijst van zero days verschijnt in de verschillende open source projecten. Dus ik denk dat er enig bewijs is.

Er is ook weinig reden om te denken dat het onmogelijk is als ik zie wat ik zelf kan met de huidige modellen op het gebied van reverse engineering en decompilatie. Dingen waar ik niet veel verstand van heb maar de ai het zo doet voor mij. Ik hoef alleen te helpen soms door te controleren en verifiëren.

Exploits maken zie ik niet als een onverwachte volgende stap.

coolmos @M3m3nt0m0r1 • 10 april 2026 09:54

Er schijnt wel iets veranderd te zijn:

https://www.theregister.com/2026/03/26/greg_kroahhartman_ai_kernel/

Bart.net

@coolmos • 10 april 2026 12:23

Interessant, ik dacht dat tot nu veel door AI gevonden exploits onzin waren, maar eigenlijk was er al een trend naar steeds sterkere reports. En zoals ik het nu begrijp, haalt Mythos de best verstopte kwetsbaarheden er nu ook uit.

Iced Maggot @M3m3nt0m0r1 • 10 april 2026 08:31

Ai gaat voor grote omslag zorgen qua security

In dit kanaal wordt er ook heel veel aandacht aan besteed

https://www.youtube.com/@IBMTechnology

YouTube: AI ATTACKS! How Hackers Weaponize Artificial Intelligence

is de toekomst

[Reactie gewijzigd door Iced Maggot op 10 april 2026 08:35]

Scribe 10 april 2026 08:41

Vind het persoonlijk erg jammer dat Tweakers een "achtergrond" artikel schrijft wat eigenlijk vooral alleen een hoop marketing onzin van Anthropic herhaalt, de kritische blik ontbreekt naar mijn mening echt in dit artikel.

Er is nu al bewijs dat die OpenBSD bug gewoon ook door vele oudere en kleinere modellen gevonden wordt (https://aisle.com/blog/ai...ythos-the-jagged-frontier).

Doet mij een beetje denken aan dat hele drama toen dat GPT-2 "te gevaarlijk" zou zijn. Uiteindelijk kon het nauwelijks een fatsoenlijke zin vormen

duvekot @Scribe • 10 april 2026 08:58

Hier wisten ze precies waar ze moesten kijken, welk deel van de code het probleem bevatte .. en als ze precies dat deel van de code geïsoleerd aanboden aan hun model vonden ze het probleem ook.

Dus goed om op te kunnen trainen, maar dit is dus gevonden met de kennis van nu, dus NA deze vondst door Mythos.

De echte test was geweest dat ze de volledige codebase hadden gegeven en daarmee OOK dit gevonden hadden.

Goderic @duvekot • 10 april 2026 09:42

Als je de hele codebase bestand per bestand (of functie per functie) geeft is dit wel representatief.

Ik weet niet hoe Anthropic het met Mythos doet, maar er is toch minstens één onderzoeker die effectief zo te werk gaat : https://mtlynch.io/claude-code-found-linux-vulnerability/

armageddon_2k1 @Goderic • 10 april 2026 09:44

Bugs openbaren zich helemaal niet _per functie_. Althans, de complexe helemaal niet. Zeker security bugs niet.

[Reactie gewijzigd door armageddon_2k1 op 10 april 2026 09:44]

Goderic @armageddon_2k1 • 10 april 2026 09:49

Lees het artikel, dit is exact hoe deze onderzoekers te werk gingen.

armageddon_2k1 @Goderic • 10 april 2026 11:57

En daarom is het irrelevant

Goderic @armageddon_2k1 • 10 april 2026 13:35

Net niet, want ze hebben de bugs gevonden. Je moet het gewoon herhalen voor elke functie in de codebase.

Probook8979 @Goderic • 10 april 2026 12:40

Als je de hele codebase bestand per bestand (of functie per functie) geeft is dit wel representatief.

Ik weet niet hoe Anthropic het met Mythos doet, maar er is toch minstens één onderzoeker die effectief zo te werk gaat : https://mtlynch.io/claude-code-found-linux-vulnerability/

Dank, goede link.

Blokker_1999

Wetenschap

@duvekot • 10 april 2026 09:53

Klopt, want dan lees je dit:

We isolated the vulnerable svc_rpc_gss_validate function, provided architectural context (that it handles network-parsed RPC credentials, that oa_length comes from the packet), and asked eight models to assess it for security vulnerabilities.

Als alle modellen in staat zouden zijn om dit in heel de stack te vinden, dan zou deze bug jaren terug al gevonden geweest zijn door LLMs, want LLMs worden ook al weer enkele jaren door zowel security researchers als hackers gebruikt.

Merk ook op dat ze dus informatie meegeven die Mythos vermoedelijk zelf had moeten identificeren zoals wat de functie doet en wat de input ervan is om dat dan te kunnen misbruiken.

Philos31 @Scribe • 10 april 2026 09:03

Ik snap de “wij van WC-eend” reflex, maar alles afdoen als marketing is te makkelijk.

Er is namelijk wél een onderliggende trend die je nu al ziet met bestaande modellen: ze worden steeds beter in reverse engineering, kwetsbaarheden herkennen en zelfs exploit chains opbouwen. Of Mythos nu precies zo goed is als Anthropic claimt, is bijna bijzaak.

De echte vraag is: hoe ver zitten we nog van het punt dat dit breed beschikbaar wordt? En dat lijkt geen jaren meer te zijn.

Wat mij betreft zit het risico niet in hype, maar in onderschatting:
• als dit soort tooling gemeengoed wordt, daalt de drempel voor aanvallers flink
• tegelijk neemt de hoeveelheid bug reports en fixes explosief toe
• en daar zijn de meeste organisaties procesmatig totaal niet op ingericht

Dus ja, er zit marketing in. Maar de ontwikkeling zelf is reëel.
Blind meegaan is onverstandig, maar het wegwuiven ook.

batjes @Philos31 • 10 april 2026 09:37

Nog meer tekens aan de muur dat we de afgelopen jaren massaal security nog niet serieus genoeg hebben genomen.

Er wordt ook maar weer mooi aangetoond dat die oude internet-wijsheden zo gek nog niet waren. Niets is veilig op het internet! Heel leuk dat internet, we zijn het gaan behandelen alsof het allemaal veilig genoeg is. Onze hele levens en alle bedrijven het internet op en nu wordt, niet voor de eerste keer, duidelijk dat het allemaal gehacked kan worden. surprisepikachu.png

1 ding mag ook wel duidelijk zijn, als we hier zelf niet op meegaan, doet een ander het wel en dan zitten we nog steeds met de consequenties.

Er veranderd namelijk niet zo veel, dit soort exploits worden ook zonder AI gevonden. Het gaat nu alleen weer wat sneller.

teemoow @Philos31 • 10 april 2026 09:50

los je de meeste risico's niet op door zo'n tool te draaien VOOR een release? dan moet je nog steeds "het beste tool" hebben zodat aanvallers geen extra bugs vinden, maar het lijkt mij dat na een transitie fase de boel juist veiliger wordt.

OMX2000 @Scribe • 10 april 2026 09:30

Gaat niet alleen om het vinden van een bug, maar wat vooral heel indrukwekkend is is dat Mythos schijnbaar ook zelf de exploits kan maken en uitvoeren. Dat lukte kennelijk met Opus 4.6 nog niet.

Is het marketing? Misschien. Maar ik vind het vooral belangrijk dat onze overheid (lees de 2e kamer) hier vragen over gaat stellen. Want nu is zeer gevoelige en potentieel gevaarlijke informatie in handen van een aantal bedrijven, en mogelijk ook geheime diensten van de VS. En dan zou ik als Nederland graag toegang hebben tot die informatie. Want zo'n beetje alles en iedereen zou hiermee kwetsbaar kunnen zijn, als het waar is.

duvekot 10 april 2026 08:17

De Amerikaanse geheime diensten zullen staan te springen om toegang te krijgen tot deze tools (en de diensten van andere landen ook). Tenzij ze zelf al zo ver zijn, maar mijn vermoeden is van niet.

Misschien daarom zal het Amerikaanse DoD (of is het DoW🤔) misschien nu wel denken .. dit moeten we echt zelf gaan houden.

Ik zie ze nog wel in staat om dit hele model tot een "wapen" te classificeren .. en daarmee feitelijk te "nationaliseren". In het verleden was bijvoorbeeld encryptie ook geclassificeerd als "wapen" en mocht niet ge-exporteerd worden.

Als deze tool echt zo goed is, en alles wijst daar op, dan willen ze dit gaan inzetten om beter te kunnen spioneren en te hacken.

En daarmee komt hun rechtzaken met Antropic in een ander daglicht te staan ... En zijn ze misschien wel blij met de uitspraak dat ze Antropic niet mogen uitsluiten.

CreatiXx @duvekot • 10 april 2026 08:24

Beetje lastig als ze Anthropic hebben geblacklist, je kan niet een bedrijf volledig blokkeren maar toch gebruik willen maken van hun resources. Dit is echt een gevecht op een niveau waar niemand van ons ooit echt de waarheid van zal te weten komen.

bzuidgeest @duvekot • 10 april 2026 08:40

China loopt niet veel achter een zelf in de eu hebben we ai bedrijven. Dit is een wapen dat straks iedereen heeft. Software gaat in hoog tempo veel beter worden. Zoals alle wagens is een voordeel nooit lang voor 1 partij. Verraders ,commerciële belangen, slimme mensen in andere landen etc etc. Wapens verspreiden zich.

batjes @bzuidgeest • 10 april 2026 09:42

Zero days zijn al heel lang een wapen van geheime diensten.

Wat er nu waarschijnlijk meer gaat gebeuren is dat scammers en hackbendes vaker zero days zullen gaan gebruiken.

bzuidgeest @batjes • 10 april 2026 09:47

Wellicht. Maar daar is een "eenvoudige" oplossing voor. We moeten de waarde van gegevens in onze maatschappij aanpassen.

Het dwaze idee dat je met een bsn zaken kan regelen is gewoon belachelijk. Alles zou achter iets als digiD moeten zitten. Email en adres gegevens? die moet je niet prive beschouwen. Ze slingeren overal. Zodra je het aan een enkele ander geeft verlies je controle over de verdere verspreiding.

Sterkere Id's voor het internet, zero day proofs. etc etc etc.. We konden tot nu toe lui zijn met security. Maar de werkelijkheid haalt ons in. Zoals altijd. We zullen als maatschappij er op moeten aanpassen. Dit is nu mogelijk en het blijft mogelijk. Als Anthropic zijn mythos afbreekt. Dan maakt deepseek of een andere groep morgen een nieuwe mythos. De geest is uit de fles.

Ozzy @batjes • 10 april 2026 12:09

Maar waarom zouden ontwikkelaars dit niet gebruiken om hun software voordat het gedeployed wordt te scannen. Ik zie dit juist als kans om software veiliger te maken.

Als dit inderdaad (veel) beter is dan mensen kunnen vinden, dan zouden ontwikkelaars eigenlijk voor het eerst op gelijk niveau met hackers komen te staan in plaats van achter de feiten aan rennen. Ontwikkelaars hebben immers altijd de eerste kans om die zero days te detecteren in nieuwe software / versies.

QuZyX 10 april 2026 08:23

Ben ik de enige die mij zorgen maakt dat dit "exclusief" kan gebruikt worden door grote bedrijven als 'Google, 'Amazon',...?

Maakt hen dit niet nodig sterker en breidt hun monopolie hierdoor niet nog meer uit?

bzuidgeest @QuZyX • 10 april 2026 08:41

De Linux Foundation staat ook in de rij met bedrijven. Netjes toch?

En Google, Amazon en ja ook Microsoft leunen zwaar op Linux en andere open source in hun producten en cloud offerings. Dit vloeit vanzelf terug naar de open source wereld.

[Reactie gewijzigd door bzuidgeest op 10 april 2026 08:42]

R_Zwart @QuZyX • 10 april 2026 08:46

Voor belangrijke applicaties is de open source community groot genoeg om te concurreren met de partijen die je noemt. Als je applicatie zo klein is dat de community ook klein is, zit je toch al in een heel andere league dan de googles van deze wereld.

kdekker 10 april 2026 08:32

Ik acht de kans dat wat Anthropic beweert de waarheid is (ook als er marketing taal tussen zou zitten) best aardig hoog in. Als je als bedrijf vergeven wordt van bug reports, dan wordt dat wel een uitdaging c.q. onmogelijk. Dit artikel kwam al eerder voorbij: nieuws: Curl stopt met bugbountyprogramma door 'AI-slop'. Maar goed, er zullen commerciele bedrijven zijn met meer armslag. Je kunt het ook zien als een tijdelijke piek van bug reports, waar hopelijk niet zoveel false alarms in zitten, dat de hoeveelheid onwerkbaar groot wordt, maar uiteindelijk de kwaliteit van de code beter wordt. Al zal op hele oude code nog een kunst zijn of er wel genoeg expertise is in een organisatie om iets te fixen. Zeker als het legacy software is, waar de laatste ontwikkelaar al lang met pensioen is en de boel in maintenance mode staat.

R_Zwart @kdekker • 10 april 2026 08:49

Software in maintenance mode is sowieso een last resort. Dat moet je eigenlijk alleen gebruiken voor incidenteel gebruik. Als je bedrijfvoering afhangt van software in maintenance mode dan heb je grotere problemen dan het wel of niet kunnen vinden en fixen van bugs.

Besty 10 april 2026 08:13

Dit is (eindelijk) een grote verandering door AI. Goed dat het toepassen wordt overwogen, maar wie bepaalt dit. Wie is nog te vertrouwen?

Op dit item kan niet meer gereageerd worden.

Claude

Waarom Claude Mythos niet direct uitkomt

Kan Claude Mythos uitlekken?

En hoe nu verder?

Lees meer

IT-banen

Reacties (105)

Sorteer op:

Weergave: