Anthropic onthult een nieuw model genaamd Claude Mythos. De dienst is goed in het opsporen van kwetsbaarheden maar kan ook exploits maken. Daarom is de Mythos Preview niet publiekelijk beschikbaar, maar alleen voor een select aantal bedrijven en overheden.
Het AI-bedrijf brengt Claude Mythos Preview uit onder de noemer Project Glasswing, wat een samenwerkingsverband is van tientallen techbedrijven. Deze bedrijven, waaronder Amazon, Google, Apple, Nvidia en Microsoft, krijgen toegang tot de testversie van de programmeer-AI.
Volgens Anthropic werkt het met de vermelde bedrijven samen omdat zij onderdeel uitmaken van de kritieke infrastructuur. Het bedrijf noemt vrijwel alleen Amerikaanse techgiganten. De enige uitzondering is de Linux Foundation. Anthropic is naar eigen zeggen ook al langer in gesprek met de Amerikaanse overheid over de toepassing van Claude Mythos Preview. De relatie tussen het bedrijf en de overheid van de VS staat de laatste maanden op gespannen voet.
Zelfstandig lekken opsporen
De bedoeling van Claude Mythos is dat het model zelfstandig beveiligingslekken en zero-days kan opsporen. Dat was volgens het bedrijf overigens niet de bedoeling, maar het gevolg van verbeterde programmeer- en redeneerprestaties.
De keerzijde is volgens Anthropic dat de AI-agent ook goed blijkt te zijn in het ontwikkelen van exploits op basis van deze kwetsbaarheden. "Dezelfde verbeteringen die het model heel goed maken in het patchen van kwetsbaarheden, maken het model ook veel beter in het uitbuiten van kwetsbaarheden." Het bedrijf benadrukt dat de dienst in de verkeerde handen ook voor het maken van exploits kan worden gebruikt, wat de reden is om de dienst vooralsnog niet publiekelijk uit te brengen.
Anthropic zegt dat bevindingen van Mythos wel publiekelijk te willen delen om andere beveiligingsonderzoekers te helpen. Dit gebeurt volgens het responsible disclosure-principe. Bedrijven krijgen doorgaans 90 dagen de tijd om een kwetsbaarheid op te lossen. Daarna wordt het probleem openbaar gemaakt, zodat anderen hiervan kunnen leren.
Kosten
De dienst is vooralsnog bedoeld voor beveiligingsonderzoekers van de vermelde bedrijven. Daarvoor investeerde Anthropic naar eigen zeggen 100 miljoen dollar voor gebruikerscredits. Als deze credits op zijn, kost het model 25 dollar per miljoen inputs en 125 dollar per miljoen outputs. Mythos werkt via de Claude-api of via externe AI-hostingproviders zoals Amazon Bedrock, Google Cloud Vertex AI en Microsoft Foundry.
Update, 08.15 uur − Er is extra informatie toegevoegd over de gevaren van het model.