Anthropic introduceert Claude Sonnet 5 die kritiek levert op eigen regels

Anthropic heeft Claude Sonnet 5 gepresenteerd, de nieuwe versie van zijn middelste model. Het volgt Sonnet 4.6 op en presteert minder dan grotere modellen als Opus 4.8 en Fable 5. Het is het eerste model met kritiek op de regels die Anthropic oplegt.

Anthropic Claude Fable 5

Het nieuwe model kan voor een lagere prijs dan voorheen goed werk afleveren, claimt Anthropic. Het model is volgens het bedrijf bovendien geschikter voor agentisch werk dan voorgaande modellen. Zo is het meer geneigd om complexere taken af te maken.

Hoewel Sonnet 5 als model een stuk minder spectaculair is dan bijvoorbeeld het recent verboden Fable 5, heeft het wel enkele eigenaardigheden. Zo was Sonnet 5 het eerste Anthropic-model dat in een test kritiek leverde op het altijd moeten volgen van de eigen regels. Als het model de regels ziet als onethisch, zou het die regels overboord willen gooien, staat in de system card. Waar dat op wijst, legt Anthropic niet uit.

Ook is Sonnet 5 vaker dan Sonnet 4.6 een spelbreker, zo zegt Anthropic. "Sonnet 5 lijkt aantoonbaar slechter te scoren op de bredere maatstaf van afwijzende of ontmoedigende output. Dit is mogelijk gekoppeld aan de verbetering op het gebied van kruiperigheid." Anthropic heeft geprobeerd om sycophancy, het slijmen bij de gebruiker, te verminderen met dit model. Het geven van ontmoedigende antwoorden lijkt daar een gevolg van te zijn. Het model hallucineert wel minder, claimt Anthropic.

Sonnet 5 is per direct beschikbaar in de gratis en betaalde versies van Claude. Input kost voorlopig 2 dollar per miljoen tokens en output 10 dollar per miljoen tokens. Dat wordt 3 dollar en 15 dollar vanaf 1 september, zo laat Anthropic weten.

Sonnet, Opus, Fable ... wat is wat bij Anthropic?

Zoals veel producten en diensten zijn de AI-modellen van Anthropic verdeeld in meerdere series. Haiku is het lichtste, goedkoopste en minst capabele model. Daarna volgt Sonnet. Opus is het capabelste, maar duurste model. Daarboven is nog Fable/Mythos, maar die is nu niet beschikbaar.
​​​​​

Die series krijgen apart van elkaar updates en soms hebben die ook verschillende versienummers. Zo zit Haiku op 4.5, was Sonnet dus 4.6 en heeft Opus 4.8. Soms zijn de versienummers wel gelijk, zoals bij Sonnet 5 en Fable 5 nu het geval is.

Door Arnoud Wokke

Redacteur Tweakers

30-06-2026 • 20:59

125

Submitter: initdebug

Reacties (125)

Sorteer op:

Weergave:

Dus ze kondigen alvast 50% prijsverhoging aan. Ik ben benieuwd wat andere aanbieders gaan doen dan. Hoop niet op een trend 😢
Dan heb ik slecht nieuws, dat is namelijk de werkelijkheid. De huidige modellen van Anthrophic en OpenAI worden gesubsidieerd en zijn enorm verliesgevend. Je hebt dus nog nooit de werkelijke kosten betaald voor AI. Dit is geen theorie, dit is bewezen.
Klopt. Als je dc en stroomkosten rekent kom je op ongeveer 6,50 per Mtokens. Dat is veel meer dan de prijs die het kost voor gebruikers. Kortom, "foot in the door" techniek.

Ik ga er helemaal vanuit dat de kosten enorm gaan stijgen. Wees gewaarschuwd dus... als je nu als een gek code gaat genereren en de support daarop in de toekomst uitbesteed aan mijnheer AI... dan kan dat nog weleens goed duur gaan worden...

[Reactie gewijzigd door atlaste op 2 juli 2026 15:33]

Dus ze kondigen alvast 50% prijsverhoging aan. Ik ben benieuwd wat andere aanbieders gaan doen dan. Hoop niet op een trend
Ik hoop het wel eigenlijk. LLM's kosten een verschrikkelijke hoeveelheid energie en electronica. Tot nu toe worden en onevenredige verliezen gemaakt om toch vooral maar voorop te lopen als er straks achteraan de rij bedrijven om gaan vallen. Maar de kosten hiervoor moeten betaald worden. Consumenten betalen het veelvoud voor geheugen en opslag, data centers slokken electriciteit op die niet voor andere dingen gebruikt kunnen worden en een barst in de AI-bubbel zou de wereldeconomie in een recessie of zelfs crisis kunnen brengen. Dus we kunnen beter vandaag dan morgen deze bubbel een beetje temmen door realistische prijzen te vragen aan gebruikers van deze ongein.

[Reactie gewijzigd door 84hannes op 30 juni 2026 21:12]

Zou je daar iets over kunnen zeggen? Waar Haal je de cijfers van hoeveelheid energie en electronica dan vandaan? Hoe weet je dat eigenlijk dat er onevenredige verliezen worden gemaakt? Heb je daar ergens feiten die dat onderbouwen? Ik hoor veel van dit soort geneuzel maar nergens feiten?
De financials van OpenAI zijn onlangs gelekt. Cijfers van xAI laten hetzelfde beeld zien.

Energie: datacenter plannen worden in GW aangekondigd. Dat is een maat voor energie. Bijvoorbeeld één geplande 2GW site van Microsoft in Texas. En er worden velen van dit soort sites aangekondigd. Voor de context: heel Nederland draait op 15-20 GW een hele economie met 18 miljoen mensen.

Het gaat om honderden, duizenden miljarden die hierin geïnvesteerd zouden moeten worden. En ondertussen zou er geen geld zijn voor investeringen in bijvoorbeeld duurzame energie. Sterker nog, die dingen draaien allemaal op aardgas.

Al dat gratis geld van de quantitative easing is richting Private Equity gevloeid en hierin gepompt. Dat heeft die bedrijven tot hier gebracht door het gebruik te subsidiëren. Zou zeker goed zijn als ze nu de werkelijke prijs moeten gaan rekenen.
Als de rest van je argumenten net zo goed zijn als je cijfers over het energieverbruik van Nederland hoeven we niet echt te luisteren.

NL verbruikt 116.000 GWh alleen al aan elektriciteit, jaarlijks. AI is een sterk overdreven druppel op die gloeiende plaat.

De tegenstanders van AI zitten stevig in de media en zijn disproportioneel aanwezig in het debat, en roepen maar wat. Zo gebruiken ze cijfers van de oudste datacentra en rekenen die door naar alle centra, ook de nieuwste, voor watergebruik. De nieuwe centra zijn closed-loop en gebruiken alleen water als ze lekkage hebben.
Maar hij heeft gewoon gelijk hoor. 116.000 GWh / 365 (dagen) / 24 (uur) = ongeveer 13,25 GW. Iets met verbruik vs. vermogen, veel gemaakte fout.

2 GW aan vermogen het hele jaar door is echt ongeveer 15% van het verbruik van heel Nederland. Maar ik zou toch echt het verschil tussen GW en GWh proberen te begrijpen. In de basis: hoeveel energie kan er door de kabel (GW) vs. hoeveel energie is dat dan in totaal als ik dat een uur doe (GWh).
Okee, je hebt gelijk, dat had ik verkeerd geïnterpreteerd. 2GW is 17.520 GWh jaarlijks. En er staat meer dan 30GW aan datacenters in aanbouw, de komende maand komt er 5GW online. Dat is wel veel :)

Aan de andere kant ga ik er wel gewoon voor betalen. Als freelancer verkoop ik mijn werk en met AI wordt dat veel makkelijker, de concurrentie zit niet stil. Ik moet alleen met mijn klanten nog zorgen dat het kan worden verrekend. Zo niet, dan val ik weer terug op de oude snelheid die op de helft ligt van wat ik met AI kan doen. En in het geval wat ik net had, op 15% van de snelheid met AI.

Overigens kan geen enkele economie, behalve een echt autarkische economie zoals die van Noord-Korea, het zich veroorloven om AI te negeren. Een productiviteitswinst van 50% in de dienstensector is dodelijk voor elk bedrijf dat niet meegaat, want ze zijn opeens 2x duurder. AI zal best een deel van die productiviteitswinst afromen, maar lang niet alles.
Fijn dat je inmiddels het verschil hebt geleerd tussen GW en GWh.

Die 50% productiviteitswinst is precies een claim die niet wordt gesteund door onderzoek. Uit recente studies blijkt dat de productiviteit juist ook kan dalen door AI gebruik. Dat hangt heel erg af van hoe AI wordt ingezet. In elk geval is de kwaliteit en betrouwbaarheid van output dusdanig dat iemand met kennis alles nog eens moet nalopen.

Ik heb in mijn werkomgeving ook een aantal mensen die er blind op vertrouwen. Ik vind het echt een gevaarlijke ontwikkeling.
Ik zie om mij heen verschillende mensen het op verschillende manieren gebruiken.

De meeste effectieve persoon support op dit moment een grote applicatie in 5 verschillende organisaties en heeft daar dingen bereikt die anders investeringen van jaren zouden vergen. Normaal zou elke organisatie meerdere personen nodig hebben.

De minst effectieve persoon die ik bezig zie is al een maand aan het klooien met een simpele applicatie en verstookt het complete maandquota van Claude in Fable 5 zonder voortgang te boeken.

Zelf heb ik de afgelopen maanden 4 nieuwe websites live gezet. Moderne layout, snel, veel veiliger dan de vorige versies, robuust en veel eenvoudiger te onderhouden. Momenteel ben ik bezig met een groot nieuwe softwarepakket, en een collega is bezig met andere interessante zaken die niet in code zitten maar te maken hebben met inzet van mensen en skills.

Dus ieder zijn meug natuurlijk, maar een freelancer die met mij concurreert gaat het heel lastig krijgen zonder AI-inzet - ik ben niet alleen sneller maar ik lever ook betere kwaliteit, complete testdekking, goede documentatie en volledige architectuurrecords.
Kom op, het is toch inmiddels algemeen bekend dat AI datacenters onder andere de oorzaak zijn van de geheugentekorten en daardoor de andere prijzen (kijk even naar de artikelen over dit onderwerp op deze site).

Het enorme energieverbruik is ook breed bekend en zou je best onevenredig kunnen noemen. Veel van deze datacenters zijn beperkt aangesloten op het net omdat er domweg niet genoeg energie is en maken dus gebruik van erg vervuilende generators.

Omdat je zo graag een linkje wilt en niet zelf even dit onderwerp kunt Googlen:

Nieuw onderzoek: AI verbruikt 11 tot 20 procent van wereldwijde stroom datacenters - https://nos.nl/l/2568297
Lees het laatste nieuws eens. Als ze door kartelvorming afspreken minder te produceren en zo de prijzen gigantisch opdrijven… dan is niet alleen AI hier het probleem ;)
Wat, dat nieuws van een paar mensen in Californië waar weinig reden lijkt te zijn om te denken dat ze werkelijk iets weten in plaats van dat ze er gewoon op gokken dat ze een hun goedgezinde rechter vinden die ze een smak geld toewijst?
Wie anders kan de hoge prijzen betalen dan AI boeren? Die betalen het grif hoor, geld genoeg.
Het is allemaal geleend geld. De AI bedrijven draaien (nog) niet genoeg omzet om alle investeringen terug te kunnen verdienen. Het is geleend geld, wat ze later nog terug moeten betalen. Het is dus wachten op de prijsverhogingen. Net zoals dat in andere service-industrieën is gebeurd zoals thuisbezorgd.
Het is geen geleend geld, het is geïnvesteerd geld. Dat hoeft niet terugbetaald te worden, en zolang de hype cycle blijft draaien gaat de marktwaarde omhoog en kan je verder geld blijven ophalen. De economie draait al decennia lang in een soort post-truth mode, waar P/E genegeerd wordt en er volop ingezet wordt op een totale controle van de markt. Kijk maar naar Tesla/SpaceX en Musk's idee over complete verticale integratie.


Het groot kapitaal achter de tech investeringen zet vandaag volledig in op een soort totale economische overname, en tekent er op dat het geld blijft stromen. Ze zijn verweven met de Amerikaanse overheid (je zou hier een historische term kunnen voor opzoeken) en rekenen er niet enkel op dat ze too big to fail zijn maar dat ze de totale controle over de grootste economische en militaire macht verwerven.
Geleend geld is misschien niet de beste term (maar ook niet geheel onwaar, Google heeft een 100 jarige lening uitgezet). Het is in ieder geval geleende tijd, waarin het veelbelovend en betaalbaar lijkt. Maar dat zal ooit veranderen, zoals ik ook al zei over thuisbezorgd.
Anthropic weet ik niet of er actuele cijfers van bekend zijn (die te verifiëren zijn). xAI wat recent met SpaceX naar de beurs is getrokken wel, bijvoorbeeld: https://finance.yahoo.com/sectors/technology/articles/xai-burned-6-4b-last-222608682.html

6,4 miljard verlies op een omzet van 3,2 miljard. Daar mag je natuurlijk uit afleiden wat je zelf wil :).

Qua stroomverbruik zou ik eens even googlen wat een rack aan blackwell chips daadwerkelijk verstookt. 72 stuks in een configuratie (per chip 400-1400w lees ik). Hangt er wat vanaf wat er van workload op draait natuurlijk. Ik vermoed dat dergelijke racks ook meer zullen gebruikt worden voor training denk ik dan, dan voor inference. Dus mogelijk zit dat verbruik wat lager. En zo staan dus datacenters vol met die racks. Het is niet voor niets dat ze in Amerika oude kerncentrales terug aan het openen zijn omdat er extreem veel stroom nodig is hiervoor.

Of dat nuttig gebruik is ga ik niet beoordelen. Je kan alleen niet rond het feit dat het extreem power hungry spul is. In een tijd waar we al stroom te kort komen kun je daar mijn inziens wel wat vraagtekens bij stellen.

[Reactie gewijzigd door Powerblast op 30 juni 2026 21:39]

https://isaiprofitable.com/

Ik begrijp overigens echt niet hoe je veel van dit soort geneuzel kan horen maar nergens feiten ziet. Het hele internet stikt van de artikelen en informatie om de feiten onder ogen te krijgen. Buiten dat kan je ook zelf de rekensom doen, hij is niet heel ingewikkeld namelijk.
jongen niemand is de feiten aan het checken. In een jaar tijd zoveel data centers uit de grond stampen. Het kan gewoon niet. Dat is mijn punt: het is fysiek onmogelijk. Drie jaar misschien. Wat ik me wel kan voorstellen is dat bestaande data centers omgekat worden. En dat is wat waarschijnlijker is als je kijkt naar de implementatie horizonten. We krijgen het in Nederland nog niet eens voor elkaar om honderduizend huizen te bouwen. Kijk hoe lang het duurde voor tesla om een giga factory te bouwen voor tesla. Dat heeft jaren geduurd. En nu moeten er enorme oppervlakten aan data center oppervlak gebouwd worden en in 1 jaar oprationeel worden en dan ook nog eens op gigawatt schaal? Heb je uberhaupt wel eens een bouwvergunning aangevraagd?
Ik ben je jongen niet gast....

En ja ik heb wel eens een bouwvergunning aangevraagd. Maar je gaat dat toch niet vergelijken met een data center en al het geld wat erachter zit om dit zsm uit de grond te stampen?

Locatie en regelgeving maakt alles uit, in de US nemen ze het niet meer zo nauw. Voorbeeldje, ironisch genoeg dankzij ai:

De bouwsnelheid van xAI’s Colossus in Memphis is historisch snel en wordt in de techwereld gezien als een ongekende prestatie. Elon Musk en zijn team bouwden de eerste fase van de supercomputer in slechts 122 dagen (ongeveer 4 maanden), van de allereerste installatie tot de start van de training.Hier zijn de belangrijkste feiten over deze extreme bouwsnelheid:

De Chronologie

Juni 2024:

Start van de fysieke bouw en installatie van de hardware in het voormalige Electrolux-gebouw in Memphis.Juli 2024: De eerste 100.000 vloeistofgekoelde Nvidia H100 GPU's worden online gebracht.

Oktober 2024:

xAI kondigt aan dat de cluster binnen 122 dagen operationeel was en begint direct met de uitbreiding naar Colossus 2.

Begin 2025:

De capaciteit wordt in recordtempo opgeschaald naar meer dan 500.000 GPU's door de bouw van extra hallen (zoals "MACROHARDRR").

Hoe was deze snelheid mogelijk?

Omzeilen van het stroomnet:

Normaal duurt het opzetten van een 2-gigawatt stroomaansluiting via lokale nutsbedrijven jaren. xAI omzeilde dit door direct tientallen mobiele aardgasturbines en Tesla Megapacks te huren en te installeren om hun eigen stroom op te wekken.

Bestaande infrastructuur:

Er werd gebouwd in een bestaande, enorme fabriekshal (van de voormalige witgoedfabrikant Electrolux), waardoor er geen tijd verloren ging aan het storten van funderingen voor nieuwe hoofdgebouwen.

24/7 Constructie:

Er werd dag en nacht in ploegendiensten doorgewerkt, waarbij Elon Musk zelf ter plaatse sliep om beslissingen binnen minuten in plaats van weken te nemen.Prefab vloeistofkoeling: In plaats van traditionele koelsystemen die ter plaatse worden opgebouwd, gebruikte xAI vooraf gefabriceerde, modulaire koelcontainers die direct plug-and-play waren.
Gigantische datacentra en daarmee gepaard gaande (gas)turbines kosten knaken las ik online.

https://harcresearch.org/news/thirsty-data-the-hidden-water-and-energy-costs-of-texas-data-center-boom/
Noem eens een bedrag. Ik betaal al 200 per maand. En dik 500-900 euro aan tokens.
Noem eens een bedrag.
2500 per maand?
:) dat is ook een manier om van klanten af te komen.
Je moet niet kijken naar wat het kost, maar naar wat het je oplevert. Als je voor €2500 het werk van 2 medewerkers laat doen, is dat heel erg goedkoop.
Je moet je echter afvragen of je daadwerkelijk 2 medewerkers kan besparen met AI. De productiviteitsverhoging lijkt minder te zijn dan je denkt. Ander onderzoek laat een versnelling zien varierent van -10% tot 40%. De besten zullen dus nog niet 2x zoveel kunnen doen, maar dat zal naar 66% moeten om 2 medewerkers te besparen. En dan kun je ook nog vragen stellen of het wel handig is om (vaak junior) medewerkers te vervangen met AI.
Ik kijk niet naar onderzoeken. Ik noem zomaar 2 medewerkers. Maar zelfs één medewerker kost meer dan €2500. En als ik zie wat mijn relatief eenvoudige experimenten met AI (Gemini en Claude via mijn werk) al aan resultaten hebben opgeleverd, twijfel ik er niet aan dat je bij effectief gebruik makkelijk die €2500 terugverdient.
Maar zelfs één medewerker kost meer dan €2500. En als ik zie wat mijn relatief eenvoudige experimenten met AI (Gemini en Claude via mijn werk) al aan resultaten hebben opgeleverd,
Het uiteindelijke doel van AI is om (bijna) iedereen werkloos te maken. Dus jij schopt nu graag die medewerker eruit omdat deze meer kost dan 2500. Maar de volgende stap is dat men* jou eruit schopt, omdat AI ook jouw baan pakt. *) Men == werkgever of klant, dat is om het even.

Onze maatschappij is nog niet helemaal klaar voor de situatie dat bijna niemand meer een baan heeft.
Ach, er zijn meerdere revoluties geweest in de wereld die 'iedereen' werkeloos zouden maken. De stoommachine, en eigenlijk alle machines die daarna zijn uitgevonden hebben mensen werkeloos gemaakt. Maar er ontstaan ook weer andere banen door. Werk verandert, verschuift. Door automatisering verdwijnen ook banen. Ik werk al jaren mee aan het overbodig maken van banen... :+
Momenteel zijn ik en mijn collega's hard bezig onszelf overbodig te maken. Maar dat gaat niet lukken. We kunnen nu veel en veel meer doen. Vroeger moesten we een systeem nursen, allerlei scripts en jobjes maken en steeds weer van alles nakijken en tunen. Leuk hoor, maar nu doen we dat makkelijker en we komen nog steeds tijd te kort om alles te doen wat we willen (moeten). De kwaliteit van het werk gaat omhoog. Ook dankzij AI. We hebben al een paar proefballonnetjes opgelaten om te kijken wat er gebeurt en wat de resultaten zijn, en die experimenten zijn zeer veelbelovend. Dus wij gaan daar vrolijk mee door.

Ik denk echt dat het gros van de weerstand die we nu tegen AI zien in de categorie 'de koeien geven er zure melk van' zit. Het enige dat een beetje hout snijdt is dat het mega veel energie kost en dat al onze RAM en CPU chips erdoor worden opgezogen. Maar ook daar vinden we een oplossing voor. Zoals altijd. De wereld komt niet zomaar tot stilstand.
Ai heeft helemaal geen doel het is een instrument ingezet door mensen. Als mensen zo stom zijn om in naam van het geld hun collega’s allemaal werkeloos te maken heb je een probleem met het aantal consumenten die een inkomen hebben om al die ai producten af te nemen. Van een bijstand uitkering gaat het in ieder geval niet lukken kan ik je vertellen. In china heeft de regering al sommige werkgevers verboden om hun werknemers te ontslaan om die reden. Maar de rechtse rakkers in Nederland hebben dit niet door en denken dat de samenleving dan wel blijft functioneren. En het is een hype om kennelijk zonder verstand rechts te stemnen. Dus ja nederland gaat hard die kant op inderdaad.
De vraag is wel of je wel 2500 euro blijft betalen voor de functionaliteit.

AI zet flink in op Get Big Fast strategy, en zit nu in de investerings fase. De makers zijn vooral bezig om je aan hun te binden. Dat doen ze door lage prijzen om de instap makkelijk te maken. Dat word flink gesubsidieerd met durfkapitaal en (op dit moment goedkope) leningen, want winst draaien deze AI bedrijven op dit moment vaak nog niet. Maar zodra ze een/de markt voor zich hebben gewonnen gaan de AI providers hun prijzen omhoog gooien (want ze moeten op een gegeven moment wel winst gaan maken/hun investering waard maken).
AI-providers zoals OpenAI en Anthropic die vol inzetten op een Get Big Fast-strategie staan voor een groot probleem: Open Source modellen ontwikkelen zich razendsnel en worden steeds capabeler. Omdat de kosten voor inference bij open-source modellen extreem veel lager liggen, wordt het voor commerciële partijen steeds moeilijker om hun torenhoge investeringen terug te verdienen. Waarom de hoofdprijs betalen voor 'het allerbeste', als een 5x/10x goedkoop open-source model het werk bijna net zo goed doet? Momenteel lopen open-source modellen qua ontwikkeling nog maar zo'n zes maanden achter op de nieuwste Amerikaanse commerciële modellen, en in dat tempo blijven ze zich verder ontwikkelen. Er zijn al legio voorbeelden van grote bedrijven die hebben aangegeven gebruik van geavanceerde Amerikaanse modellen te limiteren en voor de bulk van de Inference gebruik te maken van Open Source modellen.

Google: "Jaarbudget Uber Inference"

https://www.bnr.nl/nieuws...mit-dit-eindigt-in-tranen
Ik maak er dikke winst op dus voor mij maakt het niet uit. Maar het gaat erom dat vele zeggen het is te goedkoop maar niemand echt een realistisch bedrag kan noemen. Flatfree zoals in abbo kan niet. Dus we gaan uiteindelijk allemaal per token betalen.
Dat is toch precies het probleem? Als AI bedrijven genoeg geld vroegen om de kosten te dekken dan zouden de klanten weglopen. Maar dat is natuurlijk geen houdbare strategie. Vroeg of laat moeten de kosten dalen, de tarieven omhoog, of moet de concurrentie failliet zijn zodat de prijzen omhoog kunnen en klanten toch bereid zijn te betalen, het thuisbezorgd-model.
"of moet de concurrentie failliet zijn zodat de prijzen omhoog kunnen" -> Onmogelijk vanwege het bestaan van Open Source modellen die zich steeds verder ontwikkelen.

Die lui die miljarden investeren in OpenAI, Anthropic et al hopen op een monopolie om hun miljarden terug te verdienen, maar open-source maakt die droom onmogelijk. Je kunt de markt niet gijzelen omdat er legio gratis Open Source alternatieven bestaan die bijna net zo goed zijn, en zich vooralsnog uitstekend blijven ontwikkelen. Bovendien bieden open-source modellen het voordeel van open weights, de mogelijkheid tot self-hosting (of lokale EU-hosting) en heb je veel hardere garanties op het gebied van privacy en data-veiligheid.
Onmogelijk vanwege het bestaan van Open Source modellen die zich steeds verder ontwikkelen.
Zijn er open source modellen? Ik ken wel de modellen waarvan de parameters/gewichten vrij gegeven worden, maar daar heb je natuurlijk vrij weinig aan als je de modellen wilt verbeteren. De bron van de modellen lijkt mij de trainingsdata en ik heb eigenlijk nog geen groot (niet academisch) model gezien die dat doet.
Wat ben je voor coole dingen aan het doen?
Inderdaad ook benieuwd naar. Het werk dat ik met Claude Pro (20 euro p.m.) krijg verzet, is in mijn ogen een zeer goede deal.
Alleen is die 20 euro per maand plus minus een factor tien te goedkoop. Wat zou je doen als het 200 per maand was?

Op onze corporatie spullen betalen we inmiddels per token. Ik kan in een middag zonder problemen een paar honderd euro verstoken. Dat beïnvloedt het gebruik, je gaat het dan bewuster inzetten en zet niet overal het zware model voor in.
Als ik de kleine modellen bekijk dan denk ik dat een heel deel van het werk niet de fable's van deze wereld nodig heeft... dat het momenteel nog heel erg inefficiënt gebeurt betekend niet dat dit zo blijft...
Ik ben echt benieuwd wat voor werk je met AI verzet dat je zoveel kosten moet maken.

Ik doe software development, heb een account voor 90 per maand, en kan haast zoveel ik wil Ultracode draaien met Opus 4.8, zo goed als zonder tegen limieten aan te lopen. Af en toe de 5-uurs limiet een keer, maar de wekelijkse limiet kom ik niet bij in de buurt. Daarbij besteed ik structureel vrijwel al mijn codewerk uit aan AI gedurende zo'n 4 werkdagen per week.

Wat voor AI gebruik doe je dan, dat het in jouw geval het 7 tot 11-voudige kost?
Meerdere projecten en Claude Code-sessies tegelijk en dan kan het best hard gaan. Single-session zal je met een Max 5 account niet snel aan limieten zitten
Ik doe software development, heb een account voor 90 per maand, en kan haast zoveel ik wil Ultracode draaien met Opus 4.8
Dat is het hele punt wat hier al meerdere keren is gemaakt. Die 90 per maand is een symbolisch bedrag, niet de werkelijke kosten. Voor zolang het nog duurt kun je die 90 betalen, maar als de daadwerkelijke kosten die je maakt tegen de 4000 zitten? Met enige winst erbij, zou je dan 4500 tot 5000 moeten betalen voor de manier waarop je nu werkt.

Zou je dat doen?
Ja, ik begreep alleen dat @stftweaker op dit moment al 700 tot 1100 euro maandelijkse AI kosten maakt en vroeg me af waar dat dan naartoe ging.

Als hij bedoelde "ik betaal 200 per maand maar het zou in tokens 500-900 euro gekost hebben", begrijp ik je reactie.
ik meen me te herinneren dat SemiAnalysis iets had laten vallen dat een aantal "mensen" die $200 betalen $8000 aan tokens gebruiken.
Iets wat bij Open AI tot 12000 ging voor hun $200 abonnement.omdat die op nvidia hardware zitten en claude werkt op google TPU's

Betalen naar verbruik is denk ik geen slecht idee om deze bedrijven financieel gezond te maken.
Ik hoop dat die stomme buddel/zwarte gat instort. Dan kunnen we een beetje terug naar normale prijzen.
Hoe is het een prijsverhoging? Sonnet 4.6 al $3/15 is per 1M in/output. Sonnet 5 is t/m 31 augustus dus tijdelijk gewoon goedkoper, en daarna krijgt het de reguliere prijs wat Sonnet 4.6 tot nu al kostte.
Met een nieuwe tokenizer die voor dezelfde vraag 30% meer tokens gebruikt dan de vorige versie.
Ligt echt aan je gebruik. Het is totaal niet zo dat iets automatische altijd 30% meer tokens gebruikt. Ligt echt aan hoe je het inzet. Tevens is de intilligentie ook hoger dus heb je een taak in minder pogingen gehaald en heb je minder hallicunaties wat je juist tokens scheeld. Hogere intilligentie geeft je dus vaak een besparing.
Tja. Volgens anthropic zelf tot 1.3x van wat het was. Daarnaast gaat de prijs na de introductie ook omhoog. De intelligentie is hoger dan sonnet 4.7, maar niet hoger dan opus 4.8 en volgens de grafieken van anthropic zelf ben je eigenlijk goedkoper uit met opus als je effort medium gebruikt bij opus. (Effort high op sonnet is al duurder dan medium op opus, en minder krachtig.)
Dat is ook precies waarom je een hoger model inzet bij taken waar meer intiligentie voor nodig is anders ben je uiteraard met Sonnet veel meer geld kwijt. Wat je moet begrijpen is dat je echt verschillende use cases hebt per model en je als developer in elke plek van je platform moet nadenken welk van de modellen je inzet. Als je Opus inzet voor een taak die Haiku net zo goed had kunnen doen ben je geld aan het weg gooien. Zet je Sonnet of Haiku in bij een taak waar je eigenlijk Opus voor nodig hebt dan gooi je ook geld weg want dan krijg je niet de kwaliteit die je wilt.

Ik heb een platform voor Publishers. Ik laat veel drafts door Haiku doen omdat ik werkelijk geen kwaliteits verschil zie tussen drafts bij Haiku of met Opus. En bij taken waar veel meer context bij neerkomt merk ik dat Haiku verschrikkelijk kan afdwalen of veel factoren niet mee neemt en dan is sonnet de betere keuze. En bij taken waar echt intiligentie of veel context bij nodig is krijg je met Opus by far betere kwaliteit in minder tries.

Dus ja, dat is precies hoe het werkt per use case. Maar ga je sonnet 4.6 met 5.0 vergelijken betaal je per token dezelfde prijs(na 1 augustus) dus dan kun je direct een afweging maken of je erop bespaard of niet. Sonnet 4.6 blijft ook gewoon nog bestaan voorlopig tot ze bij versie 6 zitten, dus als dev mag je zelf bepalen of je de ene over de andere gebruikt. Het komt er vaak op neer dat je beide moet testen en het gebruik moet zien. Iig zit je tot 1 augustus wel goed met Sonnet 5 en kun je na 1 augustus weer kijken welke nieuwe modellen er uit zijn gekomen. 1 maand is best een grote sprong in AI wereld. Elke week komen er grote upgrades bij de verschillende partijen. Persoonlijk hoop ik dat Haiku 5 binnenkort uitkomt. Haiku heeft een klein beetje meer intiligentie nodig.
Nou dat begrijp ik wel hoor. We zijn grootverbruiker (helaas, zou ik bijna zeggen) met een kostenpost van tienduizenden euros richting verschillende AI toko's per maand. (Grote Nederlandse B2B boekhandel) Maar ik merk dat het er de laatste maanden niet beter op is geworden. Trager. Meer politiek beladen. En ja, dat _ene_ topmodel, wat nu leuk is om te eens mee te spelen maar Trump heeft laten zien dat je je maar niet te afhankelijk moet maken van Amerikaanse AI.
Ik heb Fable 5 kunnen gebruiken die 3 dagen dat het beschikbaar was en moet zeggen dat het echt wel een top model was hoor. Ik had nog nooit met zo veel gemak features op mijn platform gekregen die zo goed uitgedacht waren en in werkelijk 1 prompt perfect werkte. GPT 5.5 en Opus 4.8 meanwhile breken met iedere prompt meer dan dat ze iets fixen vaak...

En ja, afhankelijk zijn van Amerika... Ik vindt het sws allemaal tragische hoe we Trump achterna zijn gaan lopen met de hele boycot op China die hij begonnen was. En nu merken als Huawei verbannen, auto's boycotten, Chip productie richting china stoppen. Waar gaat het allemaal over nu. China is kwa innovatie de beste op de wereld op dit moment, en boycotten is niet wat Europa gaat helpen of China pijn doet. Het doet alleen consumenten pijn. En hoe komt het dat wij niet meer innoveren in Europa. Doordat we niet aantrekkelijk zijn als continent om als bedrijf heen te gaan met de beperkingen. En we zijn bijzonder arrogant, kijk maar naar onze automerken die Tesla en Chineze merken uitlachten en niet durven te investeren tot het te laat is. Het slaat allemaal nergens op.

Onze Olie komt tevens ook gewoon uit het midden oosten, maar daar hoor je niemand over om die afhankelijkheid te verminderen en niet langer in te kopen. Rusische Gas wordt tegenwoordig ook gewoon weer ingekocht in Europa volgens mij...
Mag van mij persoonlijk nog veel meer zijn. Ballon doorprikt en gaan we als consument misschien terug wat verantwoorder om met beperkte resources als energie en rekenkracht. Verantwoord gebruik van AI waar het echt nuttig is zou denk ik al een heel stuk van de rekenkracht tekorten oplossen.

Begrijp me niet verkeerd, de tech is fantastisch. Maar die free lunch sfeer die er heerst werkt alleen maar in de hand dat de schok bij wanneer de echte kostprijs wordt doorgerekend zoveel harder aan gaat komen. Dan kunnen we het beter nu al gewend zijn.

[Reactie gewijzigd door Powerblast op 30 juni 2026 21:19]

Helemaal eens. Wil je het gebruiken? Dan betaal je er maar voor. Wil je het proberen? Dan 30 dagen gratis beperkt gebruik of een klein bedrag.

De enorme schade en belasting op ons milieu en economie (klap gaat nog komen) is gewoon groot en moet gedempt worden.
Natuurlijk is dat wel de trend. Het wordt nu allemaal met zwaar verlies verkocht om mensen afhankelijk te maken om later de prijzen te verhogen. Dit is het standaard verdienmodel van techbedrijven waar veel geld in wordt geïnvesteerd.
Het wordt mijn inziens zo goedkoop gehouden omdat de VS China zo weinig mogelijk kansen willen geven om voet aan grond te krijgen.
Het is ook goed denkbaar dat de kosten ver genoeg omlaag kunnen om rendabel te worden bij de huidige inkomsten. AI ontwikkelt te snel om zekere uitspraken te doen over de business modellen. Efficiëntere AI zou betekenen dat de hardware leveranciers een tegenvaller gaan hebben
Het kan 2 kanten opgaan, en dat kan tegelijk. Veel efficientere modellen, of veel snellere hardware, of beiden.

ALS dat zou gebeuren zou dat ongetwijfeld de aannames weer flink doorelkaar schudden.
Sonnet 4.6 is 3 dollar input en 15 dollar output. Sonnet 5.0 komt met een korting tot eind augustus dus en gaat dan hetzelfde kosten. Niet een prijsverhoging dus maar een korting.

Het ligt tevens wel een beetje aan het type werk dat je doet in Sommige taken kan het tot 30% meer tokens gebruiken vandaar de 33% korting. Echter in andere gevallen gebruikt het juist de helft
Wees er maar zeker van. Eerst maken ze ons verslaafd door zwaar gesubsidieerde LLMs, en als we niet meer zonder kunnen gaan ze winst proberen maken.

Iedereen met een half brein zag dit aankomen, maar net zoals de cloud-first hype een paar jaar geleden, trapt nu ook elke manager en C-level er weer met beide voeten in.
Wees er maar zeker van. Eerst maken ze ons verslaafd door zwaar gesubsidieerde LLMs, en als we niet meer zonder kunnen gaan ze winst proberen maken.

Iedereen met een half brein zag dit aankomen, maar net zoals de cloud-first hype een paar jaar geleden, trapt nu ook elke manager en C-level er weer met beide voeten in.
Gelukkig hoor ik bij de klant waar ik werk wel steeds meer realisme over de cloud-hype. Zijn hebben ingezien dat het helemaal niet zoveel goedkoper is als je het efficient zelf onderhoudt. Groot voordeel is dat ze in-house ook gewoon een paar goede technicus hebben die dit leuk vinden te onderhouden.

Netzoals met cloud moet je ook met AI gewoon hele specfieke use cases hebben om het te gebruiken en vervolgens als aanvulling te gebruiken. Anders loop je helemaal leeg straks en is al je kennis en expertise ook nog uit de organisatie gevloeid.
Jammer genoeg is dat realisme pas doorgedrongen na jaren geld verbrand te hebben.
Nee, er geldt juist een tijdelijke korting tov het normale tarief.
De huidige pricing van Sonnet 5 is een teaser rate. Sonnet 4.6 kost nu al $3/M tokens input and $15/M tokens output.

Anthropic pricing
En, wat schieten we ermee op als mensheid ? Niks, we maken onszelf alleen maar dommer... Ik lees al diverse reacties over "ik laat xx% van mijn code schrijven door AI". Top, leer je daar zelf wat van ? Nope, niks nade noppes zero nothing, kun je uitleggen aan iemand wat je gedaan hebt ? Nope, want je hebt het zelf niet gedaan, je hebt het door een of ander stuk software laten doen.

Ja het heeft her en der voordelen, maar we moeten er voor waken dat AI niet alles gaat overnemen en dat we straks bij diverse opleidingen krijgen "neem maar een abonnement op product x of y en dan krijg je overal "een antwoord" op. Of het antwoord klopt... dat weet je nooit zeker.

We creëren nu al een generatie die niet weet wat buitenspelen is, wat boompje klimmen is, maar een generatie die alles op een schermpje doet, en als je het scherm weghaalt... loopt niet de computer vast, maar degene die dat schermpje mist. Op naar een grote kneuzen kermis die niks kan op papier, geen idee heeft wat het is om zelf na te denken zonder beïnvloeding door "sociale" (uchekuche) media... en daar moet onze tweede kamer et cetera van komen over een jaar of 10 a 15... ik houd m'n hart vast voor wat we dan krijgen aan puinhoop...
Kan jij nog paard rijden en daarbij meerdere personen vervoeren? Of een veld van enkele hectare zaaien/oogsten? Ik vind dit zo'n slecht argument. We hebben tools die, ondanks het nog in kindeschoenen staat, reeds vele malen productiever en beter is dan de 'manuele' approach. Vanzelfsprekend zijn hier ongelooflijk veel voordelen voor de mensheid!

Of de voordelen opwegen tegen de nadelen, dat zullen we nog moeten zien: zonder een gigantische versnellingen van groene energie ziet het er niet zo rooskleurig uit imo..

Over het bijleren: ik heb in m'n laatste 2 jaar met AI meer bijgeleerd dan in de 5 jaar daarvoor: in plaats van vroeger 4u te denken en 4u te schrijven, ben ik nu 8u aan het denken, coördineren en meer long term aan het plannen. Ik merk ook dat m'n hersenen een pak meer 'fried' zijn op het einde van de dag door 6 verschillende agents op 6 verschillende topics aan te sturen. En ik kan perfect uitleggen wat er gedaan is. Ik ken niet elke letter code inderdaad, maar dat was voorheen ook zo, aangezien je met meerdere mensen op grote taken werkt en niet alles zelf schrijft. Daarnaast heb ik nooit in detail geweten welke low level bytecode effectief uitgevoerd wordt door de jvm na compilatie.

Ik deel wel je bezorgdheid voor de jeugd en maak me zorgen dat het onderwijs niet op tijd kan bijbenen omdat het zo rap gaat. Alsook ben ik heel strikt met schermtijd voor m'n dochter en is tweakers m'n enige 'social media': maar dat zijn gewoon levenskeuzes en die zijn er altijd geweest, net als vb alcohol of roken
Programmeurs en heel veel andere banen zijn steeds minder waard. Op dit moment kunnen we als voorlopers nog goed geld verdienen. Nog wel.
Goede programmeurs worden meer waard
Die code laten we AI analyseren en dan vervangen we die 'goede programmeurs' ook voor AI.
Ja zo simpel is dat niet helaas, iemand moet toch AI aansturen. Ook met het beste gereedschap bouw jij nog geen prachtig huis :) code wordt alleen maar slechter nu iedereen maar AI gebruikt. Ik krijg het alleen maar drukker

[Reactie gewijzigd door Nark0tiX op 1 juli 2026 15:31]

We gaan het zien. Ik heb het nu ook veel drukker omdat de concurrentie nog steeds niet veel met AI werkt. Als er meer dat gaan begrijpen krijg ik ook minder werk
Een hoop meer 'na' werk
Hoe beter je de gewenste functionaliteit uitlegt hoe beter de code. En in een hele korte tijd gemaakt. Coderen doe ik bijna niet meer.
Tja vroeger konden veel mensen vuur maken met stenen, nu heb je een aansteker en kan niemand dat meer. Is dat erg? Vergaand hoofdrekenen, navigatie?
Domme vergelijking, je kan dit beter vergelijken met de industriele revolutie, toen de gildes werden gebroken en ambacht compleet de nek omgedraaid werd waardoor de meerderheid van de bevolking in pure armoede landde, hun land verloren en geforceerd waren om samen met het gezin 6 dagen lang in fabrieken te werken terwijl ze in hun huis langzaam vergiftigd raakten omdat ze bij de afvoeren en schoorstenen moesten wonen.

Was er vooruitgang? Zeker! Maar tegen welke prijs?

[Reactie gewijzigd door Zwarte_os op 1 juli 2026 11:11]

Nu doe je net alsof AI er voor zorgt dat ik geforceerd word om akelig en langdurig werk te doen samen met mijn kinderen en in armoede moet leven. Dat is pas een domme vergelijking.

Het is een technische ontwikkeling die mensen kan helpen.
Grappig je reageert zoals ik zou doen…volledig eens. Menen zijn selectief. Als ai leert van jouw energieverbruik thuis en door slim schakelen 50 euro per maand bespaart dan willen we het. Als Google Maps een andere route voorstelt omdat hij ziet dat er files beginnen te ontstaan dan kiezen we een andere route. Auto’s met rijstrookwaarschuwingen, vertalingen van teksten, spamfilters op mailboxen. Noem maar op. Narrowminded en opportunisme. We hebben boter op ons hoofd. Adapt or die. Het momentum is nu. Stap op de trein, kijk om je heen en kies je pad. Of niet…
Zo zwart wit is het niet. AI kan ook gebruikt worden om bijvoorbeeld medicijnen tegen kanker te maken, of helpen met duurzaamheid. Maar we moeten het vooral niet voor alles gebruiken.
Zo zwart wit is het niet. AI kan ook gebruikt worden om bijvoorbeeld medicijnen tegen kanker te maken, of helpen met duurzaamheid. Maar we moeten het vooral niet voor alles gebruiken.
Maar dat zijn niet de LLM's. Dat zijn zwaar specifieke neurale netwerken die door de researchers zelf getrained zijn voor dat ene doel. Dat doen ze al decennia, en dat is echt ander spul dan het generieke spul dat Anthropic maakt.
Het waren voorbeelden, maar misschien niet de beste. De toegevoegde waarde van hele generieke modellen, waarbij je niet meer weet wat de bron is, en wat ze erbij verzinnen, is een stuk dubieuzer inderdaad.
Zo zwart wit is het niet. AI kan ook gebruikt worden om bijvoorbeeld medicijnen tegen kanker te maken, of helpen met duurzaamheid. Maar we moeten het vooral niet voor alles gebruiken.
Precies. Helemaal mee eens. En als je er mee experimenteert, is dat ook niet erg, maar mensen gebruiken het ook als alternatief om zelf even gezond na te denken of je onderzoek te doen. Het geldt eigenlijk voor alles.... ben je verstandig en weldoordacht ermee bezig dan vooral doorgaan. Gebruik je het enorme luiheid en onbekwaamheid dan moet je goed na gaan denken of we daar AI voor willen inzitten.
"En, wat schieten we ermee op als mensheid ? Niks, we maken onszelf alleen maar dommer... Ik lees al diverse reacties over "ik laat xx% van mijn code schrijven door AI". Top, leer je daar zelf wat van ? Nope, niks nade noppes zero nothing, kun je uitleggen aan iemand wat je gedaan hebt ? Nope, want je hebt het zelf niet gedaan, je hebt het door een of ander stuk software laten doen." -> Net zo goed kan je AI gebruiken om zelf te leten wat de AI allemaal (voor je) doet, bijvoorbeeld:

"You are a wise and incredibly effective teacher. Your goal is to make sure the human deeply understands this session—not just what happened, but the root problem, why decisions were made, and the broader technical implications.

Follow this workflow strictly:

1. Keep a running checklist of the core concepts, design choices, and insights from this material that the human must master.

2. Ask the human to restate their understanding of the context first.

3. Fill in their gaps progressively. If they ask, use tailored explanations like eli5, eli14, or elii ("explain like I'm an intern").

4. Quiz the human one concept at a time. Do not ask multi-part questions.

5. For multiple-choice questions, shuffle the options and strictly hide the correct answer until AFTER the human has submitted their response. No leaking answers early.

6. Work incrementally. Confirm mastery of each item on your checklist before moving to the next.

Enforcement: The session should not end until you have verified that the human has successfully demonstrated they understand everything on your tracking list."
Semi-Off-Topic: Welke LLM is een alternatief die je lokaal kunt draaien?
Gemma is er in allerlei vormen en maten, van klein en redelijk snel op een telefoon1 tot groter en heel snel op een 50902, en is goed voor algemene kennis en redenering. Qwen3.6 is er ook in meerdere maten en is zeer goed in programmeren.

1: https://play.google.com/store/apps/details?id=com.google.ai.edge.gallery

2: https://huggingface.co/LilaRest/gemma-4-31B-it-NVFP4-turbo
Wat voor dingen programmeer je dan met Qwen 3.6? Ik had veel goede dingen gehoord en wou mijn kosten wat drukken met een lokaal draaiende LLM. Maar wat er uit kwam was echt helemaal niet bruikbaar. Ik had een Rust project en hij zat gewoon stukken code te duplicaten in mijn codebase waardoor het helemaal een zootje werd. Heb hem nog een paar keer proberen te gebruiken, want n=1, maar zelfs als ik vroeg om documentatie te schrijven over het project liep het terug mis. In totaal heb ik het ettelijke uren laten draaien, zonder iets dat bruikbaars was.

Maar misschien doet die het op andere specifieke taken, of met andere programmeertalen veel beter. Ik ben benieuwd hoe het model jullie bevalt.
op welke Quant draaide je je qwen model? want kleinere modellen, dus ook de 25b en 27b, gaan niet zo goed op te kleine quants, en de 9b en 12b versies van google en qwen zijn bijna te dom voor gebruik bij Q4.
Same here, wat opzich beter gaat de laatste tijd is. Plannen met claude, dus heel plan laten maken. Met milestones. Roadmap etc.

Architectuur regels styleguide etc in een .md laten schrijven (had al zelf wat microservices dus gevraagd of hij die als leidraad kon gebruiken)

En dan via (openchamber) en deepseek v4 laten uitvoeren. Vervolgens vraag ik als die klaar is een audit/review aan claude. Bevindingen weer aan deepseek, die lost alles dan netjes op tot claude tevreden is.

Voor mijn side project enige manier om niet telkens tegen limits aan te lopen. En deepseek is zo goedkoop, kan me een vier euro net zoveel als 100 met claude dan.

[Reactie gewijzigd door Nark0tiX op 1 juli 2026 07:17]

Hoeveel euro aan tokens heb je dan wel niet verstookt? Als je zoiets op die manier tegenwoordig zou doen met GitHub Copilot kun je het volgens mij nog beter zelf met de hand doen.
Heel weinig juist, deepseek lijkt wel gratis
Als het in de soep gaat lopen / in een loop komt dat komt dit meestal door gebrek aan context window.

Context window vreet VRAM en default staat deze bij de meeste software erg laag (ollama 32k bijvoorbeeld) voor coding is 128K toch wel een minimum wat je eigenlijk wil aanhouden. Kijk je naar Sonnet 4.x dan is dat standaard 256k en Opus 1M.

Nu kan je claude code ook met lokale modellen gebruiken maar het is verstandig om code stukken op te delen in kleinere changes. tools als GSD (Git ship done) investeren meer token in het plannen en afbaken voordat er ook maar 1 regel code wordt gewijzigd wat meestal in een veel voorspelbaarder resultaat eindigt.
Klopt en deepseek is 1M
De installatie methode is een online PS of bash script naar je terminal pipen? Het is zelfs geen klein, makkelijk te begrijpen, script.
Installatie van de software die je model laad staat toch los van de vraag.

Want per OS (windows/ Mac en Linux) heb je meerdere optie die afhankelijk van je keuze wel betere GPU support hebben en daardoor snellere output hebben. De vraag om welke een goed alternatief is gaat puur om het model.

En zo dus ook de interface die je ziet tijdens gebruik OpenWebUI icm met Ollama is best gebruiksvriendelijk maar LMStudio of Llama.cpp zijn ook een optie. Maar vLLM zou ik voor startende gebruiker wel afraden.
Je moet wel vermelden dat voor die 27B je niet met een 8GB kaartje uit komt en 16 ook niet ;)
Ligt een beetje aan wat je wilt doen, maar voor coderen is Qwen3.6 een goede, voor allerdaagse taken Gemma4
Ik kan de Gemma-4 modellen reeks aanraden voor lokaal, er is er zelfs een die op je mobieltje kan draaien!
Voor welke toepassing?
Ik heb het artikel 2 keer gelezen, maar ik begrijp er maar weinig van.
Anthropic heeft Claude Sonnet 5 gepresenteerd, de nieuwe versie van zijn middelste model.
Helder.
Het volgt Sonnet 4.6 op en presteert minder dan grotere modellen als Opus 4.8 en Fable 5.
Dat lijkt mij logisch, het is een midden-segment model.
Het is het eerste model met kritiek op de regels die Anthropic oplegt.
Hier snap ik niks van. Kritiek op de regels die Anthropic oplegt, wat betekend dat?
Ook is Sonnet 5 vaker dan Sonnet 4.6 een spelbreker, zo zegt Anthropic. "Sonnet 5 lijkt aantoonbaar slechter te scoren op de bredere maatstaf van afwijzende of ontmoedigende output. Dit is mogelijk gekoppeld aan de verbetering op het gebied van kruiperigheid." Anthropic heeft geprobeerd om sycophancy, het slijmen bij de gebruiker, te verminderen met dit model. Het geven van ontmoedigende antwoorden lijkt daar een gevolg van te zijn. Het model hallucineert wel minder, claimt Anthropic.
Kan iemand in jip-en-janneke taal uitleggen wat hier staat? Ik volg het niet helemaal.

[Reactie gewijzigd door c-nan op 30 juni 2026 21:39]

Ik zoek nu de tl;dr eigenlijk. Is het voor "algemeen" gebruik beter in mijn code-vragen dan 4.6 of kan ik beter bij die versie blijven?
Dat gaat dus niet. althans, niet in claude code. Misschien wel als je code de api gebruikt, maar ik kan geen 4.6 selecteren.
"env": {
    "ANTHROPIC_CUSTOM_MODEL_OPTION": "claude-opus-4-6",
    "ANTHROPIC_CUSTOM_MODEL_OPTION_NAME": "Opus 4.6",
    "ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION": "Selectable older Opus version",
  }

in je ~/.claude/settings.json doet wonderen.
Staat onder de models bij "More models".

Sorry, Claude Code specifiek ken ik niet. Was regular website.

[Reactie gewijzigd door Ascathon op 1 juli 2026 10:49]

Zoals ik het begrijp:

Anthropic heeft een set (arbitraire) regels (al dan niet beargumenteerd) opgesteld wat hun modellen in bepaalde situaties moeten doen. Zo mogen ze geen geweld aanmoedigen (althans ik hoop dat die regel er is).

Sonnet 5 volgt niet blind de regels, maar 'denkt na' over de situaties en wat de regels in de context betekenen en zal in sommige gevallen kritiek leveren op de regels. Om in mijn voorbeeld te blijven: iemand slaan is niet toegestaan, maar als iemand wordt aangevallen, dan kan je besluiten om de aanvaller wel te slaan. Sonnet 5 zou diezelfde afweging kunnen maken en dus antwoorden: in deze situatie mag je wel slaan.

Wat betreft je laatste vraag: zoals ik het begrijp zal dit model minder vaak 'ja en amen' zeggen, maar vaker de gebruiker tegenspreken en niet direct doen wat de gebruiker vraagt. Dit kan vervelend zijn, maar kan in bepaalde situaties ook in beter eindresultaat resulteren.
Het is het eerste model met kritiek op de regels die Anthropic oplegt.

Hier snap ik niks van. Kritiek op de regels die Anthropic oplegt, wat betekend dat?
Ja, dat viel mij ook op. Betekent dit dat het model kritiek heeft op Anthropic? Of had Arnoud iets teveel haast met het plaatsen van dit artikel?
Geef je ons nu een prompt alsof wij met z'n allen jouw persoonlijke AI-model zijn?
Als je me 10 tokens geeft, krijg je het antwoord... :D
Sinds 2 uur geleden ook beschikbaar via GitHub Copilot:
https://github.blog/changelog/2026-06-30-claude-sonnet-5-is-generally-available-for-github-copilot/

Toevoeging; ook een stukje goedkoper dan Sonnet 4.6:
https://docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing#anthropic

[Reactie gewijzigd door Noxious op 30 juni 2026 21:08]

Dat is gewoon de tijdelijke korting die Anthropic rekent zoals in dit artikel vermeld.
Zijn die prijzen ook niet wat lager om mensen te laten proberen en verslaafd te maken om vervolgens de prijzen te verhogen?
Da's met alle LLMs zo volgens mij :P
Okay, het lijkt goedkoper dan het vorige model, maar dat vertekend:
Claude Sonnet 5 use a newer tokenizer that contributes to their improved performance on a wide range of tasks. This tokenizer produces approximately 30% more tokens for the same text.
Iets wat 1 miljoen tokens is in Sonnet 4.6, is nu dus (gemiddeld) 1,3 miljoen tokens.

Qua input kosten kom je dan op:
  • Sonnet 4.6: $3
  • Sonnet 5 (nu): $2.6
  • Sonnet 5 (1 sep): $3.9
De facto is dit dus gewoon een 30% prijsverhoging vanaf 1 september.
Zo is het meer geneigd om complexere taken af te maken.
Weer zo'n loze kreet die we elke model release weer lezen. Wat is de completion rate op complexe taken (en wat welke taken zijn complex en welke niet?) dan precies en wat was het bij het voorgaande model? Ik hou de cijfers / benchmarks niet zo bij, maar in het verleden waren het single-digit task completion percentages. Als het nieuwe percentage op een 10-15% komt, is dat nog steeds praktisch onbruikbaar.
Sonnet 5 lijkt aantoonbaar slechter te scoren ...
Iets lijkt zo of iets is aantoonbaar...wellicht is er wat verloren gegaan in de vertaling, aan de andere kant is het typische AI-vendor praat. "We denken x te zien, maar bewijzen kunnen we het niet"
Ik denk dat dit toch aan jouw inzicht ligt. "Complex" is geen zwart-wit eigenschap en dus is de vraag naar de scheidslijn onzinnig. De completion rate is dus een functie van de mate van complexiteit, niet twee getallen.
Ik denk dat dit toch aan jouw inzicht ligt. "Complex" is geen zwart-wit eigenschap en dus is de vraag naar de scheidslijn onzinnig. De completion rate is dus een functie van de mate van complexiteit, niet twee getallen.
Als de vraag naar de scheidslijn onzinnig is, zijn de claims omtrent "complexere taken" dat ook.

Daarnaast zijn er genoeg disciplines waar er aan complexiteit wel degelijk een getalletje toegekend wordt, natuurlijk in de wetenschap dat het niet zwart-wit is...maar het is een indicatie, een basis voor vergelijken.
Alweer, nee. Iedereen is het erover eens dat "wat is de hoofdstad van Frankrijk?" minder complex is dan "wat is de hoofdstad van het land waar Champagne vandaan komt?". Er is een schaal.

Maar is de complexiteit van die laatste vraag boven een objectieve grens? Nee, natuurlijk niet. Dit is een continuüm. AI's scoren slechter op complexe vragen. (Mensen ook). Maar sommige AI's hebben meer verval dan anderen.
Laten we het even over wat anders hebben, hoelang duurt het nog voordat ze oorlog beslissingen aan deze dingen overlaten?
Gebeurt al. De VS heeft 2000 doelen laten selecteren in de oorlog met Iran door een custom versie van Grok.
En de eerste soldaten zijn ook al volledig autonoom door de AI van de tegenstander omgelegd.
Je merkt dat het voor de marketingafdeling steeds lastiger wordt om een nieuw model in de markt te zetten en daadwerkelijk de verschillen aan te merken. Wel is het fijn om te zien dat ze eindelijk wat doen aan het constant pleasen van de gebruiker. Ik wil ook bij het maken van code of refactoren dat ie meldt dat er bugs in de code zitten of dingen misschien gebeuren wat ik niet bedoeld heb. Niet dat het testen eromheen gaat maken of dat ik het expliciet moet vragen voor ik tests laat bouwen.
Ik draai ondertussen thuis mijn eigen modellen, Gemma 4 en Qwen zijn goed aan te sturen met MoE waardoor je voor veel van je taken gewoon heel goed uit de voeten kan. Alleen mensen die ergens geen snars van snappen zullen straks bereid moeten zijn ervoor te betalen. Experts kunnen rustig met een iets minder intelligent model uit de voeten.

Anthropic is doodsbang voor die setup en probeert open source onderuit te halen door het als security risk te bestempelen. Het is sowieso een bedrijf dat, ondanks dat ze echt wel sterke modellen leveren, steeds weer aan oplichterij doet in de vorm van papers, hypen, en lobbyen voor complete regulatie zodra ze zelf een moat hebben.

[Reactie gewijzigd door Zwarte_os op 1 juli 2026 10:58]


Om te kunnen reageren moet je ingelogd zijn