Opus 4.7 is uit en kan beter programmeren tegen meer tokenverbruik

Anthropic heeft Claude Opus 4.7 uitgebracht. Dat nieuwe taalmodel is de opvolger van 4.6 en haalt onder andere een stuk hogere scores op benchmarks voor programmeertaken. Volgens Anthropic is het model ook beter in visuele herkenning.

Anthropic zegt dat Opus 4.7 algemeen beschikbaar is voor alle gebruikers. Versie 4.7 heeft in verschillende interfaces ook 4.6 als het standaardmodel vervangen, al blijft Opus 4.6 nog wel beschikbaar.

Opus is het krachtigste algemeen beschikbare model van Anthropic. Het nieuwe model scoort ten opzichte van Opus 4.6 met name hoger in benchmarks als SWE-bench, die vooral op programmeertaken gericht zijn.

Daarnaast maakt Opus 4.7 grote sprongen in visuele herkenning, zegt Anthropic. Het bedrijf zegt dat Opus 4.7 in CharXiv veel hogere scores haalt. Die benchmark is bedoeld om llm's te testen op beeldherkenning. Volgens Anthropic kan Opus voortaan afbeeldingen in een hogere resolutie bekijken. Het kan omgaan met afbeeldingen met een breedte van 2576 pixels. Ook krijgt het model een beter geheugen, zodat het meer informatie kan onthouden in langere gesprekken en tussen meer taken.

Volgens Anthropic blijven de kosten per token hetzelfde als Opus 4.6. Versie 4.7 kost nog steeds 5 dollar per miljoen inputtokens en 25 dollar per miljoen outputtokens. Maar, waarschuwt het bedrijf, door een nieuwe manier van tokens berekenen kan het aantal gebruikte tokens oplopen tot 1,35 keer het verbruik van wat het bestaande model had.

IT-banen

Reacties (79)

Oon 17 april 2026 14:57

Ik merk zelf als Max gebruiker (omdat ik met Pro een paar keer per dag moest wachten om weer verder te kunnen) dat ik nu steeds dichter tegen m'n limieten aan kruip. Zal niet lang duren voordat ook Max niet meer geschikt is voor fulltime gebruik.

Daarnaast merk ik weinig verschil tussen dit nieuwe model of het vorige, het blijft een LLM.. Visueel dingen herkennen gaat nog altijd heel vaak fout, en de output is nog altijd even inconsistent. En dat terwijl Claude ver vooruit loopt op de concurrenten.

ChiLLeR

@Oon • 17 april 2026 15:01

Ik ben echt flabbergasted wat deze AI modellen kunnen programmeren. Met de juiste prompts bouw je echt super goede apps , waar je vroeger echt diepe technische programmeer kennis moest hebben en wekenlang aan het coden en debuggen was. Ben je nu echt met een paar uur klaar, voor interne tools is dit echt een enorme game changer.

Brandts @ChiLLeR • 17 april 2026 15:12

Ik vraag me wel af, wat kost het nu om een beetje app te vibecoden. Er worden prijzen genoemd per miljoenen input en output tokens maar dit zegt mij helemaal niets. Neem nou bevoorbeeld deze apps die in deze video gemaakt worden: YouTube: Can I Vibecode a $250M App Better Than a Pro Developer? (With No Code). Wat kost het nou gemiddeld om op deze manier een app te maken?

Oon @Brandts • 17 april 2026 15:17

Met een abonnementje van 10 euro red je dat wel, maar de payoff is gewoon niet te vergelijken. Je hebt een tool die niet te onderhouden is, vol security en performance issues, en je hebt zelf geen idee wat je nou eigenlijk hebt geproduceerd.
Leuk voor iets voor eigen gebruik, maar je wil echt geen bedrijf bouwen op zoiets.

bzuidgeest

Software development

@Oon • 17 april 2026 16:22

Daar ben je zelf bij. Net als code kan ik de AI ook de testcases laten maken, performance profiling laten doen. Af en toe een beetje bijsturen. Scheelt mij een hoop RSI. Ik weet wat er in moet en wat er uit moet en ik heb vaak een idee van verwachte performance.

Ik kan gewoon zien of de AI zijn werk goed gedaan heeft en daar eisen aan stellen. Ik denk dat je er zeker een bedrijf op zou kunnen bouwen. De klant wil alleen dat het werkt en performed. Of jij daar twee of twintig servers voor nodig hebt maakt ze niet uit. En tot voor koort: hardware is cheap, het saas abbo van de klant niet.

The Realone @bzuidgeest • 17 april 2026 17:33

Jij weet of AI goed zijn werk doet, omdat je de kennis hebt. Al die geschetse doembeelden zijn vaak ook niet van toepassing op software developers die nu AI gebruiken als hulpmiddel. Maar dat is een kwestie van tijd. Hoe meer jij AI laat programmeren, hoe meer kennis jij verliest (of nieuwe kennis doe je niet op doet) en hoe minder jij in staat zult zijn te weten of AI zijn werk goed doet.

Ik ben van Windows sysadmin naar DevOps engineer gegaan en heb echt redelijk wat ervaring in mijn vorige rol, maar als ik nu GPOs moet maken of AD replicatie moet debuggen, moet ik er echt weer even voor gaan zitten, want die kennis is nu al veel minder paraat. Nog een paar jaar, en ik ben het echt grotendeels kwijt.

Dan hebben we het natuurlijk niet over junior-devs die al direct beginnen met vibe-coding, die hebben niet eens een fundament om op terug te vallen en te beoordelen of hun gegenereerde werk wel of niet goed is.

bzuidgeest

Software development

@The Realone • 17 april 2026 18:04

Ja dat is absoluut een probleem. Maar de reactie was op de stelling of de ai goed werk kan afleveren. En dat kan gewoon.

Hoe het moet met ervaring opbouwen in de toekomst geen idee. Maar ook voor de ai zag ik dat al somber in. Iedereen is eng specialistisch tegenwoordig. Ik was ooit beheer als jij nu ben ik al tientallen jaren programmeur. De ervaring helpt mij enorm en ik programmeer alles. Dat houd mijn kennis breed. Maar de meesten die zijn website maker, of app maker, of service bus maker. Allemaal van dit eng dunne straatjes. Daarbuiten kunnen ze niets want heb begrip alleen trucjes. Dat was voor ai al zo.

We zullen gewoon moeten hopen dat er uiteindelijk specialisten overblijven. Hand gemaakte code, of artisenal code.

007Nightfire @bzuidgeest • 19 april 2026 21:03

Als AI beter en beter wordt, zal er minder vraag zijn naar programmeurs van datzelfde niveau. Immers kan AI dat net zo goed en sneller. Echter kost dat ook steeds meer tokens. De vraag naar programmeurs die boven het niveau van AI staan zal daarmee wel groeien, terwijl het aanbod kleiner wordt door de continue verbetering van AI. De echte specialisten gaan dus gouden tijden tegemoet verwacht ik.

bzuidgeest

Software development

@007Nightfire • 19 april 2026 23:48

De vraag is of er wel programmeurs blijven die boven het niveau van de ai staan, als ze echt boven verbeteren. Op dit moment zie ik nog weinig van echte intelligentie, maar het komt soms bedrieglijk dichtbij.

Elke dag kan er een nieuw "chatgpt" moment opduiken waar iemand agi heeft gebouwd en ik bedoel niet die van Sierra online😂

Wat gouden tijden betreft.... We zullen maar hopen dat ik genoeg specialist ben. Maar persoonlijk heb ik mijzelf altijd als een generalist gezien. Redelijk met alles. Dat houd werk divers.

Ik houd er rekening mee dat mijn werk als programmeur kan verdwijnen. Gelukkig kan ik ook een schroevendraaier vasthouden, maar wie weet wanneer dat vervangen word door een robot.

hatex @Oon • 17 april 2026 15:41

Tja ..... waarom moeilijk als t makkelijk kan ........ om er later achter te komen dat je door de mand bent gevallen als men uitleg hoe t werkt of een aanpassing vraagt...

Op school niet anders.... stagieres hier (andere branches ook) .... alles door 'ai' heen lopen duwen , top..... als zelfs de basis er niet is waar moet je op bouwen...

Nark0tiX @Oon • 17 april 2026 21:14

Klopt het blijft gewoon leuk gereedschap waarmee vooral de echt goede programmeurs een stuk sneller kunnen werken. En juniors sneller troep kunnen shippen

bzuidgeest

Software development

@Brandts • 17 april 2026 16:23

Ligt er ook aan hoe ze afrekenen. Copilot is nog per request, maar de meeste rekenen af voor tokens of iets vaags.

Je zal gewoon moeten ervaren wat, wat kost. En dan delegeren. Je kan ook voor simpele taken goedkope oudere modellen gebruiken en voor spannende taken opschalen. Haiku kan nog heel veel best goed. En dan laat ik aan het einde opus de foutjes eruit halen. copilot eerst en augment code voor het echt ingewikkelde.

Martinspire @Brandts • 18 april 2026 01:38

Het hangt eraf wat je gaat bouwen. Een nieuwssite als tweakers zou je in een weekje voor een paar honderd euro vast wel na kunnen bouwen. Na een dag en 50 euro kom je al wel op 80%, maar het is vooral de extra 20% waar je op stuk gaat. Bovendien is het maar de vraag of het op termijn nog goed uitkomt met uitbreidingen en onderhoud. Om nog niet te spreken over het gebrek aan tests wat de meeste LLMs gewoon niet uit zichzelf gaan toevoegen, of in ieder geval geen nuttige coverage. Verder is AI goed in bepaalde systemen bouwen. Een TODO app zal ie in een paar minuten wel klaar hebben voor een paar euro. Dat is wat ie veel moest maken, dus daar is ie goed in. Maar iets unieks bouwen, dat wordt al echt lastiger.

Oon @ChiLLeR • 17 april 2026 15:05

Voor interne tools helemaal prima ja, maar ik durf met een gerust hart te zeggen dat 80% van de code die Claude produceert niet door mijn code review zou komen en dan ben ik nog niet heel kritisch. De kwaliteit van de code en dan vooral van de architectuur is dermate slecht dat je er echt niet mee in productie wil.

Utrecht25 @Oon • 17 april 2026 15:27

Dan durf ik met een gerust hart te zeggen dat jouw ontwikkelstraat niet deugt.

Ter illustratie: Netflix doet 1500 PR's per week waar geen mens meer aan te past komt (google: netflix minions) . Het vereist echt wel een andere manier van werken dan wat de meeste developers gewend zijn. Het vereist een extreem sterk process, bv op het gebied van spec driven development, TDD, LLM code reviews, heel veel end2end tests, etc.

Als je ontwikkelproces afhankelijk is van enkele senior developers om het op de rails te houden: forget it. Maar de meeste volwassen ontwikkelteams hebben al zo'n goede ontwikkel straat dat zelfs junior devs weinig fout kunnen doen, en dan is de overstap op LLM's een stuk makkelijker. Meer dan 80% van ontwikkeltijd gaat dan niet meer naar ontwikkelen (of ontwikkel agents) maar naar goede specs/arch/tests/etc.

Oon @Utrecht25 • 17 april 2026 15:30

Heel leuk allemaal en je kunt zeker e.e.a. afdekken door rigoreuze geautomatiseerde checks in je CI/CD te hebben, maar dat is natuurlijk helemaal niet te vergelijken met de context van iemand die ff een appje gaat vibe coden en zelf geen kennis van programmeren heeft.

Daarnaast zijn er heel veel bedrijven die al weer richting mensen gaan omdat AI niet-deterministisch is en extreem onbetrouwbaar, genoeg onderzoeken te vinden die hebben uitgewezen dat het inzetten van AI op termijn duurder is dan mensen inhuren voor hetzelfde, en dan heb je het nog over kosten obv deze extreem gesubsidiëerde API's. Als je alles in-house moet doen met je eigen infra of straks een factor 100 meer betaalt voor je tokens dan ga je toch anders nadenken over hoe je AI kunt inzetten.

Llopigat @Oon • 17 april 2026 15:43

Ja precies, er is een groot gevaar dat je jezelf afhankelijk maakt en dan later wordt afgekepen. Eigenlijk het Microsoft model, ze komen altijd met hele goede deals voor M365 maar als je er eenmaal aan vast zit met alles dan komen ze bij het volgende contract met de duimschroeven aan.

Ik zie het als consument al erg, in het begin was het prachtig maar nu wordt alles constant afgeknepen en heb je er niks meer aan. Meer dan 20 in de maand ga ik nooit betalen voor iets dat mij geen geld opbrengt.

[Reactie gewijzigd door Llopigat op 17 april 2026 15:43]

Cybje

@Oon • 17 april 2026 15:39

Het blijft natuurlijk gewoon een tool. Als je er niet mee om kunt gaan, zoals veel vibe coders, krijg je er uiteraard code van lage kwaliteit uit. En je hoeft ook niet perse al je code ermee te schrijven. Het kan dan alsnog saai werk zoals het schrijven van tests voor jou doen. Dan gaat alsnog de kwaliteit van je project omhoog, want over het algemeen hebben developers de neiging wat lui te zijn qua tests schrijven.

Oon @Cybje • 17 april 2026 15:45

Ik ben zelf ook zeker niet anti-AI (zie mijn eerste comment, ik betaal zelf iedere maand een flinke smak geld aan Anthropic om hun tools te gebruiken), maar ik denk wel dat de mensen die er blind positief over zijn vaak niet goed snappen wat de risico's zijn, en dat het pushen van AI alleen maar 'omdat AI' een hele ongezonde realiteit aan het produceren is.
Het vervelende is dat AI niks beter kan dan iemand met ervaring, maar wel álles een klein beetje kan.
Bijvoorbeeld: Ik heb zelf weinig ervaring met unit testen, maar Claude kan die wel voor me schrijven. Ik kan alleen totaal niet beoordelen of het de lading dekt, en tenzij ik zelf specifiek ga vragen om ook negatieve testen te schrijven krijg ik alleen maar bevestiging van de happy flow. Dat is leuk om te zien of je grote regressie hebt, en het heeft wel enige toegevoegde waarde in het geheel, maar het is totáál niet te vergelijken met een junior-medior test engineer die de diepte in gaat en gaat kijken welke testcases écht waardevol zijn.

markvankampen @Oon • 17 april 2026 23:46

Ik kan je aanraden je eens in Test Drivem Development te verdiepen. Zoek op Youtube bijvoorbeeld eens naar het kanaal van Modern Software Engineering met Dave Farley.

Als ik zou moeten kiezen welke code ik zelf schrijf en welke de AI/LLM, dan zou ik zelf de tests schrijven en de rest aan de AI overlaten. Mijn toegevoegde waarde is begrijpen wat er gemaakt moet worden en hoe dat werkt. Die tests bewaken dat de code blijft doen wat 'ie moet doen.

pietvelleman @Oon • 17 april 2026 16:30

Ik ben zeer positief over AI en betaal ook een smak geld aan Anthropic.

Ik kan nu dingen programmeren die ik nooit zelf zou hebben gekund (of in 25% van de tijd).

Echterrrr...
Je kunt heel snel goed werkende apps maken, prachtige fornt-ends en goed werkende backends. Maar als je onder de kap kijkt, zie ik toch wel heel veel niet-efficiente code. Voorbeeld: vreemde joins bij db queries die volledig onnodig waren. De queries deden hun werk en gaven de juiste output... Maar via te veel onnodige omwegen.

En als je die code-review niet doet en blind vaart op wat Claude e.a. voor je maakt... dan zou je dat nooit gezien hebben. Het werkt immers prima (bij een paar gebruikers in een testomgeving). En daar zit toch best een gevaar, zou ik als niet-professionele programmeur zeggen.

[Reactie gewijzigd door pietvelleman op 17 april 2026 16:35]

Barsonax @Utrecht25 • 17 april 2026 22:41

Netflix is niet zomaar op dat punt gekomen. Dat is niet iets wat zo gaat werken bij andere bedrijven en los van organisatorische belemmeringen heb je om zoiets op te zetten wel echt veel kennis in huis nodig.

Martinspire @Utrecht25 • 18 april 2026 01:34

Veel van die PRs zal in applicaties zijn die niet door hun klanten worden gebruikt. Verder zijn er ook steeds meer en meer issues met Netflix en is er wel degelijk het risico dat AI op termijn de boel wel echt een stuk erger maakt.

AI is goed met streng toezicht en genoeg kunde om te begrijpen wat wel en niet fout gaat. Ik heb laatst ook gezien dat RTL hele development in AI straten laat ontwikkelen, maar ik moet nog maar zien of dat op termijn wel zo goed gaat werken. AI is goed voor basic stuff en nieuwe dingen bouwen. Onderhoud en kwaliteit leveren doet het echt nog niet. Het ziet er vooral indrukwekkend uit als je niet beter weet.

Defspace @Oon • 17 april 2026 15:30

Je bepaalt de architectuur zelf he. Claude of codex en gemini doen gewoon wat je van hen vraagt en volgen je instructies. Ik ben met een uitbreidde applicatie bezig en ik durf wel te zeggen dat de code nagenoeg optimaal is, temeer omdat ik zelf ook om refactoring, optimalisaties en code reviews vraag.

Moortn

@Defspace • 17 april 2026 16:29

Je bepaalt de architectuur zelf he

Dat kan. Er zijn ook genoeg mensen die AI enkel functionele opdrachten geeft en geen idee hebben wat voor code AI heeft bedacht. Op LinkedIn zie ik genoeg berichten van mensen die zonder enige programmeerkennis een "AVG-proof" applicatie hebben "gemaakt" met AI. De architectuur en kwaliteit van de code kan dan alle kanten op gaan, zeker als features in een onlogische volgorde worden toegevoegd.

Voor een hobby projectje waar ik 2 jaar geleden aan was begonnen en behalve de basis niks aan heb gedaan, is de code van AI (mix van modellen, afhankelijk van m'n prompts) ook niks slechter dan wat ik zelf zou verzinnen. Hij bouwt verder op wat ik al had bedacht en de instructions worden continu bijgewerkt voor gevallen waar nog geen voorbeeld van was.

blackSP @Defspace • 20 april 2026 09:03

Eens. Ik heb de afgelopen maand met Gemini 3.1 Pro gewerkt aan een in c geschreven 100% retro accurate Pacman clone, gebaseerd op de originele 1980 versie. Het resultaat is een geheugen geoptimaliseerde binary, goed leesbare elegante code zonder memory leaks. Kanttekening: dit lukt, met de huidige staat van de technologie, aleen maar als je zelf de taal goed kent, weet hoe je een systeem ontwerpt, etc.

Maar je hoeft eigenlijk maar weinig bij te sturen, Gemini werkt gewoon zelfstandig als een senior software ontwikkelaar die vrij weinig fouten maakt. Fyi, ik werkte als c programmeur vanaf eind jaren tachtig en ben daar nu hobbymatig nog steeds me bezig.

CorbataGames

@Defspace • 17 april 2026 20:01

Dat is omdat jij als programmeur denkt. Fouten spot. Queries en database structuren na kijkt.

Claude in handen van een goede programmeur is echt heel veel waard. Ik kan echt zo veel meer en sneller dan voorheen. Bij mensen zonder deze achtergrond, werkt het een heel stuk minder en is er veel meer risico.

Martinspire @Defspace • 18 april 2026 01:35

Niet helemaal waar. Het zal altijd proberen naar eenheidsworst te werken, vaak het wiel opnieuw uitvinden en bij code blijven waar veel mensen mee werken, ongeacht of dat goede kwaliteit is. Daarnaast zal het steeds meer getraind worden op code die het al zelf gemaakt heeft en daardoor geen nut heeft. Dat is alsof je een grasmaaier laat rijden op gras wat al gemaaid is. Verder zijn vooral populaire frameworks en tech stacks erin, ongeacht of dat werkelijk de beste optie is. Zo bouwt het vrijwel alles met React, ongeacht of dat nou een zinvolle keuze is.

[Reactie gewijzigd door Martinspire op 18 april 2026 01:36]

pizzafried @Martinspire • 18 april 2026 21:28

omdat je niet zegt in welke programmeertaal je het wil hebben.

bzuidgeest

Software development

@Oon • 17 april 2026 16:19

Ik ben het met de rest eens dat je dan gewoon slecht duidelijk hebt gemaakt wat je wil. Jij stelt de vraag, als je iets verwacht moet je dat melden.

Ondertussen hebben die dingen voor mij fpga designs gemaakt, code voor de pico, reverse engineering met ghidra van dos games, reverse engineering van microcontroller code, gewoon .net of c programmeren. Source code port van de ene taal in een taal die beter in mijn straat of eigen code past.

Je kan het zo gek niet bedenken, je moet beetje bijsturen, maar met het juiste gebruik zijn ze zo goed dat ze ook door jou review heen moeten kunnen komen. Tenzij je iets heel bizars eist dan tegen alle zinnigheid ingaat (of jij nou geloofd of het moet of niet

)

Barsonax @Oon • 17 april 2026 22:46

Je kan er echt wel productie code mee leveren mits je de juiste context en guardrails hebt.

Het is bijv belangrijk dat je skills maakt (of hergebruikt) waarin je voorkauwt aan de AI hoe je je code wilt hebben, bijv hoe een api endpoint eruit moet zien.

Met zomaar maar wat vragen gaat het idd niet lukken. Dan krijg je een of ander gemiddelde terug uit de trainingsset en daar wordt je idd niet zo blij van.

Orian0k @Barsonax • 19 april 2026 06:09

Ze zijn juist goed in het copyen van de al reeds staande opzet naar mijn ervaring, levert een skill voor endpoint creatie op deze manier echt wat op?

Barsonax @Orian0k • 19 april 2026 07:46

Mijn ervaring is dat die zonder skills maar wat gaat verzinnen wat hopelijk lijkt op wat je hebt maar vaak genoeg niet en ja dat is met de latest en greatest modellen.

En dan valt de grootte van de codebase nog wel meer met iets van 30k loc.

En los van kwaliteit kost het een hoop tijd en tokens als die iedere keer je hele codebase moet scannen

[Reactie gewijzigd door Barsonax op 19 april 2026 08:30]

Llopigat @ChiLLeR • 17 april 2026 15:36

Voor zakelijk wel ja omdat je er geld mee kan verdienen (en mensen kosten ook geld) maar voor prive/hobby wordt het steeds minder bruikbaar op deze manier.

[Reactie gewijzigd door Llopigat op 17 april 2026 15:36]

TheNooz @ChiLLeR • 18 april 2026 09:59

Dan vraag ik me toch af hoe lang je al niet meer in aanraking bent met echt programmeren.

Ik heb zeer geprobeerd om het te laten werken, eerlijk waar maar al vanaf het tweede prompt zie je het kaartenhuis steeds verder instorten.

Daarnaast, als ik dezelfde shortcuts mocht nemen als de AI dan was ik ook snel klaar maar om de een of andere reden als ik een tool in elkaar trap in een uur die overtredingen maakt in clean architecture, dependency injection en nog meer patterns dan ben ik een beunhaas maar als Claude z’n hele tokenbudget erop verbrast plus nog iemands maandsalaris erbij dan zijn mensen flabbergasted.

Er is echt een gigantische honeymoon phase aan de gang. Ik hoop dat mensen er snel van neerkomen.

ChiLLeR

@TheNooz • 19 april 2026 17:10

Al jaren niet meer idd. En ik geloof best dat het volgens de theorie niet de netste code is. Maar je moet wel wat instructies geven en daar ook op auditen af en toen. Zoals netjes mvc opbouwen, geen duplicaat code, security etc. Maar naar mijn idee zolang het geen erp is maar tools die het werk gemakkelijker maken, why not? Vroeger zaten handige Harries excels met VB script en macros te bouwen.

switchboy @ChiLLeR • 18 april 2026 17:33

Vol met random npm packages gekke varabelnamen overbodige comments rare keuzes in het opbreken van functies en security gaten.

Je moet die modellen als en kleuter behandelen en echt aan het handje houden.

[Reactie gewijzigd door switchboy op 18 april 2026 17:34]

ocf81 @Oon • 17 april 2026 15:00

Zou het niet zo zijn dat op een gegeven moment lokaal draaien toch een betere kosten/baten-plaat oplevert?

Oon @ocf81 • 17 april 2026 15:03

Lokale LLM's zijn vooralsnog totaal niet te vergelijken, want 99% van de kracht van deze tools zit in wat ze er omheen hebben gebouwd. Het LLM zelf is niet veel veranderd t.o.v. GPT-3 behalve dat er meer data in zit en meer resources achter zitten, maar dat het nu andere tools kan aanroepen e.d. is wel een groot verschil.
Dat totaalpakket terzijde zijn lokale LLM's zelfs op absurde hardware nog steeds traag en onbetrouwbaar, dus tenzij je 20.000 euro gaat uitgeven aan een LLM-server voor thuis blijft het lastig te vergelijken.

Uiteindelijk zullen we wel op een punt komen waar de bubbel knapt en diensten als Claude en ChatGPT niet meer het gebruik subsidiëren door enorme verliezen te draaien, en dan zul je als gebruiker véél meer moeten gaan betalen. Misschien dat dan de kosten van zo'n dienst zo hoog worden dat thuis hosten interessant kan worden.

ZpAz @Oon • 17 april 2026 15:13

Van de agentic coding systemen zijn ook open source varianten van zoals https://opencode.ai/ waar je elke tool-aanroepende LLM in kan haken. Wat bijvoorbeeld met een GPT 3.5 al wel kon, ga je zeker niet dezelfde resultaten halen als met de moderne systemen. Er zit echt wel een wereld van verschil in de verschillende levels.

Hier een pagina met een benchmark voor coding per verschillende modellen, als je helemaal rechts kijkt zie je GPT 4 in het lijstje staan. Drie zou nog wel een stuk lager scoren, maar ik weet niet eens of GPT 3 tool calling doet.

Er zijn wel open source modellen die je wel thuis zou kunnen draaien als je goede hardware hebt, welke agentic kunnen programmeren, maar vooralsnog wil je dan wel redelijk flinke hardware en zijn ze echt wel een stuk minder slim dan de top modellen.

[Reactie gewijzigd door ZpAz op 17 april 2026 15:19]

Martinspire @ZpAz • 18 april 2026 01:22

Nog een self-hosted model die je ervoor kunt aanraden?

ZpAz @Martinspire • 18 april 2026 01:53

Bij die benchmarks can je als optie 'open' kiezen. Maar zelf heb ik de hardware er niet voor om dat serieus te testen. Mensen thuis kiezen vaak voor een Mac Mini met minstens 24GB ram, of een RTX 3090 voor bang for buck. Dat is imho wel een beetje de onderkant wil je bepaalde agentic modellen lokaal draaien.

Orian0k @Martinspire • 19 april 2026 06:11

Devstral is okay

batjes @Oon • 17 april 2026 16:10

Met Ollama en andere tools kun je dit soort systemen zelf eromheen bouwen. Werkt verassend goed.

Het is de capaciteit, voor een beetje deftig model heb je al snel 100gb aan VRAM nodig. Dan wordt het al heel snel duur om het allemaal zelf te draaien.

Utrecht25 @ocf81 • 17 april 2026 15:18

Kort antwoord: Normaliter niet.

Je moet echt bijna fulltime met Claude praten om aan het 200 Eur per maand abo te komen.

Daar tegenover is het beste open source model op dit moment geloof ik Minimax M2.7, wat een beetje achter blijft op claude opus, en bij voorkeur op ~460 GB VRAM draait... Google Gemma is ook een optie, maar dat is een zwakker model en wil ook liefst 32 GB.

Op korte termijn gaan we allemaal wel lokaal LLM's draaien op onze pc's en gsm's, maar meer voor bijvoorbeeld simpele taken zoals speech-to-text en zeer simpele zaken zoals iets aanpassen in je kalender, een mailtje sturen, etc.

ocf81 @Utrecht25 • 17 april 2026 16:14

Tja, ik draai nu lokaal Ollama met twee W6800's. Dat is voor de gemiddelde taak wel oké. Voor auto-complete ook wel, als je de context goed meegeeft. Voor het opstellen van hele programma's schiet het inderdaad nog tekort.

Sircuri @Oon • 17 april 2026 15:24

Ik merk de laatste paar dagen hetzelfde. Ik heb ook het Max abonnement (108 EUR) en had zowaar begin deze week dat mijn CLI ineens de befaamde "you have used 98%" berichten begon te tonen en de boel tot een halt kwam. Door een 2-tal wijzigingen in het beleid van Anthropic had ik bij elkaar iets van 100 euro aan gratis "extra" credits gekregen over en die gaan er nu ook heel hard doorheen.

Oon @Sircuri • 17 april 2026 15:26

Ja die extra usage is een beetje als een UPS bij stroomuitval; tijd om je spul netjes af te sluiten, maar je kunt echt niet verder werken. Bij Pro was ik meer kwijt aan extra usage dan aan het abonnement zelf.

Sircuri @Oon • 17 april 2026 15:28

Die extra credits zijn inderdaad als de 10 EUR per MB dat je over je data-bundel heen gaat. Maar goed, dat is gratis gekregen.

bzuidgeest

Software development

@Oon • 17 april 2026 16:14

Ik zit bij augment code en opus 4.7 is 50% off tot eind april. Dus even goed gebruik van maken.

Nark0tiX @Oon • 17 april 2026 21:13

Vooral met claude code gaan je tokens keihard zonder al te veel resultaat. in copilot cli kan je echt 10x zoveel dingen doen zonder limieten te raken heel vaag.

https://opencode.ai incombinatie met superpowers is ook veel beter, qua token verbruik in iedergeval.

iqcgubon @Oon • 18 april 2026 08:54

En als je aan de limiet zit? Toch maar weer zelf nog eens nadenken, of het laten liggen tot morgen?

ACL @Oon • 18 april 2026 22:29

Eh Gemini is het veel beter in visuele herkenning. Met antigravity kan ik prima de llm GUI wijzigingen laten inspecteren en finetunen

Nimac91 @Oon • 20 april 2026 09:33

De limieten zijn gekomen door de enorm grote hoeveelheid programmeurs en gebruikers die zijn overgestapt op Claude. Helemaal toen Claude als enige partij zei de regering niet te willen helpen met defensie waar de anderen dat wel doen zijn een heleboel mensen overgestapt. Nu hebben ze capaciteits problemen met de hoeveelheid users waardoor ze alle limieten hebben moeten verlagen. Ik verwacht eigenlijk juist dat we bij toekomstige modellen juist minder token verbruik gaan krijgen over de tijd dat ze efficienter worden. 4.7 Opus voelt voor mij niet perse beter dan 4.6 nog, maar ik moet zeggen dat ik al een week met een issue zit waar ik met 4.6 ook niet doorheen kwam dus het is lastig te bepalen nog.

Volgende week komt Gpt 5.5 uit en GPT Image 2.0. Die zou blijkbaar alweer stukken beter moeten zijn dan opus 4.7 en tevens veel sneller responden en veel minder token gebruik. Ik ben benieuwd, ik zal wellicht een poging wagen weer op codex te gaan als dat waar blijkt te zijn. Ikzelf vindt het erg irritant geworden ook als Max gebruiker(20x) dat ik toch een drop in kwaliteit voel. Ik kan het niet echt bestempelen, maar 4.7 opus voelt slechter als wat opus 4.6 was bij release. Maar zeker de laatste maand was opus 4.6 verschrikkelijk slecht en 4.7 voelt voor mij aan als matig.

Voor frontend taken is het overigens wel een verademing. Veel beter.

Yellow 17 april 2026 14:52

Leuk deze verbeteringen op "papier", maar na zo'n benchmark wordt de performance toch een stukje teruggeschroefd. Ik ben dus echt benieuwd naar Mythos.

Bouwer21000 @Yellow • 17 april 2026 15:39

Waar baseer je dat op?

Stukfruit

Software development

@Bouwer21000 • 17 april 2026 15:50

Zie deze GitHub issue van iemand bij AMD.

Eerst benchmarks, daarna terugschroeven.
Wel icm Claude Code.

[Reactie gewijzigd door Stukfruit op 17 april 2026 15:54]

aiDisCus @Yellow • 17 april 2026 18:32

De kunst is ook om de juiste benchmark(s) te laten zien of niet te laten zien, zie ook dit commentaar: https://www.reddit.com/r/BetterOffline/comments/1snrb48/claude_opus_47_shows_a_significant_regression_on/

Martinspire @Yellow • 18 april 2026 01:18

Het is vooral de performance-per-dollar die wordt teruggeschroeft. Hij zal best goede resultaten geven, maar als je er dus bijna 1,5 keer meer voor moet betalen, dan is het maar de vraag of dat de kosten wel waard is.

jmk 17 april 2026 19:52

Ik heb Claude Pro en was in 20 minuten door mijn 5u limiet heen voor Opus 4.7. Echt van 0 naar 100.

Was ook wel voor mij een omvangrijk project (indexeren spotweb full body search) maar toch. Ben benieuwd naar het resultaat

Dynamix86 @jmk • 18 april 2026 04:10

Wat bedoel je met "indexeren spotweb full body search" en wat is je doel daarmee? Ik ben bekend met spotweb btw.

jmk @Dynamix86 • 18 april 2026 04:48

Nou normaliter kan je alleen zoeken op de spotnaam in Spotweb. Je kan dan bijvoorbeeld wel zoeken op de naam van een album (OK computer) maar niet op de naam van een track (Paranoid Android). Ik heb een script laten maken die de volledige inhoud van de spots(de beschrijvingen, de title tracks. dat soort dingen) ophaalt. Vervolgens heb ik een webservice laten maken die kan zoeken in die full bodies. Ook ben ik bezig de met een backfill van oudere spots. Werkt heel erg goed tot nu toe moet ik zeggen. Hij kan alles doorzoeken. Ook heb ik een truncate script laten maken om herhalende teksten zoals reclames te verwijderen.

De database wordt echter zo enorm groot dat het nu 15+ seconde duurt om 1 zoekopdracht te voltooien. En er komt nog veel meer data bij. Met een idee van Claude ga ik nu een aparte indexed database laten maken van die full bodies sneller kan later doorzoeken. Dit zou de zoektijd moeten verlagen naar 0,5 seconde.

Wanneer de backfill klaar is(alle spots vanaf 2009 afhankelijk van de retentie van mijn newsserver) ga ik die indexering implementeren. Backfill inladen gaat heel goed en stabiel, maar enorm langzaam (24u per oud jaar aan data).

Dynamix86 @jmk • 18 april 2026 12:58

Ik snap het nu. Leuk project. Heb je het zo vaak dan dat je een track zoekt uit een bepaald album en het niet kunt vinden op spotweb?

Heb je je database ook gecomprimeerd? Dan zou mogelijk ook kunnen schelen in de laadtijd van de zoekresultaten.

jmk @Dynamix86 • 18 april 2026 13:33

Dank je! Ik weet nog niet of ik er veel aan ga hebben. Het zijn allerlei verzamelingen zoals 'top 40 week 26' waarvan in wil kunnen zoeken. Maar dit geldt ook voor andere soort media.

Ik vind het vooral een heel leuk project om aan te werken. een vriend van mijn geef ik ook toegang om te kunnen grasduinen.

Dat met die compressie ga ik onderzoeken. Kan ik altijd proberen eventueel later. Dank je voor het meedenken!

[Reactie gewijzigd door jmk op 18 april 2026 13:37]

Dynamix86 @jmk • 18 april 2026 13:46

Ik hoop dat het je oplevert waar je naar zoekt.

Wees je wel bewust dat spotweb, vergeleken met de beste usenet-indexers zoals Ninja-Central, Drunkenslug en NZBfinder, behoorlijk belabberd is wat betreft het aantal resultaten dat je erop kunt vinden. Als je echt de beste database wilt opzetten, dan zou je kunnen denken aan het scrapen van die websites, maar dat is waarschijnlijk een aantal niveaus moeilijker dan wat je nu doet met Spotnet. Just a thought

The-Source 17 april 2026 14:53

Ik kreeg nu juist bij lovable.dev de melding dat door het uitbrengen credit kost tot het einde van de maand lager is dan normaal( op lovable). Maar in hoeverre lovable op de achtergrond Anthropic gebruikt weet ik natuurlijk niet.

ZpAz @The-Source • 17 april 2026 15:01

Dan heb je iets gemist op dat bericht

The-Source @ZpAz • 17 april 2026 15:35

Volgens mij is dat toch juist wat ik zeg, dat het minder credits kost. Maar dat bericht betekend niet direct dat ze het ook gebruiken. Beschikbaar vs gebruiken

Stukfruit

Software development

17 april 2026 15:12

Wat in het artikel staat is een marketinguiting van Anthropic zelf, maar afgaande op dit, dit (blijkbaar iemand bij AMD, bevat veel testresultaten), dit en eigen ervaringen met 4.6 die sinds een paar maanden merkbaar verslechterd is zou ik eerst graag onafhankelijke resultaten willen zien.

In het kort: meer hallucinaties, minder goed prompts volgen, standaard minder "denken", minder duidelijkheid. En tussen de regels door met enige voorzichtigheid bevestigd door een werknemer bij Anthropic:

> Thinking depth had already dropped ~67% by late February

We landed two changes in Feb that would have impacted this. We evaluated both carefully:

1/ Opus 4.6 launch → adaptive thinking default (Feb 9)

Opus 4.6 supports adaptive thinking, which is different from thinking budgets that we used to support. In this mode, the model decides how long to think for, which tends to work better than fixed thinking budgets across the board. `CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING` to opt out.

2/ Medium effort (85) default on Opus 4.6 (Mar 3)

We found that effort=85 was a sweet spot on the intelligence-latency/cost curve for most users, improving token efficiency while reducing latency. On of our product principles is to avoid changing settings on users' behalf, and ideally we would have set effort=85 from the start. We felt this was an important setting to change, so our approach was to:

...

Deze wijzigingen voor 4.6 lijken niet meer te werken voor 4.7.

[Reactie gewijzigd door Stukfruit op 17 april 2026 15:28]

i7x 17 april 2026 15:15

Wel goed om ook te vermelden dat de abonnementen nu ook meer tokens mogen gebruiken. Dus dat compenseert het wel wat. En als je de andere modellen gebruikt is dat al helemaal een voordeel.

TheVivaldi 17 april 2026 15:47

Ben ik de enige die bij het lezen van de titel aan de codec dacht?

michelr 17 april 2026 16:14

Tokenfactor in GitHub is 7.5. Joejoe!

XC9 @michelr • 17 april 2026 16:46

Ja dit is wel bijzonder. Ik hoop dat dit nog gaat veranderen. Ik las op X dat ze de rate limits hebben aangepast zodat het in Claude Code niet veel meer verbruikt dan 4.6. Waarschijnlijk nog een truc om mensen Claude Code te laten gebruiken ipv het model te gebruiken in bijv. GitHub Copilot...

[Reactie gewijzigd door XC9 op 17 april 2026 16:47]

Tom970G1 17 april 2026 17:13

Claude had hier wmb een flinke achterstand op codex. Claude max geprobeerd maar een refund genomen. Claude had veel meer bijsturing nodig en was veel chaotischer en risicovoller dan Codex

zndrwrk 17 april 2026 18:39

Ik ben geen developer maar heb wel in het verleden wat gedaan. Dankzij Claude heb ik een heel leuk systeem kunnen uitwerken op basis van mijn huidige werkervaring. Maar ja, het blijft ook A.I. dat zit te zeggen dat het goed in elkaar zit maar ik heb niemand die het echt challenged. Ik zit er eigenlijk echt mee, uiteindelijk heb ik niets meer dan een werkende prototype dat ik liever aan een team echte devs wil geven.

Daar zie ik dan wel weer toekomst in, een echte domein expert heeft een visie van hoe iets moet werken. Functionaliteiten, edge cases, ... Een developer heeft zijn eigen sterkes maar gaat niet in hetzelfde hokje als een domein expert denken. Ziet bepaalde logica niet voor wat het is etc..

Om een interne tool te bouwen voor je bedrijf, al is het een redelijk simpele converter van data via python, moest eerst door een hele hoop loops gaan om goedgekeurd te worden. Project manager betrekken die je visie vertaalt. Backend devs, frontend devs.. Niet prioriteit, dus back of the line en "we zien wel wanneer er tijd voor is". Een jaar wachten.

Nu? Je komt met een idee en je weet vrij snel of het 1) haalbaar is en 2) effectief interessant is voor je werk.

In mijn geval: Ja. Ik wil het in productie. Maar durf ik te doen met de tool gemaakt door Claude? Kan ik geen antwoord op geven.

jhnddy @zndrwrk • 17 april 2026 19:12

Als developer is mijn ervaring met domein experts dat ze heel knappe tooltjes kunnen ontwikkelen die het werk een stuk makkelijker maken, o.a. flink wat Excel macro's, maar vaak komt er dan een tool uit die:

Perfect werkt voor degene die het verzonnen heeft, maar heeft een dusdanig complexe handleiding dat het nauwelijks over te dragen is
Foutgevoelig is bij verkeerd gebruik
Risico's hebben op het gebied van security
Dusdanig zijn opgezet dat het nu werkt, maar niet schaalbaar

Met een beetje pech wordt zo'n tool al bij een paar klanten ingezet, die dan laaiend enthousiast zijn en aan Software Development vragen om er even een webtool van te maken die gelijk voor alle klanten gebruikt kan worden.

En dan gek opkijken dat een tool die data integriteit en veiligheid waarborgt en begrijpelijk is voor de gebruikers, langer dan 2 dagen prototypen kost om in elkaar te zetten

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (79)

Sorteer op:

Weergave: