Anthropic toont Claude Sonnet 4.5 en functie met on the fly geschreven software

Anthropic heeft Claude Sonnet 4.5 aangekondigd. Daarnaast komt het bedrijf met Imagine with Claude, waarbij het AI-model software on the fly genereert als een gebruiker ergens op klikt. Volgens het bedrijf kan software van de toekomst zo werken.

Imagine with Claude is een experiment dat vijf dagen beschikbaar is voor klanten met een Max-abonnement van 200 dollar per maand, meldt Anthropic. Waar AI-modellen tot nu toe software schreven en compileerden, bedenkt Imagine with Claude de software op het moment dat de gebruiker op een knop klikt. De software werkt daardoor trager, maar het laat volgens het bedrijf zien hoe software in de toekomst zou kunnen werken. Doordat het AI-model vensters on the fly bedenkt, zijn die aan te passen aan de gebruiker en de situatie.

De release staat verder los van Claude 4.5 Sonnet, dat het bedrijf ook aankondigt. Het nieuwe model is uitgebreider getraind en daardoor minder geneigd om gebruikers te vleien, te misleiden of te chanteren, zo claimt Anthropic. Dat gebeurde bij versie 4 meer. Daarnaast claimt het bedrijf dat het nieuwe model onder meer beter kan programmeren.

Door Arnoud Wokke

Redacteur Tweakers

29-09-2025 • 21:06

23

Submitter: GewoonYunus

Reacties (23)

Sorteer op:

Weergave:

Het idee is leuk, maar als je iets verder kijkt dan wat ze vertellen is het eigenlijk nog steeds weinig meer dan automatisering van de UI.

Met dat voorbeeld voor de "zelfgeschreven" software komt er ook nog steeds weinig meer uit dan een veredelde todolijst, zoals de meeste apps die gevibecodeted worden. Zonder begrip van wat er gaande is zie ik dat voorlopig eigenlijk ook nog niet echt veranderen. De tech is waanzinnig cool, maar hoe ze het presenteren slaat een beetje naast de plank.

Wat ik wel heel mooi vind is dat dit steeds meer een kant op gaat waarbij je als developer met kennis niet meer de typische geestdodende troep hoeft te maken, dus het lijkt mij dat dit vooral goed gaat zijn voor mensen die aan maatwerk doen. De rest kun je terug overboord gooien naar bv. je werkgever die nu iemand zonder programmeerkennis kan lastigvallen met onrealistische eisen en deadlines voor zaken die al honderd keer op een betere manier zijn opgelost :Y
Klopt, ik probeer 't elke keer een kans te geven, maar het kost vaak meer tijd dan dat het oplevert. Vandaag ook weer. Ik wist niet meer of een bepaalde functionaliteit out of the box werd ondersteund, dus ik vraag het even. Ja, sinds versie x.y kun je method() gebruiken en ik krijg er zelfs wat voorbeeld code bij. Nice! Alleen method() bestaat helemaal niet. Niet voor versie x.y en niet erna. Gewoon niet. Kon beter zelf gelijk even in de docs ctrl-f doen.
Nu de modellen steeds slechter worden (of te veel nutteloze informatie bevatten) is het ook steeds verstandiger om er standaard llms.txt-integratie bij te pakken of gewoon meteen een MCP-server als deze beschikbaar is voor een framework of toolkit.

Maar ook daarmee moet dat tekstbestandje niet gebruikt worden als marketingmateriaal en moet er daadwerkelijk nuttige informatie uit de documentatie in staan die je nodig hebt tijdens het werk. Dat gaat hier en daar ook nog wel eens fout.

En gelijk weer een leuk puntje om de "het is intelligent"-mensen het zwijgen op te leggen: nee, de papegaai is handig, maar verre van intelligent.
Exact dit. Bizar om te zien, zeker als het over je eigen library gaat.
Vaak er naast ? :). Ik schrijf dingen sneller. Onlangs nog een weekje aan het experimenteren geweest met van alles en nog wat. Zeg je doe een aanpassing ... heeft het dingen gewoon gewist, meerdere malen voorgevallen. Als het wat groter begint te worden vanaf ergens tussen de 1000 en 2000 lijnen is het huilen met de pet op (enja ik heb een betaalde account). Auto complete van een lijntje zit er dikwijls naast. Je moet echt alles gaan voorkauwen en opbouwen en opbouwen en opbouwen. Ben je wat vergeten dan kan het mislopen. Unittests schrijven ? Ja er komt iets uit, maar correct is wat anders

Waar het wel werkt is .... als ik les geef in avondschool, Want dat is triviale code. Maar wat complexer met design patterns, nopes.

En je kan alt tab + zoeken in chrome uitsparen. Ja ik ken niet elke functie van elk framework dat ik gebruik, kan je dit rechstreeks in je editor opzoeken. Dit wilt niet zeggen dat het daarom ook correct is. Maar het geeft je een idee en zo kan ik "sneller" verder. Maar dit is soms ook gewoonweg niet bruikbaar

Als je wat kan programmeren dan is dit een hulpmiddel met een 50/50 kans. Maar zelfs mijn studenten zagen vorig jaar in dat op het einde van de cursus AI eigenlijk geen hulpmiddel meer was. In het begin wel, maar als het complexer en groter werd, dat het eigenlijk hun aan het vertragen was.

Ik heb dus net hetzelfde gevoel als jij dus. Tevens het leert dingen van github en stackoverflow. Zelfs de antwoorden op stackoverflow die marked zijn, zijn niet altijd 100%. Maar op github staat veel rommel code, ook goeie code, maar in mijn ogen veel meer rommel. En dat gaat daar nu code bijzetten dat alleen werkt als de maan, de zon, de zee en de sterren in de correcte stand staan. Dat kan dus niet beter worden.

[Reactie gewijzigd door cricque op 30 september 2025 08:47]

Hier loop ik ook regelmatig tegen aan. Ik werk met 3D printen maar ben nog redelijk nieuw hierin. Vaak vraag ik een AI om hulp om kwaliteit of snelheid te verbeteren. Helaas krijg ik regelmatig suggesties om functies in de software (Bambu Studio / OrcaSlicer) te gebruiken die totaal niet bestaan.
Yep, klopt wij gebruiken het heel veel op kantoor om saaie dingen te bouwen hahaha
Als (ex-) programmeur heb ik altijd begrepen/ervaren dat het schrijven van 90% van de code ongeveer 10% van de tijd kost: het neerzetten van het raamwerk van de code. De overige 10% van de code, het finetunen en detailleren van de code, kost zo'n 90% van de tijd.

Nu met de AI code generatoren begrijp ik dat die zo'n 80% van de code schrijft... Dat houdt in dat de programmeur dus de code van een ander moet gaan door ploegen en daar uiteindelijk een goed werkend geheel van moet maken. Dat kan niet voordelig uit komen... de benodigde 20% van de nog te schrijven code zal eerder in de buurt van de 100% van de tijd liggen dan dat het serieuze tijd besparing oplevert.

Zomaar een filosofietje op wat vuistregels en een vergelijking met off-shoring van software ontwikkeling (naar India) is onderdeel van mijn ervaring.
Klopt, dat kan ik met genoeg ervaring bevestigen. Daarom zie ik het ook niet als concurrentie voor het serieuzere werk :)
weet ik zo net nog niet. Ik heb nooit kunnen programmeren maar wel veel programmeertalen kunnen lezen. heb altijd uitgebreide briefings geschreven voor programmeurs die ik dan inhuurde voor custom werk. ben nu mijn 2de programma door caude aan het laten programmeren. als je eenmaal weet hoe je je briefing aan moet passen voor claude is mijn programma 100% werkend (kost me 3-4 weken) kortom als je weet wat je wilt en een goede briefing kunt schrijven (in delen hakken voor claude) heb je geen programmeur meer nodig..
Als je domeinkennis hebt dan kom je waarschijnlijk inderdaad een stuk verder dan de gemiddelde vibecoder, maar dan zit je nog steeds in de hoek met mensen die hun kennis toepassen ipv "yolo" roepen en er vibecodedetend een todolijstje uit laten pruttelen ;)

[Reactie gewijzigd door Stukfruit op 30 september 2025 14:28]

Zat laatst bij een discussie over AI in het onderwijs waarbij de consensus was dat AI beter is dan een slechte leraar maar voorlopig slechter zal zijn dan een goede leraar

Dat is met programmeren voor mijn gevoel ook zo. Als je een simpele web app gaat maken dan kom je met AI best ver. Maar complexe apps is wel echt een ander verhaal.

Mijn oplossing is AI widgets laten genereren die in een groter framework geplugd kunnen worden. Perfect voor mijn prive dingetjes maar zou het op dit moment professioneel niet perse toepassen
De benchmark scores: https://www.anthropic.com/news/claude-sonnet-4-5 , beter dan Opus, voor dus veel minder geld.

"On the fly" UI, of zelfs software, is voor normale toepassingen natuurlijk handig, dan kunnen gebruikers geen muscle memory opbouwen van waar bepaalde functies zitten.

Echter voor bijvoorbeeld een dynamisch dashboard, van bv een CRM, lijkt het me wel handig, maar moet de interface code daadwerkelijk dynamisch zijn?

Ben benieuwd of iemand hier de killer use case al ziet? Pivot tables? Prototyping?

[Reactie gewijzigd door Utrecht25 op 29 september 2025 21:20]

Ik heb er net mee gespeeld. Ik denk dat Claude Imagine meer bedoeld is om te experimenteren out of the box na te denken wat AI kan betekenen in de context van software development, dan dat je hier nu echt software op gaat maken die echt gebruikt gaat worden. Bij het inloggen wordt ook aangegeven "This demo is temporary and only available on some plans.".

Ik heb er net een stemwijzer mee gemaakt en zelf ingevuld. Het geeft de mogelijkheid om een ideetje real-time te testen, heel anders dan mockups of POCs maken :). Super interessant voor oa product owners :)

[Reactie gewijzigd door kamerplant op 29 september 2025 21:28]

Claude Code 2.0 is ook net uit. Hier wordt je gelijk vastgezet op Sonnet 4.5 (zie changelog https://claudelog.com/claude-code-changelog/). Daarbij krjig je nu ook inzicht in je verbruik. Wat enerzijds schrikken is, maar anderzijds wel interessant.

Ik ga nu maar eens zien wat Sonnet 4.5 weet te bakken. Het is bijzonder om te zien dat Sonnet het beter zou doen dan Opus. Het zou in ieder geval wel in abonnementsgelden schelen of limieten als Sonnet beter werkt.
Bijzonder dat ik na het klikken op "pricing" of iedere andere link naar een willekeurige pagina een ~5 seconden durende advertentie moet bekijken. Zie screenshot.

Dus ik moet eerst advertenties bekijken voordat ik mag zien wat het gaat kosten, voordat ik de "about"-sectie van de site mag lezen, of iedere andere pagina. Wtf? De site is zeker gevibecode? :+

[Reactie gewijzigd door Stukfruit op 29 september 2025 21:49]

Claudelog.com is niet onderdeel van Anthropic / Claude :)
Na flink doorklikken en proberen zie ik dat nu inderdaad, maar daar kon ik dus niet bij komen door de vraag om advertenties te bekijken :P

Zo te zien dus inderdaad waarschijnlijk dat het vibecode-werk is.
Ah.. Claude, ik hoorde niks anders dan "You're absolutely right!" voordat ik met een bootstrap en chat constraints begon te werken.. Claude Code is al een andere ervaring als je wat 'strakkere' agents maakt i.c.m. een output-style. Ben benieuwd naar Sonnet 4.5..
Hmmm ja ziet er heel leuk uit om een concept te pitchen, maar komt niet echt met functionaliteit. Functionaliteit werkt ook (jammergenoeg) niet zo simpel als de UI even neerzetten.

Ik denk wel dat het mogelijk is, als ze een universeel interactie systeem maken dat in de achtergrond interacties voor je links aan specifieke reacties kan het best snel gaan, maar denk dat we daar nog wel 2 jaartjes vanaf zitten.
Anders dan een technisch speeltje wat selectief dingen kan doen denk ik niet dat dit veel wordt.

Als je volledige omgeving een fullscreen browser is en daarin wil je specifieke taken uitvoeren. Ja, dan kan er wel wat werken ja. Maar je ben dan beperkt tot wat je browser zelf aan de achterkant allemaal kan. En wie maakt dat? Niet claude.

Aan een andere software kant heb je native applicaties. Eigenlijk elk programma wat draait en geen browser is. Daar gaat die voor zeker de compileer talen ook nooit werken omdat die simpelweg een compilatie stap nodig hebben.

Wat blijft dan over? Interpreter talen. Dat kan misschien met veel trainen een aardig eind komen maar die redden het wat performance betreft niet t.o.v. gecompileerde talen. En dan heb ik het niet over 1 of 2x langzamer, eerder over duizenden keren langzamer. [1] Je heb nu al zoveel monsterlijk "programma's" die feitelijk een browser zijn met wat api calls (oftewel, electron) en als je "geluk" heb zit er nog wat wasm doorheen. Kost een paar gb om te installeren en de performance is over bedroevend maar het heeft een snelle ontwikkeltijd en een lage drempel voor ontwikkeling. Straks hebbe nwe een quantum computer nodig die maar net vlot aanvoelt terwijl een apple lisa al vlotter aanvoelde dan pc's van vandaag de dag.

Ik hoop dat als LLMs zo slim worden dat ze hele programma's kunnen maken (nee, kunnen ze nu nog niet, net nog uren mee gespeeld) dat we dan weer een beetje terug gaan naar slim en efficient programmeren.

[1] Dit is in generieke zin. LLMs genereren geen optimale code en zelfs goede devs maken niet de snelste code. Je moet je echt specialiseren in het onderste uit de kan halen.
ben benieuwd, maak veelvuldig gebruik van claud. Tis al best goed, maar kan altijdd beter.
Hoi,

Heb een nieuw account moeten aanmaken om te reageren, het is zo lang geleden :)

In mijn ogen is het simpel. Ik ben geen developer maar heb ervaring om software te maken vanuit het niks met een team, en nu is dat team een AI in plaats van full stack developers. Ik bouw op dit moment 100% interne apps om mijn bedrijf te automatiseren en ik weet uit ervaring dat ik in ieder geval voor een 80-90% goed zit met de code. Ik zou niet met een AI geproduceerde app een SaaS bedrijf starten, maar ik heb inmiddels enkele tientallen uren per maand bespaard door AI een ERP/CRM pakket voor mijzelf te maken.

Zolang je de AI goed bij iedere prompt context geeft dan zal die ook vrij goeie output geven. Vergeet je bij een prompt de exacte context dan kun je verwachten dat die met zijn toverstaf zwaait en van alles verandert waar je niet om hebt gevraagd.

AI is heel goed om kleine taken te doen, en zolang je alles en dan ook echt alles op knipt tot enkele tientallen lijntjes code dan is Claude Code toch al een heel eind een goede junior developer.

Ik zou code kunnen leren schrijven, lezen kan ik het meestal al vrij goed maar dan zou ik een developer worden, en ik ben een zakenman, geen developer. Ik denk dat de meeste developers hier niet inzien hoe belangrijk AI voor mij is geworden want een full stack medewerkers inhuren om een simpel project/taken systeem te maken zou mij veel geld kosten en daarboven op kost dit maximaal een paar weken en dan heb ik niks meer te doen voor deze developer.

Context is king.


Om te kunnen reageren moet je ingelogd zijn