Anthropic toont Claude Sonnet 4.5 en functie met on-the-fly geschreven software

Anthropic heeft Claude Sonnet 4.5 aangekondigd. Daarnaast komt het bedrijf met Imagine with Claude, waarbij het AI-model software on-the-fly genereert als een gebruiker ergens op klikt. Volgens het bedrijf kan software van de toekomst zo werken.

Imagine with Claude is een experiment dat vijf dagen beschikbaar is voor klanten met een Max-abonnement van 200 dollar per maand, meldt Anthropic. Waar AI-modellen tot nu toe software schreven en compileerden, bedenkt Imagine with Claude de software op het moment dat de gebruiker op een knop klikt. De software werkt daardoor trager, maar het laat volgens het bedrijf zien hoe software in de toekomst zou kunnen werken. Doordat het AI-model vensters on-the-fly bedenkt, zijn die aan te passen aan de gebruiker en de situatie.

De release staat verder los van Claude 4.5 Sonnet, dat het bedrijf ook aankondigt. Het nieuwe model is uitgebreider getraind en daardoor minder geneigd om gebruikers te vleien, te misleiden of te chanteren, zo claimt Anthropic. Dat gebeurde bij versie 4 meer. Daarnaast claimt het bedrijf dat het nieuwe model onder meer beter kan programmeren.

Door Arnoud Wokke

Redacteur Tweakers

29-09-2025 • 21:06

14

Submitter: GewoonYunus

Reacties (14)

Sorteer op:

Weergave:

Ah.. Claude, ik hoorde niks anders dan "You're absolutely right!" voordat ik met een bootstrap en chat constraints begon te werken.. Claude Code is al een andere ervaring als je wat 'strakkere' agents maakt i.c.m. een output-style. Ben benieuwd naar Sonnet 4.5..
De benchmark scores: https://www.anthropic.com/news/claude-sonnet-4-5 , beter dan Opus, voor dus veel minder geld.

"On the fly" UI, of zelfs software, is voor normale toepassingen natuurlijk handig, dan kunnen gebruikers geen muscle memory opbouwen van waar bepaalde functies zitten.

Echter voor bijvoorbeeld een dynamisch dashboard, van bv een CRM, lijkt het me wel handig, maar moet de interface code daadwerkelijk dynamisch zijn?

Ben benieuwd of iemand hier de killer use case al ziet? Pivot tables? Prototyping?

[Reactie gewijzigd door Utrecht25 op 29 september 2025 21:20]

Ik heb er net mee gespeeld. Ik denk dat Claude Imagine meer bedoeld is om te experimenteren out of the box na te denken wat AI kan betekenen in de context van software development, dan dat je hier nu echt software op gaat maken die echt gebruikt gaat worden. Bij het inloggen wordt ook aangegeven "This demo is temporary and only available on some plans.".

Ik heb er net een stemwijzer mee gemaakt en zelf ingevuld. Het geeft de mogelijkheid om een ideetje real-time te testen, heel anders dan mockups of POCs maken :). Super interessant voor oa product owners :)

[Reactie gewijzigd door kamerplant op 29 september 2025 21:28]

Claude Code 2.0 is ook net uit. Hier wordt je gelijk vastgezet op Sonnet 4.5 (zie changelog https://claudelog.com/claude-code-changelog/). Daarbij krjig je nu ook inzicht in je verbruik. Wat enerzijds schrikken is, maar anderzijds wel interessant.

Ik ga nu maar eens zien wat Sonnet 4.5 weet te bakken. Het is bijzonder om te zien dat Sonnet het beter zou doen dan Opus. Het zou in ieder geval wel in abonnementsgelden schelen of limieten als Sonnet beter werkt.
Bijzonder dat ik na het klikken op "pricing" of iedere andere link naar een willekeurige pagina een ~5 seconden durende advertentie moet bekijken. Zie screenshot.

Dus ik moet eerst advertenties bekijken voordat ik mag zien wat het gaat kosten, voordat ik de "about"-sectie van de site mag lezen, of iedere andere pagina. Wtf? De site is zeker gevibecode? :+

[Reactie gewijzigd door Stukfruit op 29 september 2025 21:49]

Claudelog.com is niet onderdeel van Anthropic / Claude :)
Na flink doorklikken en proberen zie ik dat nu inderdaad, maar daar kon ik dus niet bij komen door de vraag om advertenties te bekijken :P

Zo te zien dus inderdaad waarschijnlijk dat het vibecode-werk is.
Het idee is leuk, maar als je iets verder kijkt dan wat ze vertellen is het eigenlijk nog steeds weinig meer dan automatisering van de UI.

Met dat voorbeeld voor de "zelfgeschreven" software komt er ook nog steeds weinig meer uit dan een veredelde todolijst, zoals de meeste apps die gevibecodeted worden. Zonder begrip van wat er gaande is zie ik dat voorlopig eigenlijk ook nog niet echt veranderen. De tech is waanzinnig cool, maar hoe ze het presenteren slaat een beetje naast de plank.

Wat ik wel heel mooi vind is dat dit steeds meer een kant op gaat waarbij je als developer met kennis niet meer de typische geestdodende troep hoeft te maken, dus het lijkt mij dat dit vooral goed gaat zijn voor mensen die aan maatwerk doen. De rest kun je terug overboord gooien naar bv. je werkgever die nu iemand zonder programmeerkennis kan lastigvallen met onrealistische eisen en deadlines voor zaken die al honderd keer op een betere manier zijn opgelost :Y
Yep, klopt wij gebruiken het heel veel op kantoor om saaie dingen te bouwen hahaha
Klopt, ik probeer 't elke keer een kans te geven, maar het kost vaak meer tijd dan dat het oplevert. Vandaag ook weer. Ik wist niet meer of een bepaalde functionaliteit out of the box werd ondersteund, dus ik vraag het even. Ja, sinds versie x.y kun je method() gebruiken en ik krijg er zelfs wat voorbeeld code bij. Nice! Alleen method() bestaat helemaal niet. Niet voor versie x.y en niet erna. Gewoon niet. Kon beter zelf gelijk even in de docs ctrl-f doen.
Nu de modellen steeds slechter worden (of te veel nutteloze informatie bevatten) is het ook steeds verstandiger om er standaard llms.txt-integratie bij te pakken of gewoon meteen een MCP-server als deze beschikbaar is voor een framework of toolkit.

Maar ook daarmee moet dat tekstbestandje niet gebruikt worden als marketingmateriaal en moet er daadwerkelijk nuttige informatie uit de documentatie in staan die je nodig hebt tijdens het werk. Dat gaat hier en daar ook nog wel eens fout.

En gelijk weer een leuk puntje om de "het is intelligent"-mensen het zwijgen op te leggen: nee, de papegaai is handig, maar verre van intelligent.
Hmmm ja ziet er heel leuk uit om een concept te pitchen, maar komt niet echt met functionaliteit. Functionaliteit werkt ook (jammergenoeg) niet zo simpel als de UI even neerzetten.

Ik denk wel dat het mogelijk is, als ze een universeel interactie systeem maken dat in de achtergrond interacties voor je links aan specifieke reacties kan het best snel gaan, maar denk dat we daar nog wel 2 jaartjes vanaf zitten.
Anders dan een technisch speeltje wat selectief dingen kan doen denk ik niet dat dit veel wordt.

Als je volledige omgeving een fullscreen browser is en daarin wil je specifieke taken uitvoeren. Ja, dan kan er wel wat werken ja. Maar je ben dan beperkt tot wat je browser zelf aan de achterkant allemaal kan. En wie maakt dat? Niet claude.

Aan een andere software kant heb je native applicaties. Eigenlijk elk programma wat draait en geen browser is. Daar gaat die voor zeker de compileer talen ook nooit werken omdat die simpelweg een compilatie stap nodig hebben.

Wat blijft dan over? Interpreter talen. Dat kan misschien met veel trainen een aardig eind komen maar die redden het wat performance betreft niet t.o.v. gecompileerde talen. En dan heb ik het niet over 1 of 2x langzamer, eerder over duizenden keren langzamer. [1] Je heb nu al zoveel monsterlijk "programma's" die feitelijk een browser zijn met wat api calls (oftewel, electron) en als je "geluk" heb zit er nog wat wasm doorheen. Kost een paar gb om te installeren en de performance is over bedroevend maar het heeft een snelle ontwikkeltijd en een lage drempel voor ontwikkeling. Straks hebbe nwe een quantum computer nodig die maar net vlot aanvoelt terwijl een apple lisa al vlotter aanvoelde dan pc's van vandaag de dag.

Ik hoop dat als LLMs zo slim worden dat ze hele programma's kunnen maken (nee, kunnen ze nu nog niet, net nog uren mee gespeeld) dat we dan weer een beetje terug gaan naar slim en efficient programmeren.

[1] Dit is in generieke zin. LLMs genereren geen optimale code en zelfs goede devs maken niet de snelste code. Je moet je echt specialiseren in het onderste uit de kan halen.
ben benieuwd, maak veelvuldig gebruik van claud. Tis al best goed, maar kan altijdd beter.


Om te kunnen reageren moet je ingelogd zijn