Cognition introduceert volledig autonome AI-software-engineer

Een nieuwe Amerikaanse start-up genaamd Cognition heeft een AI-software-engineer ontwikkeld die volgens het bedrijf helemaal autonoom kan werken. De tool is nog niet breed beschikbaar; wie de engineer wil inhuren, komt op een wachtlijst.

De AI-engineer heet Devin en moet verdergaan dan chatbots gebaseerd op GPT-4, Llama of Claude 2. Deze bots werken op basis van prompts die afkomstig zijn van mensen en kunnen suggesties doen op basis van al geschreven code. Devin kan echter helemaal zelf aan de slag als software-engineer, zowel in samenwerking met andere ontwikkelaars als in zijn eentje, schrijft het bedrijf in een aankondiging. Devin is daarvoor voorzien van veelgebruikte ontwikkelaarstools, zoals shell, een code-editor en een browser in een sandboxed computeomgeving.

De tool zou zelfs complexe engineeringtaken die duizenden beslissingen vergen, kunnen plannen en uitvoeren. Daarbij kan Devin relevante context terughalen, mettertijd leren en fouten oplossen. De AI-engineer geeft in real time updates over de voortgang. Ook kan Devin volgens Cognition met feedback omgaan.

In een serie videodemo's toont Cognition de verschillende mogelijkheden van Devin. Zo wordt getoond hoe de tool zelf bugs in codebases kan vinden en oplossen, en hoe de AI-engineer op basis van een blogbericht leert hoe hij met een eerder nog onbekende technologie moet werken. Ook kan Devin zijn eigen AI-modellen trainen en verfijnen, en omgaan met featurerequests in opensource repository's.

Cognition vergelijkt Devin met andere bekende chatbots via de SWE-benchmark, een test die controleert hoe goed taalmodellen echte GitHub-problemen kunnen oplossen. Devin wist 13,85 procent van de problemen volledig op te lossen. Daarmee presteert de AI-engineer veel beter dan zijn concurrenten. Claude 2 wist 4,8 procent volledig op te lossen, Llama 13B kwam uit op 3,97 procent en GPT-4 op 1,74 procent.

Veel meer technische details over Devin zijn nog niet beschikbaar. Cognition belooft snel een gedetailleerder technisch rapport te publiceren. Ook is Devin nog niet breed beschikbaar. Vooralsnog is er alleen early access, omdat Cognition zijn capaciteit nog moet verhogen. Wie Devin wil inhuren, kan via een Google Form contact opnemen met Cognition.

Door Eveline Meijer

Nieuwsredacteur

14-03-2024 • 10:19

107

Submitter: enver63

Reacties (107)

107
103
48
3
0
41
Wijzig sortering
Zolang de gemiddelde Business Analist geen degelijke Jira story (of dus prompt) kan schrijven moet ik nog maar zien wat een vaart dit gaat lopen, zeker als het gewoon ja en amen is in plaats van af en toe de noodzakelijke push back geven.
Ik als developer zelf wordt er wel enthousiast van.
De aanname die (volgens mij) vaak gemaakt wordt rond AI is dat ze compleet personeel kunnen/zullen vervangen, in dit geval een software engineer. Maar, imo, heb je nog steeds een software engineer nodig die dit ding gaat gebruiken (zoals ik zelf wel interesse zou hebben). Het maakt je werk dan zoveel sneller en efficiënter, zeker opsporen van bugs ziet er mooi uit.

Maar ik denk niet dat je moet verwachten dat de gemiddelde niet-developer nu ineens complexe code kan gaan schrijven met een ding als dit (zoals je zei, je moet nog steeds fatsoenlijk kunnen prompten, en dus verstand van de materie hebben). Ook al roept hun marketing van wel.

Dus ik zie er wel toekomst in maar ik denk dan wel voor een andere doelgroep.
Wat ik wel merk van AI (met name ervaring met co-pilot) dat ze nogal hun best doen om het met je eens te zijn, dus als je een geladen vraag stelt krijg je daar vrijwel altijd bevestigend antwoord op (dat terwijl het niet per se goed is). Dat is leuk als je een meningstuk aan het schrijven bent, maar waardeloos voor code.
AI is just another tool in your toolbox.

Als je werk volledig door AI kan worden uitgevoerd, twijfel ik wel aan de moeilijkheidsgraad van je werk.
Ik denk dat het heel erg ligt aan het type werk. Is er al een AI die een robotarm kan aansturen die een emmer met was kan sorteren en opvouwen zoals ieder mens ouder dan 6 jaar dat kan? En aan de andere kant hoor je berichten van AI die 40% beter presteert dan chirurgen/zorgspecialisten bij het opsporen van ik dacht kanker. Die beroepen worden over het algemeen als vrij moeilijk gezien. Wat voor een mens moeilijk is hoeft voor een AI niet zo te zijn en andersom.
Ik denk dat ook voor chirurgen en zorgspecialisten het 'another tool in the toolbox' is. Het helpt bij het opsporen van kanker, wordt nog steeds beoordeeld door de chirurg/arts/zorgspecialist zelf, die daardoor hun werk beter doen. En zij kunnen de tijd die het ze bespaart op een andere nuttige manier binnen dezelfde baan besteden.

Ik krijg geregeld de vraag of ik niet bang ben dat mijn werk (webdeveloper, voornamelijk backend) straks door AI gedaan kan worden. Mijn antwoord is steevast: nee, maar ik profiteer wel van de mogelijkheden. Gisteren nog een klus die me normaal 3-5 uur zou duren om te maken, binnen een uur online kunnen zetten doordat ik het door ChatGPT heb laten schrijven. Scheelt mij frustratie (want vervelend werk) en tijd, scheelt de klant geld en frustratie (want deadline nadert).
Precies dit! Ik werk in de zorg en waar AI geweldig is is de plekken met veel data. Dus bijvoorbeeld radiologie. Waar een radioloog soms moe is, de hele dag al plaatjes heeft gekeken etc daar heeft AI geen last van. Ook is er een bepaalde resolutie waarbij een computer misschien kan beslissen dat er een grote kans op kanker is maar een persoon zou zeggen; herhaal de foto na 3 maanden oid.
Tenslotte het stukje emotie waar mensen last van hebben; als je 3 foto's achter elkaar ziet met dezelfde soort kanker ga je twijfelen aan jezelf, je computerscherm, je medewerkers. Aan de ene kant goed om kritisch op het proces te zijn maar tegelijk kan je bij die derde foto denken "wat is de kans".
aan de andere kant hoor je berichten van AI die 40% beter presteert dan chirurgen/zorgspecialisten bij het opsporen van ik dacht kanker.
Dat komt omdat je daar te maken hebt met een model wat specifiek getraind is op beeldherkenning om zaken te herkennen die sterk correleren met aanwezigheid van kanker. Ze sporen kanker niet actief met enige vorm van kunde of intelligentie op, maar gegeven de set data waar ze op getraind zijn correleert een bepaald beeld of bepaalde set beelden die ze daarna voorgeschoteld krijgen, simpelweg zeer sterk met beelden in hun trainingset waar aanwezigheid van kanker bevestigd was. Dat is een wezenlijk verschil.

Dit soort AI is een idiot savant: totaal doorgetraind op één bepaald aspect en kan dat 'trucje' heel goed doen. Maar is compleet 100% ongeschikt om iets anders effectief te kunnen doen zonder onacceptabel hoge failure rate.

Dat kun je onmogelijk met een menselijke specialist vergelijken.

[Reactie gewijzigd door R4gnax op 23 juli 2024 22:34]

Echter hoe efficiënter en productiever jij bent hoe minder software engineers het bedrijf nodig heeft. Dus je wordt niet zozeer vervangen door een AI die al het werk zelf kan doen, je wordt vervangen door een mens die met de hulp van AI het werk van 5 software engineers kan doen.
Tegelijk is er een groot tekort aan ontwikkelaars, dus pas als dat ook niet meer zo is zal het misschien banen gaan kosten
Maar ik denk niet dat je moet verwachten dat de gemiddelde niet-developer nu ineens complexe code kan gaan schrijven met een ding als dit (zoals je zei, je moet nog steeds fatsoenlijk kunnen prompten, en dus verstand van de materie hebben). Ook al roept hun marketing van wel.
Ik den dat je dit fout ziet. Iedereen kan nu (complexe) code schrijven/genereren, of het ook doet wat je wit, en of het kwalitatief is en geen bugs bevat is een tweede vraag. Programmeren is meer dan alleen het uitschrijven van code. Het is een fantastische hulpmiddel, maar die valkuil zullen mensen toch echt eerst een paar keer moeten voelen voordat ze dat gaan snappen, dat zien we nu ook al met ChatGPT en andere AI modellen..
De truc zit hem in AI ook je laten assisteren met het schrijven en controleren van de prompt.
vergeet de Busniness Analist. het project gaat direct naar de test afdeling.
13% is nog redelijk laag, is heel knap dat dit gebeurd maar hier ga je geen kwaliteit mee kunnen garanderen met 13% geslaagd. Zou wel leuk zijn als ze dit gaan releasen als copilot
Vergeet ook niet dat GPT-4 slechts 1,74% behaalde en nu een jaar later doet een concurrent 13,86% te behalen. Dat is een enorme vooruitgang in een jaar! De vraag gaat natuurlijk wezen of dit tempo volgehouden kan worden.

Natuurlijk gaan mensen vragen, maar hoe goed doet een mens het op zo een test? Natuurlijk niet veel beter, want mensen specialiseren zich over het algemeen. In diens specialisatie doet de mens het (nog) waarschijnlijk beter.

Mijn grootste vraag is wat er gebeurd met die overige 86% van de 'oplossingen', zijn die te herkennen als gefaalde oplossing? Of moet een mens alsnog alles controleren op functionaliteit, bugs en security? En is dat niet meer werk dan een mens die issues op de eerste plaats op te lossen. Het issue van LLM is niet zo zeer dat het fouten maakt, maar dat het niet duidelijk is dat het fouten maakt omdat het niet weet of het 'goed' of 'fout' is en al helemaal niet 'onzeker' kan zijn.
Mijn vraag is vooral hoeveel ze het voor deze test hebben geoptimaliseerd. Procenten zeggen me in deze context niet zoveel
14% is 2 x niets. De eerste 80% is het gemakkelijkste, de laatste 20% het moeilijkste ( zie bv. Driverless) volgens de 80/20 regel.

Ik hoop wel dat het naar 80% kan, maar ik reken er niet direct op.
Je zet Davin in, laat het 13% van de problemen oplossen, geeft de resterende 87% aan je menselijke devs, ontslaat 13% van je devs, en verlaagt je opex met 13% min de abonnementskosten van dit ding. Niet slecht.
En dan komen we bij het subjectieve ding van code kwaliteit... Een oplossing kan werken,maar dat maakt het nog niet de beste of de mooiste oplossing. Alle code die Davon produceert moet gereviewd worden door iemand die in kan schatten of iets een goede oplossing is, en hem anders aan kunnen sturen verbeteringen te maken. Want anders heb je voor je het weet enorm veel technical debt.

Maar ja, als dit zo goed werkt als in de promopraat gesuggereerd, dan kan dit heel wat productiviteit opleveren. Maar gezien de krapte op de markt maak ik mij nog geen zorgen voor mijn baan. Wel voor de maatschappij als dit soort werk zo te automatiseren valt.
AI code reviews bestaan al.

Codekwaliteit maakt niet uit indien een AI de code kan onderhouden.
De beperkingen zijn dat de hoeveelheid regels code beperkt is en er al (vaak zo’n stuk of 5) oplossingen op het internet nodig zijn die is die de AI mag gaan remixen.

[Reactie gewijzigd door Minimise op 23 juli 2024 22:34]

En daar zit het probleem. Zeker in de IT veranderd er vaak genoeg iets, dat je niet zo maar kan zeggen dat er nooit een mens naar een stuk code hoeft te kijken. En als mens wil ik waarschijnlijk niet aan code zitten die volledig door een AI is onderhouden.
Mij maakt het niet uit of een code volledig door AI onderhouden is, hoe sneller en goedkoper, hoe beter! Ik kijk meer naar de technische beperkingen van de complexiteit van de code die het überhaupt kan onderhouden voordat het 0% slagingspercentage behaald op mijn unit tests! En dat blijkt niet mee te vallen voor lange complexe code.

[Reactie gewijzigd door Minimise op 23 juli 2024 22:34]

Codekwaliteit maakt niet uit indien een AI de code kan onderhouden.
Mwah. Ik heb een applicatie die vorig jaar door een paar developers in Pakistan voor ons is gebouwd. Daar komen o.a. queries in voor waarbij men met replace de waarden invult. Kennelijk nog nooit gehoord van SQL Injection. Terwijl ik dat al zeker 18 jaar weet (en dus parameters gebruik). De gegevens komen uit invoervelden met geen enkele controle.

Als AI ook dat soort code genereert dan werkt het prima, maar heeft ie toch een security issue geïntroduceerd...

Je commentaar gaat wel op voor leesbaarheid, dat hoeft dan niet meer (mits het goed werkende en veilige code is).
Je commentaar gaat wel op voor leesbaarheid, dat hoeft dan niet meer (mits het goed werkende en veilige code is).
De kif is: hoe ga je controleren of het goed werkende en veilige code is, als het onleesbare brij is?
Ga je daar dan weer opnieuw een AI voor inschakelen?
Wat even zo goed weer kan hallucineren dat het er allemaal pico-bello uit ziet?
Onleesbare code is door een mens (bijna) niet te controleren. Een computer zou daar echter geen moeite mee hebben, die boeit leesbaarheid helemaal niks.

Ik denk daarom inderdaad dat in de toekomst de controle op kwaliteit en veiligheid door AI zal gebeuren. Dat is wenselijk om nieuwe best practices snel in te kunnen zetten, en je snel te kunnen verweren tegen een nieuw ontdekte kwetsbaarheid. En ook belangrijk: controle door een persoon is duur, tijdrovend en vrijwel niemand weet alles met betrekking tot code kwaliteit of veiligheid. Mijn verwachting is dus dat daar online diensten voor komen (al dan niet geïntegreerd met je versiebeheer).
Quis custodiet ipsos custodes?

Omdat de output van een AI onbetrouwbaar is, moet deze gecontroleerd worden op correctheid.
Hiervoor wil je een nieuwe AI inztten.
Omdat de output van een AI onbetrouwbaar is, kan deze alsnog een totaal foute inschatting maken.

Uiteindelijk moet er ergens nog iemand van vlees en bloed en voldoende kennis en kunde overblijven die, wanneer het ondanks dat alle tooling zei: "nee hoor, is gewoon in orde" toch nog in de door AI gegenereerde code-brij kan duiken en het kan gaan recht trekken.
En een mens is wel betrouwbaar? :+

Los daarvan, het zou hier gaan om 2 verschillende AI's, en het gaat erom hoe ze getraind worden. Dat de generatieve AI soms slechte code produceert wil niet zeggen dat de controlerende AI slecht controleert.
Als de organisatie die de controlerende AI aanbiedt bovenop de nieuwste ontwikkelingen zit, dan zal het wel meevallen met de slechte code verwacht ik. Je zult denk ik ook wel kunnen kiezen uit meerdere van dit soort AI's. Of je gebruikt er meerdere naast/achter elkaar. Bv de ene AI controleert op veiligheid, de andere op kwaliteit.

Enne, het is er allemaal nog niet he... ik denk alleen dat we het over 10 jaar wel hebben.
Het is vooral vanwege het idee dat kwaliteit belangrijk is dat ik me geen zorgen maak dat AI volledig de programmeurs gaan overnemen, maar als ze dit gaan releasen github copilot stijl dan zou dit geweldig zijn
En je huurt 13% meer testers in om te vinden waar de AI het verkeerd heeft. Dat doe je pas 2 jaar later dus de werkelijk winst is alleen op korte termijn.
Hoe weet je welke 13% je aan Davin moet geven?
De vraag is hoeveel % haalt een mens?
Als de tests allemaal verschillende talen en APIs zijn kom je waarschijnlijk ook niet ver.

Maar volledig een software engineer vervangen geloof ik idd ook nog niet, dat duurt nog een paar jaar.

[Reactie gewijzigd door Rogers op 23 juli 2024 22:34]

Volgens mij zou een goede programmeur toch 100% van alle bugs op moeten kunnen lossen? Ik vind 13% echt heel laag om m uberhaupt een developer te kunnen noemen. Als ik slechts 13% deed van alles wat ik moest doen hadden ze me er al uitgetrapt :+
Dus jij kan bugs oplossen in programmeer talen die je niet kent? Laat staan met de snelheid van AI.

Niemand haalt 100% bug vrije code hoe goed je ook denkt te zijn.
Ik programmeer niet in talen die ik niet ken. Waarom zou ik dat willen doen? :+
Niemand haalt 100% bug vrije code hoe goed je ook denkt te zijn.
Dat heb ik nergens gezegd. Het ging om het oplossen van problemen. Dus over bekende bugs (of misschien het toevoegen van functies?). Zo'n AI kan ook allemaal onbekende bugs in z'n code hebben.

[Reactie gewijzigd door kozue op 23 juli 2024 22:34]

Ik kan in mijn programmeertaal alle bugs oplossen die in code zitten en gerapporteerd worden. Als de AI daar 13% van kan moet ik dus de AI eerst alles laten proberen te fixen. Dan moet ik alles van de AI controleren en vervolgens de 87% die de AI niet kon alsnog zelf gaan oplossen. Niet echt een verbetering denk ik.
De hoeveelheid kritieke findings die ik voorbij zie komen in pentest rapportages van een voormalig team van mij, laat zien dat een gemiddelde developer helemaal niet zo goed is als jij schetst.
Een bug fixen is enorm veel makkelijker dan bugvrije code schrijven. In het eerste geval kun je heel gericht een kleine hoeveelheid code schrijven en hoef je maar met een relatief kleine hoeveelheid code rekening te houden. Je focust je dus op een klein gebied. Bij het schrijven van code ben je constant mentaal bezig met lijntjes trekken tussen verschillende onderdelen en bedenken wat de gevolgen, voordelen, nadelen en gevaren van elke regel code zijn. Je kunt alle kanten op omdat de meeste talen meerdere manieren hebben om hetzelfde resultaat te behalen.

Vergelijk het met dat het makkelijker is om een spellingscheck te doen op een tekst dan om die tekst zelf from scratch te schrijven.
Klopt. Maar in hoeveel tijd heeft hij die 13% gedaan? Dat kan ook interessant zijn.
Dan hoeft een persoon nog maar 87% van de openstaande dingen op te lossen.
13% lijkt me net extreem hoog. Hoeveel % zou de doorsnee menselijke developer kunnen oplossen? Ik denk niet meer dan 0.1%. Je moet er namelijk rekening mee houden dat het een breed gala aan projecten is, met een nog breder gala aan technologieën. Zelfs de meest ervaren programmeur op aarde kent nog steeds maar een fractie van alle bestaande technologieën en talen.

Het feit dat deze AI volledig zelfstandig (met enkel de URL) een issue correct kan oplossen, committen en pushen is in mijn ogen al spectaculair (en tegelijkertijd angstaanjagend).

Ook feit dat deze AI bugs autonoom bugs vindt in een codebase geschreven door mensen die deze bugs over het hoofd zagen is een hele verwezenlijking. Een verwezenlijking die aantoont dat er zelfs nu al vlakken zijn waarin deze AI's beter zijn in onze job dan wijzelf.

Ik hou mijn hart vast voor de toekomst van mijn job...
Akkoord, maar wat ben je daarmee in real life? Mijn bedrijf wil specialisten die kwaliteit opleveren, niet generalisten die 13% over een breed spectrum halen.
13% is niet hoog...
Maar kijk eens naar de concurrenten en zoek eens op hoe de experts hier 6 maanden geleden over dachten. Op dat moment zagen de meeste dit niet gebeuren voor 2 to 6 jaar en sommige minimaal een decennia of nog langer. Nu 6 maanden later zijn we bij de 13% aan gekomen en over een jaar 50 of 80%, wie weet het geen we wel kunnen zeggen is dat ook dit weer een grotere stap vooruit is dan de meeste experts hadden verwacht in deze korte tijd.

Laten we nog eens verder kijken in 2017 introduceerde Google de transformer, nu zijn we nog maar 7 jaar verder en is AI een steeds groter gevaar voor de kansen op de arbeidsmarkt voor veel nu nog jonge mensen. We zijn er nog niet maar steeds meer code wordt met behulp van AI geschreven, marketing teksten door AI geschreven en onderzoekers gebruiken steeds meer AI voor het vinden van informatie in een eindeloze berg data, iets dat tot op heden nog voornamelijk gedaan wordt door de junior mede werkers in onderzoekslab's en advocaten kantoren.

Co-pilot kan stukjes code verbeteren en helpen met relatief simpele taken, deze agent kan geheel zelf nieuwe code schrijven om een probleem op te lossen, de code testen en fouten vinden in de code. De agent doet dit door net als een mens online informatie over het probleem domein op te zoeken en op basis van die informatie een oplossing te bedenken, schrijven, testen en verbeteren.
Dit is heel erg veel meer dan het geen co-pilot kan zelfs als het "maar" 13% van de tijd succesvol is.

We zijn er nog niet maar de snelheid waarmee we nu zien hoe we van Wow, 60% score op deze test naar beter dan 90% van de mensen die deze test doen zijn gegaan geeft aan hoe snel de markt zich ontwikkelt. En je hebt helemaal gelijk 13% is niet zo veel maar als je ziet hoe snel de technologie zich ontwikkelt dan is het een hele grote stap richting een AI developer die zeer veel mensen een baan zou kunnen ontnemen.
Zo als iemand het mooi beschreef, mijn over grootvader werkte op een boerderij en werd vervangen door machines, mijn groot vader werkte in een auto fabriek en werd vervangen door machines, mijn vader werkte als in een kantoor en werd vervangen door machines dus ik besloot programmeur te worden en...

We zijn zeker nog niet op het punt dat de meeste programmeurs zich zorgen hoeven maken maar het zal waarschijnlijk niet zo heel lang meer duren voor we de eerste programma's geheel geschreven door AI zullen zien verschijnen. Maar het is in middels vrijwel zeker dat dit de toekomst zal zijn en zo als de NVidia CEO recent zij, het is tijd om onze kinderen niet langer te leren programmeren. Immers tegen de tijd dat kinderen die nu nog op school zitten de arbeidsmarkt betreden is het waarschijnlijk niet langer nodig dat een mens de programma's schrijft.
ze zijn nog maar net begonnen, zijn we een jaar verder en dan kan je een goedkope junior erbij nemen voor een tientje per uur die je door de product owner wat taken laat uitvoeren
Als ontwikkelaar maak ik me zelf eigenlijk geen zorgen.

Als ik al zie hoe verschrikkelijk de code kwaliteit van collega’s die GitHub copilot en vergelijkbare technieken gebruiken is geworden, en hoe onveilig het is.. Door hoeveel er herschreven moet worden is er bij ons eigenlijk amper productiviteitswinst te behalen aan dit soort technieken.

Die 13% gaat nog flink de lucht in moeten voor het echt praktisch wordt.
Komt ook vooral door verkeerd gebruik. Teveel mensen, ik zie het collega's ook doen, vertrouwen er blind op. Copilot kan je prima een idee geven voor een oplossingsrichting, maar het is absoluut geen code die je op productie zou willen hebben.
Ik heb flink wat collega's tegen me in het harnas gejaagd door te zeggen dat mensen die dat doen eigenlijk geen goeie ontwikkelaars zijn. Ze kunnen blijkbaar niet het verschil zien tussen productie waardige code en hetgeen wat GitHub Copilot oplevert.
Laten we zeggen dat het soms heel lang duurt voor een PR goedgekeurd wordt.
CoPilot genereert soms wel productie-waardige code maar heel regelmatig ook code die op niks slaat of die niet werkt. Het ergste is als de code er "bijna" is met een heel kleine foute nuance ergens. De succesratio is inderdaad nog veel te klein om blindelings op code van CoPilot te vertrouwen en ik heb ergens een beetje schrik dat veel devs het verschil minder en minder gaan opmerken.

Op dit moment komt blindelings op CoPilot vertrouwen nog op hetzelfde neer als telkens het eerste woord van je autocomplete kiezen. Uiteindelijk staat er misschien wel een Whatsappje klaar om te versturen maar zelden gaat het zeggen wat je wilde zeggen.
Op dit moment komt blindelings op CoPilot vertrouwen nog op hetzelfde neer als telkens het eerste woord van je autocomplete kiezen. Uiteindelijk staat er misschien wel een Whatsappje klaar om te versturen maar zelden gaat het zeggen wat je wilde zeggen.
Dat is een hele goeie vergelijking, die ga ik zeker gebruiken
De rol van een software engineer bestaat eruit businesswaarde te creëren, niet goede code te schrijven.

Het zal de klant werkelijk om het even zijn of de code goed of slecht is, als het maar werkt. En als de AI het onderhoud op zich neemt, valt ook dat argument weg.

Good enough and free >>>>>>> better and very expensive
Exact. Sommige software developers maken er een sport van om van elk project een schoolprojectje mooi programmeren te maken. Daar is het bedrijfsleven niet mee gebaat. Een goede, modulaire architectuur is wat je nodig hebt, en dan maakt het al minder uit wat je in je classes doet, als het maar werkt. Ik heb al gewerkt in grote teams waar ze veel aandacht geven aan programmeren volgens het boekje en die krijgen amper iets gedaan.
Zoals in alles moet er een balans zijn, als de code met haken aan mekaar hangt en niet leesbaar, dus ook niet onderhoudbaar is gaat een langdurig project klauwen geld aan maintenance opvreten.
De rol van een software engineer bestaat eruit businesswaarde te creëren, niet goede code te schrijven.
Waar het een lange-termijn product betreft is goede code businesswaarde. Hoe beter de code is; hoe duidelijker te lezen; hoe makkelijk te begrijpen; hoe soepel uit te breiden; hoe robuust draaiende te houden, hoe minder overhead elk vervolgtraject bovenop die code zal hebben.

Daar zit een wezenlijk verschil in met de write-once; read-never fly-by-night maatwerk projectjes die even in een dag of twee er uit geramd moeten worden omdat anders je winstmarge weg is.
Volledig autonome software engineer geloof ik nog niet, het werk is veel complexer dan wat stukjes code schrijven. Tech startups hebben vaak de neiging om beter voor te doen dan het is.

Ben wel beetje bezorgd waar dit heen gaat. Binnen een paar jaar zal het vast mogelijk zijn. CEOs kennende staan ze te springen werknemers er uit te trappen om nog meer winst in hun zakken te kunnen steken.
We zijn op een jaar tijd van ChatGPT 4 naar dit geëvolueerd. Over 1-2 jaar kan dit soort AI 75% van de taken afhandelen en kun je een development team reduceren naar één persoon en een abonnement op Cognition.
Er worden zeker grote sprongen gemaakt, maar eerst zien, dan geloven. Tesla roept ook al sinds 11 jaar dat Full Self Driving "end of this, beginning next year" toch echt komt. De eerste stap naar de omgeving kunnen herkennen en dat in een model gooien waarmee je kunt besturen in een massa productie auto is een enorme stap. Maar de stap naar FSD lijkt steeds verder weg te geraken, naarmate er steeds duidelijker wordt wat er allemaal niet goed kan met de techniek

Recent nog een nieuwsbericht van een Amerikaans testcentrum, waaruit van de 14 geteste systemen er maar één acceptabel is, twee middelmatig en de rest slecht. En Tesla staat tussen de slechten. https://www.iihs.org/news...w-industry-has-work-to-do
Met fsd12 hebben ze toch weer een serieuze stap vooruit gezet.

Kijk maar eens wat filmpjes op YouTube.

Niet perfect maar dat zijn menselijke chauffeurs ook niet.

Geen idee wanneer, maar op een dag zal de zelfrijdende auto hier ook door de straat rijden en iedereen zal het heel snel heel normaal vinden.

Ik zag onlangs enkele filmpjes van de waymo-taxi. Het viel mij op dat er verschillende vrouwen aangeven dat ze liever een waymo-taxi nemen dan een Uber met menselijke chauffeur.
Als vrouwen zoiets spontaan vermelden dan weet je gewoon dat er geen weg terug is.
Denk dat dat toch wat kort door de bocht is. Afhankelijk van het model is AI heel goed in het vertalen van een tekst met verwachtingen naar code die soort van doet wat je verwacht. En inderdaad, daar zit heel veel repetitief werk in, waar ontwikkelaars maar wat graag van af zijn.

Het werk als ontwikkelaar kan zich dan vervolgens focussen op precies de stukken die _niet_ doen wat je verwacht of wil. En laat daar nou net het meeste werk in zitten. AI is getrained om te genereren wat bekend is, echt nieuwe inzichten krijg je er (vooralsnog) niet uit.

Uiteindelijk zal toch geld hier weer de doorslag gaan geven. Ga ik meer geld uitgeven aan ontwikkelaars om het _echt_ goed te maken, of doe ik dat niet en accepteer 'goed genoeg'. Als we richting dat laatste gaan, heb je in veel gevallen aan een AI met wat kleine beetjes hulp genoeg.
Lol, hou toch op. Dit soort dingen hoor je toch vooral van mensen die werkelijk geen idee hebben wat (software) engineers daadwerkelijk doen. Vooral in grote bedrijven. Zoiets als Devin is leuk voor een marketing medewerker die af en toe een A/B testje wilt programmeren ofzo. Niet voor daadwerkelijke software development.
grapjas. Ben al 20 jaar developer en de laatste 10 jaar in senior and management level.
Ik heb voor hele grote bedrijven gewerkt binnen en buiten Nederland op consultancy als techlead en lead developer en kan je met grote zekerheid vertellen dat dit een grote impact gaat hebben op de gehele sector.

Het doel is het oplossen van een probleem. Of dit in software, machines, of handwerk is maakt niet uit.
Zelfs nu al worden de nieuwste computer chips van NVidia ontworpen samen met AI. Zonder AI was de technologische vooruitgang niet mogelijk geweest in dit tempo.

Over 3 jaar is het vak (software) engineer fundamenteel veranderd. en dan piep je wel anders
Wie wil er nu een portret gemaakt met fotografie? Het is zelfs niet eens in kleur! Portretschilders zullen altijd nodig zijn.
Portret schilderen en software engineering, twee vergelijkbare beroepen :+
Ik kan het niet met zekerheid zeggen, maar ik denk werkelijk dat er tegenwoordig meer portretschilders zijn dan er ooit geweest zijn.

Dingen worden gaandeweg steeds breder toepasbaar en binnen bereik van een steeds groter publiek. Dat ziek ik met AI nu ook gebeuren. Maar ik zie het met name als aanvullend, en niet vervangend. Zo heeft digitale fotografie, met name door smartphone, fotografie voor een zeer breed publiek toegankelijk gemaakt. En tegelijk zijn er nog nooit zoveel professionele fotografen geweest.
Liever een AI babysitten dan een extern team uit India. (en dat zeg ik als een senior devver met uitgebreide ervaring met AI en teams met cultuurverschillen)

[Reactie gewijzigd door Caelorum op 23 juli 2024 22:34]

Als senior dev ga je echt geen AI babysitten, daar ben je te duur voor
Als senior dev heb ik een heel team externen mogen babysitten die echt niet beter presteerden dan gpt-4, dus tja.. De wondere wereld van corporates zal ik dan maar zeggen :)
Doet me beetje denken aan een auto passagier die bijrijder aan het spelen is en denkt alles te weten ;-)

Maar goed verandering is moeilijk dat begrijp ik wel. Ik heb zelf verschillende projecten moeten outsourcen en hele NL dev teams eruit geknikkerd omdat het gewoon goedkoper en goed genoeg was in India.

Met AI wordt dit nog 10x erger.

[Reactie gewijzigd door dutchruler op 23 juli 2024 22:34]

Goedkoop is duurkoop. De eerste en laatste keer dat we een project outsourceden aan India kregen we een niet-werkend product dat anderhalf jaar over tijd was. De source code was 600 MB om een of andere reden. We hebben er maar niet te lang naar gekeken wegens gevaar op acute hersenrot.
Dat is niet goed of duurkoop, maar gewoon slechte management.
Leg uit? Was het soms de bedoeling dat we in India over hun schouder moesten meekijken? Die mensen vertellen gewoon niet de waarheid over de voortgang van het project. En dat zit in hun cultuur. "Yes yes, everything is working fine sir, no need to worry!"
Ja, je had inderdaad iemand lokaal naar india moeten sturen om het project te sturen. De mensen te trainen en jullie processen aan hun duidelijk te maken.

Een beetje droog gaan doen en zeggen. Ze moeten maar snappen wat we bedoelen. Of dit is toch simpele logica. Of kunnen ze dat niet zelf bedenken.

Dat is kortzichtig en zo gebruik je ook niet de voordelen van zo'n team in India. Als je niet zo'n team kan aansturen en leiden dan gaat het niet lukken.
Het probleem is dat jouw generalisatie over "zo'n indiase developer" meer iets zegt over
hoe je om gaat met mensen van andere culturen en gewoontes.

Ik heb verschillende teams in India getraind en heb daar hele succesvolle projecten mee gedaan.
Het klopt dat het meer werk is en een andere insteek vergt, maar daar is best wel mee te werken.

Mijn gevoel aan jouw antwoorden is een gebrek aan flexibiliteit en verder kijken dan alleen de beren die je op de weg ziet.

Ik zou je dan ook willen adviseren je wat meer open op te stellen omdat dit een stuk meer deuren voor je gaat open. Maar goed . to each their own. ;-)

[Reactie gewijzigd door dutchruler op 23 juli 2024 22:34]

Wat geeft jou het idee dat ik niet geïnteresseerd ben in collega dev's ?

Ik ben blij dat je inziet dat het moeilijke gedeelte niet het programmeren is.
Je maakt alleen een fout door niet in te zien dat AI in alles wat er omheen gaan in veel gevallen
nu al beter of vergelijkbaar is.

Ik kan me heel goed voorstellen dat in de nabije toekomst een klant gewoon met een AI in gesprek gaat over wat zijn vereisten zijn. Als we bijvoorbeeld een Scrum process pakken. Wat heb je nou eigenlijk nodig wat niet door AI gedaan kan worden?

Ik denk dat je aan een Owner + senior BDer (of Tech Lead met business kennis. Iemand die beide werelden begrijpt) genoeg hebt. .
Die Business Developer is ook alleen maar nodig om die Business Owner te assisteren hoe de AI het beste aangesproken en gebruikt kan worden.

Alle andere stappen zijn te automatiseren

[Reactie gewijzigd door dutchruler op 23 juli 2024 22:34]

Haha, ik hoop graag dat je het probeert. Zal zeer komisch zijn om bedrijven volledig op hun smoel te zien gaan als er grote problemen ontstaan in projecten en niemand weet hoe je ze moet oplossen want de AI heeft alles geprogrammeerd. Ohja die AI, die in de cloud zit. Ben je ineens afhankelijk van een derde bedrijf voor kennis over je eigen product. Het is bijna te komisch om het serieus te nemen. Ik zie graag de totale clusterfuck tegemoet die jouw bedrijf straks is, ik kan mij er smakelijk mee vermaken
Het zal je wellicht verbazen, maar de meeste bedrijven hebben niet als doel software te hebben.
Software is noodzakelijk kwaad wat gebruikt moet worden om processen te versnellen of te automatiseren.

Uiteraard moet de invoer en uitvoer correct zijn en moet het energiezuinig en efficiënt draaien. Maar de software is echt voor niemand (behalve de devs) belangrijk.

Begrijp me niet verkeerd. Ik ben zelf programmeur en vind het werk fantastisch. Maar ik ben wel realist.
Ik zie graag de totale clusterfuck tegemoet die jouw bedrijf straks is, ik kan mij er smakelijk mee vermaken
Ik heb sterk het vermoeden dat jij dan al thuis moederziel alleen zit te mopperen dat er geen werk meer voor je is.

Als je niet kan aanpassen aan de situatie dan blijf je achter. Ik denk dat daar in het verleden wel genoeg voorbeelden van zijn. Electriciteit, industrele revolutie, het internet, etc.
Het zal je wellicht verbazen, maar de meeste bedrijven hebben niet als doel software te hebben.
Software is noodzakelijk kwaad wat gebruikt moet worden om processen te versnellen of te automatiseren.
Ik ben wel oprecht benieuwd wat voor software het is die jij dan 'programmeert' met AI, en hoeveel mensen daar aan werken en het productief gebruiken. Als je het over het creatief aan elkaar plakken van een paar Excel formules met een input formuliertje eromheen hebt dan geloof ik nog wel dat je veel voordeel uit AI haalt, maar dat is niet wat ik onder sofware engineering versta, dat is gewoon 'de computer gebruiken om problemen op te lossen' door bestaande software aan elkaar te plakken. Waar verder niks mis mee is natuurlijk, maar ook niet waar nu de grootste kostenpost zit aan 'developer uren' lijkt me zo. Zelfs mijn broer die nog nooit 1 minuut in zijn software ontwikkel skills heeft geinvesteerd schrijft dit soort dingetjes voor zijn werk in de kozijnen fabriek om dingen te automatiseren en uit te rekenen. Zonder AI of wat dan ook.

[Reactie gewijzigd door johnbetonschaar op 23 juli 2024 22:34]

Ik programmeer voornamelijk in C# in visual studio
En ben al meer dan 20 jaar full stack developer, waarvan de laatste 10 als Senior, Dev lead en PM is geweest.

Ik heb projecten gedaan voor bedrijven met meer dan 100.000 mensen in dienst.
Heb software geschreven voor vliegvelden en oliemaatschappijen en we spreken dan niet over kleine projectjes.

Wat ik nu zie gebeuren met AI is nog nooit vertoond en dit is vele malen groter dan de opkomst van het internet of zo.

Je ziet nu echt nog maar een stukje van het bovenste puntje van een gigantische ijsberg en het gaat heel erg snel nu. ;-)
Uiteraard moet de invoer en uitvoer correct zijn en moet het energiezuinig en efficiënt draaien. Maar de software is echt voor niemand (behalve de devs) belangrijk.
Software is een core competency van ieder bedrijf. Als je dat niet kan inzien ben je gedoemd om te falen. Wellicht kun je wat korte termijn winst maken door devs te ontslaan en te vervangen met AI. Maar in de long run ben je kennis en competentie kwijt die je nooit meer terug krijgt.
Ik heb sterk het vermoeden dat jij dan al thuis moederziel alleen zit te mopperen dat er geen werk meer voor je is.
Ik ben elektrotechnisch ingenieur en hou me voornamelijk bezig met data en wiskundige optimalisatie problemen. Dus nee ik zie mijn werk niet verdwijnen met de hele energietransitie die voor de deur staat.
Als je niet kan aanpassen aan de situatie dan blijf je achter. Ik denk dat daar in het verleden wel genoeg voorbeelden van zijn. Electriciteit, industrele revolutie, het internet, etc.
Oh ik ben ook gebruiker van chatgpt hoor. Maar voor echte programmeer projecten kun je het niet gebruiken, daar is het veel te incompetent voor. Ik gebruik het vooral om mooie tabellen en test data te genereren, dat gaat goed en scheelt me veel tijd. En heb copilot in vscode in gebruik, daar haal ik veel winst uit dmv automatische typehints en dergelijke. Vooral in python en julia is copilot erg sterk.
hou me voornamelijk bezig met data en wiskundige optimalisatie
hmm dit lijkt me dus perfect voor AI op volledig over te nemen.
Zeker als je ziet waar google deepmind mee bezig is.

Maar dat Software een core competency is ben ik het niet met je eens.
Software is geen doel op zich. Je data en alles wat je uniek als bedrijf maakt is core competency.

Maar software is een middel geen doel. Ik denk dat we daar dan van mening verschillen
hmm dit lijkt me dus perfect voor AI op volledig over te nemen.
Zeker als je ziet waar google deepmind mee bezig is.
Haha. Succes, laat me maar weten als het je gelukt is :+
:) Ik denk dat je daar snel genoeg zelf wel achter gaat komen
Haha, ik hoop graag dat je het probeert. Zal zeer komisch zijn om bedrijven volledig op hun smoel te zien gaan als er grote problemen ontstaan in projecten en niemand weet hoe je ze moet oplossen want de AI heeft alles geprogrammeerd.
^ Dit voorspel ik dus ook...

Een paar reacties hiervoor zegt @langestefan zelf nog dat de AI zijn code dusdanig heeft gerefactored dat hij zelf niet meer snapt wat het doet en met oplossingen komt die zo complex zijn dat hij er zelf nooit opgekomen zou zijn. Maar het heeft hem nu misschien wel een half jaar ontwikkeltijd bespaard!

Klinkt als een geweldig recept om je bedrijf de grond in te sturen, code op elkaar stapelen die je niet zelf hebt geschreven en zo complex is dat je zelf niet meer begrijpt hoe het werkt.

Over een paar maanden komt er een klant die er achter is gekomen dat de rekeningen en overzichtjes niet kloppen waar hij zijn eigen bedrijfsvoering op draait, of er zit een kritieke bug in de UI die direct opgelost moet worden, en dan zit je daar met je bergen AI code die niemand snapt. Succes met aan je 'AI software engineer' uit te leggen hoe je dat op gaat lossen zonder het voor al je andere klanten kapot te maken...

Ik ben zelf overigens redelijk positief over het gebruik van AI modellen om het simpele opzoekwerk te versnellen (API docs, stackoverflow, welke aanpak/algoritmes/libraries geschikt zijn, etc), daar werkt het prima voor. Maar tot nu toe elke keer dat ik meer complexe vragen aan dit soor modellen stel gaat het falikant fout. Vraag GPT-4 maar eens om een algoritme te schrijven dat het percentage van het oppervlak van een vierkant berekent dat aan 1 kant van een lijn ligt, gegeven de afmeting van het vierkant en de lijn vergelijking. Laatste keer dat ik dat geprobeerd heb kwam er een super overtuigend algoritme uit dat het soort 'AI programmeurs' straks klakkeloos c/p-en, echter helaas gaf het foute antwoorden voor het meeste basale geval waar de lijn recht door het vierkant ging. Dan kan je wel zeggen 'je moet alle code van de AI nog steeds zelf testen en verifieren' maar dan kan ik het dus net zo goed zelf schrijven. Plus dat ik het met geen mogelijkheid voor elkaar kreeg om het model een correct antwoord te laten geven, hoewel het een doodsimpel probleem is...

[Reactie gewijzigd door johnbetonschaar op 23 juli 2024 22:34]

Pff na mijn ervaring om GPT4 te gebruiken voor game ontwikkeling (Unity) heb ik hier totaal geen vertrouwen in. Het lukte niet eens een simpel helicopter spel te creëren (naja het deed wel iets, maar de boel iteratief verbeteren werkte erg matig)
Ik denk dat dit precies het 'probleem' is met al dit soort 'AI software engineer' achtige modellen. Leuk dat je een bepaald (vooralsnog laag) percentage geisoleerde problemen geautomatiseerd kunt oplossen of code kunt genereren voor sub-oplossingen, maar probeer het nu maar eens allemaal aan elkaar te praten en onderhoudbaar te maken.

Zo'n beetje elk software systeem dat een probleem oplost dat verder gaat dan het soort quiz vragen als op job interviews wordt gesteld bestaat uit tientallen zo niet honderden deelproblemen met allerlei interacties ertussen die je (hopelijk, zo veel mogelijk) op voorhand hebt voorzien en in je ontwerp hebt opgenomen. Dit gaat in de realiteit met mensen al ontzettend vaak fout waardoor refactoren en soms gewoon helemaal opnieuw beginnen vaak zo'n groot deel van de ontwikkeltijd kosten. Hoe je al die deelproblemen samenvoegt tot een coherente oplossing kun je niet uit stackoverflow antwoorden etc halen, en laat dat nu zijn waar dit soort modellen op getraind is. Je ziet het ook in de Devin video, de 'AI software engineer' is overduidelijk gemaakt als LLM met een set aan prompts die een template volgen als 'zoekopdracht op google naar github project', 'clone repo', 'volg aanwijzingen in README', 'voer geclonede code uit met andere inputs', 'zoek foutmeldingen uit de code en output van printjes en pas iteratief regels code aan' etc. Op zichzelf ontzettend indrukwekkend maar hiermee ga je echt geen complexe business logic of een computer spel in elkaar draaien. En als je het toch probeert is de vraag hoeveel tijd je in de toekomst kwijt gaat zijn om de onbegrijpelijke kluwe aan gegenereerde code waarvan niemand weet hoe en waarom het 'werkt' te debuggen en/of vervangen, en of dat wel opweegt tegen de besparing van het wegbezuinigen van een bepaald percentage van laten we zeggen junior-devs die dit soort taken ook hadden kunnen oplossen. Ik maak me voorlopig nog geen zorgen...
Ik vraag me af of je het zelf al geprobeerd heb.

Ik heb AI bijvoorbeeld al gebruikt om een hele legacy app van meer dan meer dan 400.000 regels over meer dan 50 projecten te moderniseren. En ik kan je vertellen dat dit mij letterlijk maanden al dan niet meer dan een half jaar aan tijd hebt gescheeld. En ik heb het hier dus over het volledig aanpassen van de engine inclusief documentatie en leesbaarheid verbeteren. Caching toevoegen, van 1 grote proof of concept monolithisch monster naar MVVM op de laatste versies van .Net framework. Echt veel werk en eerlijk gezegd zitten er nu code in dat zo complex en technisch en fantastisch werkt dat ik daar nooit zelf op gekomen zou zijn.

Is de code perfect en werkt alles meteen ? nee.
Ben ik veel tijd kwijt met heen en weer communiceren wat ik wil en moet ik zelf nog veel tweaken? ja

Maar zou ik er zonder mee kunnen nu? Absoluut niet.

AI is here to stay en het wordt alleen nog maar beter.
Exact, mijn ervaring met Copilot staat echt recht tegenover @johnbetonschaar's ervaring. Het werkt geweldig en ik ben zo veel sneller en efficiënter. Ook code verzinnen waar ik zelf niet eens aan gedacht zou hebben op die manier te doen, kwaliteit gaat juist vooruit. Wel moet ik alles controleren, natuurlijk. Je moet echt niet verwachten dat zo'n ding een volledig project voor je bouwt met wat prompts. Imo, je moet zo'n ding je laten helpen, niet verwachten dat hij al het werk voor je gaat doen.

Of als je een momentje hebt waar je niet zeker over bent, dat je wil gaan googlen of op stackoverflow rondkijken, je kan het ook aan de AI vragen en die heeft dan meestal veel sneller een antwoord en ook nog eentje die direct relevant is voor je project (ipv iemand anders zn oplossing van stackoverflow proberen te verbouwen voor jouw situatie).
In plaats van google, gebruik Perplexity.
Die is echt goed in informatie van het internet te halen met juiste en volledige bronvermelding.

Ik gebruik zelf Claude AI voor programmeren omdat je veel grotere lappen tekst er in kan plakken zonder dat het in de war raakt.

En Perplexity voor alle vragen die ik heb waar ik graag bronvermelding over wil hebben. Ik kan dan zelf ook die bronnen bekijken om een nog beter beeld en antwoord te krijgen over mijn vraag.

Die die informatie kan ik ook weer in ChatGPT of Claude gooien om daar eventueel wat mee te doen in mijn code.

Copilot for Github heb ik geprobeerd maar was voor mij nog niet goed genoeg. Maar dit is ook al weer een paar maanden geleden dus wellicht is er al veel verbeterd. Het gaat razensnel
Heb ik zelf nog niet veel rondgekeken naar andere diensten, maar de integratie in visual studio code maakt het gewoon ideaal. Je schrijft een stukje comment met wat je wil gaan doen, en copilot ziet dat gelijk als een prompt voor suggesties, of je selecteert een stuk code en vraagt om een inline chat om hem te vragen de selectie te optimaliseren / verbouwen / herhalen, whatever je nodig hebt. Zo ook acties op het document zoals uitgebreiden find/replace, maak camelcase, indentation dat rekening houd met hoe je document al indented is. Dus zo gebruik ik copilot praktisch iedere paar seconden wel. Je hebt een boolean op false staan, je tiept if, en hij snapt dan al dat je waarschijnlijk iets met die boolean wil doen, of je tikt een array en dan zal hij gelijk een passende for-loop suggereren. Hoef meestal maar op enter te rammen en de regel staat er. Scheelt toch iedere keer paar secondes typwerk. Dus wel veel wat een IDE ook al doet, maar net een tikkeltje slimmer.
Er zijn twee soorten mensen in de wereld:

- Zij die klagen dat iets onmogelijk is
- Zij die het gewoon doen
En hier zit het probleem. Een goede programmeur wil helemaal geen complexe code. Complexe code maken is makkelijk. De uitdaging zit hem erin dat iemand het leest en meteen snapt, liefst ook nog zonder (al te veel) documentatie.

Ik heb zeker Copilot en ChatGPT geprobeerd. Maar wat ik eruit krijg is lage kwaliteit, of gewoon incorrect. Maar misschien ben ik gewoon geen goede "prompt engineer" :p
Maar misschien ben ik gewoon geen goede "prompt engineer"
Dat denk ik ook. Mijn ervaring met AI op dit moment is dat wat je erin stopt erg bepaald wat je er uit haalt.
Het is een andere manier van werken die als je het niet snapt ook niet de uitkomst zal hebben die je verwacht.

Mijn ervaringen met ChatGPT en vooral ook Claude.AI zijn erg positief.
Als ik jouw berichten op dit nieuwsbericht moet geloven dan ben jij programmeur én verantwoordelijk voor outsourcing van projecten én had je een eigen devteam in NL wat je eruit hebt gegooid omdat indiers het beter deden én nu doe je in je eentje projecten van 400.000 regels verbeteren met behulp van AI. Vind je het erg als ik wat moeite heb om je serieus te nemen? Niet in het minst omdat uit ervaring is gebleken dat het outsourcen naar India toch niet helemaal goed werkte. Niet dat je geen programmeur mag zijn van mij, maar de kwaliteit van een programmeur zit ook op een schaal. En als je niet zo goede programmeur bent dan lijkt AI al gauw fantastisch.

Uit eigen ervaring en dat van mijn collega's is de kwaliteit van AI-antwoorden hoogst wisselvallig; de ene keer weet het precies wat je wil en krijg je een perfect antwoord eruit, en de andere keer slaat het compleet nergens op. Maar het grote gevaar zit hem erin als je een antwoord krijgt wat op het eerste gezicht perfect je vraag beantwoord, maar als je verder kijkt dan zie je een klein dom dingetje wat niet klopt. Dat soort dingen zie je niet als je niet zo'n goede programmeur bent en dan denk je dat je lekker bezig bent maar dan introduceer je bugs of andere nare zaken in je code.
De tool werkt zo goed dat ze het niet aandurfden om hem een aanmeld formulier te laten maken…
Het blijft op basis van een taalmodel, dus ik verwacht dat het nog steeds tegen een glazen plafond aan blijft stoten en het nooit de disruption gaat veroorzaken die bijv. de NVIDIA CEO voorspelde. Dat komt vast ooit, maar niet met deze generatie taalmodellen. Het blijft super handig en relevant, maar om nou te marketen alsof je een persoon in je dev team kan vervangen door een AI... Nah. Ook niet volgend jaar of binnen 10 jaar. Dat gaat echt wel gebeuren, maar niet met een taalmodel.
Ook kan Devin volgens Cognition met feedback omgaan.
Pfffft... totaal niet realistisch dus. Die van vlees en bloed bij ons kunnen dat namelijk helemaal niet.
Klinkt als een Software Engineer uit India, overal ja op zeggen maar uiteindelijk niet doen wat je vraagt.
en dat maar voor een fractie van de prijs.
Die laatste paar tweaks en aanpassingen die je zelf moet doen weegt daar niet tegen op.

Van uit een zakelijk oogpunt is dit gewoon de toekomst.
Dat wordt dalijk lekker goedkoop software developers inhuren _/-\o_
In je dromen ja.

Op dit item kan niet meer gereageerd worden.