SoftBank en OpenAI starten joint venture om AI-agents te maken voor bedrijven

OpenAI en SoftBank zijn een joint venture begonnen om AI-agents te kunnen aanbieden aan bedrijven. Hiervoor gaan de bedrijven een computeplatform van Arm gebruiken. De AI-agents worden eerst in Japan geïntroduceerd.

Beide bedrijven worden voor de helft eigenaar van de joint venture, die SB OpenAI Japan gaat heten. Het doel is om AI-agents te ontwikkelen voor bedrijven. Tweakers schreef eind vorige maand een achtergrond over AI-agents. Het idee is dat deze agents taken kunnen uitvoeren, zoals het maken van financiële rapporten, het schrijven van documenten en het afhandelen van klantvragen. De bedrijven noemen dit AI-agentplatform Cristal intelligence.

OpenAI levert de AI, terwijl SoftBank via zijn Arm-dochter een computeplatform wil leveren. Overigens worden er verder geen details gedeeld over dat Arm-platform. SoftBank wil ook Cristal Intelligence gebruiken binnen het eigen bedrijf en Arm. Het doel is in eerste instantie om zich te richten op Japan, maar het bedrijf moet ook een 'herhaalbaar model maken dat wereldwijd ingezet kan worden'. Of de joint venture straks ook wereldwijd moet werken, is niet duidelijk.

SoftBank meldt bij de aankondiging van de joint venture dat de SoftBank-groep OpenAI-software en -AI zal gebruiken, waarvoor SoftBank jaarlijks 3 miljard dollar gaat betalen. Daarbij krijgt het bedrijf 'prioriteitstoegang' tot de recentste OpenAI-modellen. SoftBank wil zo ruim honderd miljoen workflows automatiseren, schrijft het bedrijf.

Door Hayte Hugo

Redacteur

03-02-2025 • 21:08

58

Lees meer

Reacties (58)

Sorteer op:

Weergave:

Oh dit is smullen. Dat gaat zo hard falen :) En ergens zouden ze dat zelf toch ook moeten weten; de LLM's snappen niks. Ze herhalen woorden op de juiste manier.

Natuurlijk, dat is praktisch en heeft zeker nut, maar 'agents'... Dat moet echt nog blijken en daar zijn we nog lang niet - zou ik denken. Want als de basis nu 1 op de 10 keer (of eigenlijk vaker) fouten maakt in kleine stapjes, dan is dat systeem (AI) een financieel rapport laten maken dat bestaat uit 10-tallen stapjes haast leuker dan Bert en Ernie kijken :)

lol, 100 miljoen workflows? Ik mag hopen dat dat runs zijn, en niet daadwerkelijk verschillende workflows.

[Reactie gewijzigd door DealExtreme2 op 3 februari 2025 21:14]

Wie zegt dat ze altijd 100% correct moeten zijn? 80% is ook al ruim voldoende. Heb je ooit cursor AI geprobeerd? Hiermee codeer ik letterlijk 5x zo snel. Het gaat zo snel dat ik soms ff stil moet staat wat er gebouwd is en ff refactoren. Maar het klopt, en doet het ook op de manier dat ik zou hebben gedaan. Stiekem is heel veel programmeer werk ook niet moeilijk, maar wel veel werk.

Dit gaat ook in andere vakgebieden gebeuren, daar twijfel ik niet aan. En of het 100% mensen gaat weg automatiseren, dat gaan we zien. Maar het verzetten van 5x zo veel werk, makkelijk.

Ik weet niet of dit heel veel werkloosheid gaat opleveren, maar weet hoeveel bureau werk er nu is. Ongetwijfeld gaat dit een enorme impact hebben.
Wie zegt dat ze altijd 100% correct moeten zijn? 80% is ook al ruim voldoende.
80% correct bij het maken van financiële rapporten of het beantwoorden van klantvragen lijkt mij niet ruim voldoende hoor.

Dan krijg je van die taferelen om je kaas op je pizza vast te lijmen.
Jij gaat er van uit dat die 80% dan het uiteindelijke resultaat is, dat hoeft helemaal niet zo te zijn.
Precies dit.

Als je agents gebruikt, kan het af en toe wel een foutje bevatten, maar dat haal je er als werknemer er relatief snel uit. Resultaat: software dat 100% goed werkt, maar je hoeft alleen maar die ene bug te verwijderen.

Ongetwijfeld zal dit niet voor alles de oplossing zijn, maar oplossingen maken wordt zo wel veel sneller
Dat is leuk als je een paar webpagina's maakt waar de ergste bug is dat je div niet goed gecenterd is, maar het moment dat er enige complexiteit in het spel is en er daadwerkelijk gevolgen zijn wanneer iets fout gaat, vereist het debuggen en beoordelen van de code van een ander (zij het van een mens of van een "Agent") ordegroottes meer capabelheid dan het zelf ontwikkelen ervan. Probeer maar eens een subtiele bug in firmware te vinden waardoor je een buffer overflowt, of net die vervelende edge case in een lange SQL query die voor een injectie kan zorgen, of net het verkeerde vlaggetje in je authenticatie-settings. Bijkomstige pret is dat je pas op zoek gaat naar zoiets als het al fout gegaan is...
Grappig genoeg zijn het juist dat soort problemen waar AI mij helpt het veel sneller op te lossen.
Als je een fiscaal rapport opstelt door een AI.

Vervolgens klopt die niet helemaal, moet je medewerker alles maar ook alles nalopen. Wat veel meer werk kost dan het zelf gewoon te doen.

Waardoor je de kosten van de AI kwijt bent en de kosten van de medewerker om alles na te lopen. Volgens mij een stuk duurder.

Er zijn dingen waar een foutje minder erg is. Daar kan het misschien iets toevoegen.

Ik zie alleen ergens een domino day voor mij aan bedrijven die omvallen omdat ze allemaal te veel op AI rusten en er ineens een grote speler(toeleverancier of zo) uitvalt en daar niet goed op geacteerd word want er is geen personeel meer maar allemaal "agents". Dat is een risico die ik als bedrijf niet zou durven nemen.
Je moet een AI agent ook niet de opdracht geven om een berekening te doen: Een AI agent moet je zo bouwen dat deze snapt dat deze een externe API (tool) moet aanroepen om de berekening te doen. De reponse van die externe tool wordt vervolgens weer verwerkt in het antwoord.
Weinig mensen die al met modulaire RAG's aan het werk zijn gegaan vrees ik.

Je agent is inderdaad een entiteit die toegang heeft tot "tools".
Die tools kunnen zijn: je kalender, je mailbox, een chatvenster, interne documentatie en de vorige 1000 calls omtrent een topic, een LLM etc..

En dan kan die gewoon aan de slag zoals een normaal mens zou doen. Maar dan sneller. Véél sneller. En parallel met tig klanten.
Dat heeft ook met de bronnen te maken die je gebruikt. Als je een AI gaat leren om met economische systemen te werken, dan gebruiken je bronnen die daar over gaan. Voeg een lading boeken over het gebruik toe, alle handleidingen van de systemen en ga daarmee werken en het zal vast en zeker wel goedkomen. Als je probeert om je werkgever te pesten en je gaat bewust foute bronnen toevoegen om de hele AI om zeep te helpen, zoals bij Google Gemini het probleem leek te zijn, krijg je antwoorden als lijm gebruiken om de kaas op je pizza vast te maken.

Het hoeft ook niet alles goed te doen. Het hoeft vaak alleen een beeld te geven. Geen enkele AI is tot nu toe perfect en je zal altijd alles na moeten lopen, vanwege de limieten van het systeem die er bewust of onbewust in gezet zijn.
Voeg een lading boeken over het gebruik toe, alle handleidingen van de systemen en ga daarmee werken en het zal vast en zeker wel goedkomen.
Ik hoop dat dit sarcasme is?
Hiermee codeer ik letterlijk 5x zo snel. Het gaat zo snel dat ik soms ff stil moet staat wat er gebouwd is en ff refactoren.
Ik houd mijn hart vast. Hopelijk denk je eerst liever een beetje na voor je iets gaat 'coderen' (wat geen correcte term is...).

Nu heb ik Cursor AI niet geprobeerd, wel andere alternatieven. So far not impressed. Ja een slimme autocomplete. Ja een handige tool voor sommige dingen omkatten die veel typ werk zijn. Maar 5x, nee. Lange na niet. Maar goed, hangt misschien ook af wat je aan het maken bent... als je simpelweg crud zaken bouwt die 99 van 100x er hetzelfde uitziet, dan is het een dure scaffolding tool.
Inderdaad, het was een slimme autocomplete. In eerste instantie was ik daar ook niet onder de indruk van (is wel handig daar niet van). Maar dat is ook geen agent.

Nu bij Cursor AI kan je vragen om meerdere bestanden aan te maken, welke structuur je wilt hebben en wat het moet doen. Het gaat het vervolgens 1 voor 1 voor je maken. En het werkt 80% van de tijd.

Als ik nu in een andere IDE bezig ben, zoals XCode vind ik dat nu al ouderwets aanvoelen.
"Wie zegt dat ze altijd 100% correct moeten zijn? 80% is ook al ruim voldoende."

Die ga ik op mijn volgende belasting aangifte ook gebruiken.
En dan maar hopen dat je in de ontbrekende 20% zit die de AI-agent niet gaat flaggen :+
Maar jij kan programmeren en dan ben jij een code reviewer van je Agents. Meeste nieuwe mensen moet het nog leren en zullen door de AI slop in mijns inziens rommel produceren zonder het te beseffen.
Ik ben niet zo'n fan van veel AI's in mijn IDE.

De refactors die het voorstelt zijn vaak gebaseerd op oudere versies van het platform/taal. Waardoor als jij de documentatie over de nieuwste functies in je favoriete(of verplichte) taal nagaat en dit toepast, gaat je AI het vrolijk terugdraaien. Of kiest voor een minder effectieve oplossing.

Mijn ervaring met AI in mijn IDE is dat ik snel een berg code heb. Maar vervolgens de tijd die ik bespaard heb, kwijt ben aan het debuggen van de kleine foutjes die er inslopen.
Ik heb al enkele eenvoudige en geavanceerde agents aan het werk gezien in verschillende werkgebieden. Ik zie bijzonder leuke businesscases langskomen. Maar er is niets mis met een gezonde kritische houding ;) Ik ben benieuwd naar je ervaringen over een half jaar
Nee, o.a. voice agents. Nooit echt een fan geweest van rpa :|
Als een costumer service agent voor een bepaalde internet provider hoop ik van harte dat dit gaat falen.... Ik zie deze ontwikkeling met afgrijzen aan.
Je zult steeds meer alleen de lastigste onderwerpen krijgen. De simpelere dingen doen de voice agents gewoon na van de opgenomen telefoongesprekken 'voor trainingsdoeleinden'.

Inclusief de vriendelijke houding en het eventueel een presentje sturen naar de klant die het even moeilijk had.
Ja ok maar de bedrijven gaan dan wel de hoeveelheid "menselijke agents" serieus afslanken. Net zoals de cloud crap het aantal system/network admins heeft doen afnemen.
Ook onprem gebruik ik infrastructuur als code, dat scheelt veel tijd en veel fouten.

Maar nog steeds heb ik een te kort aan beheerders mer Linux expertise.

En ik heb nog werk voor ruim 120 ontwikkelaars, dus om eerlijk te zijn, zie ik het niet als een probleem als er technische agents zijn die een deel van het 'standaard' werk voor ontwikkelaars overnemen. Er is een overschot aan werk.
Dus de menselijke agent die met AI-agents goed samenwerkt (zelf het leukste deel doen, de rest met AI-agents), zal naar mijn idee zeer relevant blijven.
Ook onprem gebruik ik infrastructuur als code, dat scheelt veel tijd en veel fouten.
Puur uit interesse: Hebben we het dan over enkel configuration management tools Ansible/chef/puppet in combinatie met git of volledige middleware zoals Terraform ? En welke linux verkies jij voor de Enterprise vandaag de dag ?
We gebruiken https://fluxcd.io/ op onze Kubernetes omgeving.

Met flux werkt CD (in de CI/CD context) omgekeerd van 'normaal' niet de pipeline duwt naar de omgeving met veel admin rechten, maar het is hier omgekeerd, vanuit het cluster wordt gekeken of de infrastructuur definitie in git is aangepast.
Zo ja, dan zorgt ie dat de infrastructuur in sync komt.

Net als bij Puppet wordt ook elke X minuten (zelf configureerbaar) gekeken of de infrastructuur nog voldoet aan de definitie, zo niet wordt deze weer in de gedefinieerde staat gebracht, ook als er geen updates in git zijn en ook als git niet bereikbaar is.

Zo is er geen ding dat van buitenaf veel rechten nodig heeft op de Kubernetes omgeving. Dat beperkt de attack vector.
En zo kan ook bij wegvallen van de git of artifactory connectie nog steeds de infrastructuur op orde blijven, dat maakt het minder kwetsbaar voor aanvallen van binnen uit (het cluster, de pods).

[Reactie gewijzigd door djwice op 4 februari 2025 22:07]

Ik heb ooit jaren terug honderden first line agents gemanaged, maak me sterk dat een bot slechter presteert dan wat op een gemiddelde helpdesk rondloopt voor grote bedrijven. Bij het bedrijf waar ik werkte was de enigste vereiste dat je Nederlands sprak, en dat was zelfs nog flexibele.

Uiteindelijk zeker voor partijen zoals Ziggo zijn 95% van de gevallen recht toe recht aan en gaat het vaker fout doordat de agent de processen niet juist doorloopt. Een bot is bij uitstek geschikt om dit soort werk te verrichten.
Je schrijft: ‘ maak me sterk dat een bot slechter presteert dan wat op een gemiddelde helpdesk rondloopt voor grote bedrijven’. Ik heb gewerkt als ‘wat er zoal rondloopt’. Dat geeft precies aan hoe er over helpdesk werk gedacht wordt en ik het ervaren heb. Werkte bij een grote nederlandse gemeente.

Weggooiarbeid, zo werd ermee omgegaan. Onderbetaald, constant gemonitord en dreigt een vast contract dan werd de medewerker eruit geschopt. Hoeveel keer er gebeld werd, de afhandel tijd, de tijd voor registreren, pauzes, wc bezoek het werd vastgelegd en alles werd gecontroleerd. Statistieken werden iedere dag naar de medewerkers rondgestuurd. Van elkaar!

Zo dus. Mischien doet een bot beter al twijfel ik, niets fijner dan een mens aan de lijn. Als men het werk en medewerkers serieus neemt en niet alleen maar als noodzakelijke klus en kostenpost zou dat vast helpen.

Het klinkt niet respectvol.
niets fijner dan een mens aan de lijn
Jij hebt duidelijk nooit naar de Sonera helpdesk gebeld.
Zo dus. Mischien doet een bot beter al twijfel ik, niets fijner dan een mens aan de lijn. Als men het werk en medewerkers serieus neemt en niet alleen maar als noodzakelijke klus en kostenpost zou dat vast helpen.
Ik heb bijna een decennium 1/2e lijns support en beetje infra gedaan voor een onderzoeksinstellingen en ik heb alleen maar lovende woorden voor de Nederlandse (ja ik Belg) Dell helpdesk werkers. Altijd vriendelijk, atlijd professioneel. Ik heb wel een totaal andere ervaring met Belgische bedrijven. Jezus Christ, altijd het vermoeden gehad dat degene die de telefoon uiteindelijk toch oppakt het laatste strootje had getrokken.
Of je bent eindelijk verlost van deze verschrikkelijke baan.
Waar baseer jij op dat we er nog lang niet zijn? Ik kan zelf best al wat use case bedenken van 'dommere' agents die al mogelijk zijn. Het moet alleen nog aan elkaar geknoopt worden
Wellicht snap je niet wat de term agents betekent in deze zin? Het zijn geen customer service agents oid. Een agent is simpelweg een AI systeem ontworpen om logisch te rederneren, iets wat ze al prima kunnen. Agents worden al veel gebruikt in IDE's zoals Cursor, die vele malen beter werken dan bijvoorbeeld een Copilot integratie.

Ik denk dat je er volledig naast zit met je comment. Ook is het geen dom idee om alvast te beginnen met deze Joint Venture terwijl de modellen van OpenAI blijven verbeteren.
Ik verbaas me er ook over dat bijna iedereen het hier leest als 'customer service agents', maar dat is niet de betekenis. Het gaat om AI agents, dat heeft niet direct iets met customer service te maken.

En ik gebruik AI volop en denk juist daarom te kunnen voorspellen dat dit een kans van richting de 0 heeft. Het kan niet tellen, het roept een hoop onzin, begrijpt feitelijk niets... Ja, er zijn fantastische use-cases, maar deze insteek is echt een stap te ver. Zie het als de zelfrijdende auto er echt al jaren bijna is; je zou zeggen dat moet kunnen, maar het kan nog steeds niet.

Of course, processen in een bedrijf zijn een stuk eenvoudiger, maar in de praktijk toch ook vaak weer niet. Want anders was het met traditionele softwareontwikkeling ook in no time weg geprogrammeerd. Al was daar dan vaak geen zicht op of budget voor. Maar nu, nu ineens willen de managers dankzij het magische woord: AI.

Het nieuwe no-code/low-code magic woord. In praktijk krijg je ook daar een hell aan kleine scriptjes en dirty fixes die niet meegaan in welke source control dan ook. Zo ook hier gaat het knopen op knopen op knopen zijn, en dan alles niet deterministisch. Success!
Wellicht snap je niet wat de term agents betekent in deze zin? Het zijn geen customer service agents oid. Een agent is simpelweg een AI systeem ontworpen om logisch te rederneren,
Ja maar lukt dat wel er is onlangs toch een paper/analyse gekomen waarin werd aangetoond dat zelfs heel simpele vraagstukken als je ze pepert met wat nutteloze informatie compleet uit de bocht gaan. Alhoewel er wel verbetering is een maand of 2 terug kon je nog aan ChatGPT vragen wat ze afweten van Frank Vandenbroecke's 11de teen en je kreeg een hele uitgevonden uitleg nu staat er een canned response iets in de trend van "Most people only have 10 toes, it's very likely that the idea of ... having 11 toes is misinformation, propaganda or otherwise wrong" ofzoiets. Ergens wel jammer, heb me wel even vermaakt daarmee.
Ze herhalen woorden op de juiste manier.
Dat is ongeveer 99% van wat klantenservice doet, vragen beantwoorden waarvan het antwoord al bekend is.
En als de bron fout is, wordt dat zo vaak herhaald dat het toch wel goed moet zijn.
Een medewerker kan net zo goed een fout maken.
Natuurlijk. Maar een medewerker wordt gecorrigeerd, en je kunt morgen een andere medewerker aan de lijn krijgen. AI zal zijn data uit een bron halen. Als daar geen controle op is (en dat is een beetje de doelstelling) dan wordt het foute antwoordt steeds vaker opgeslagen => voor waar aangenomen. Dat is het tricky gedeelte van AI's die van AI's gaan leren.
Maar waarom zou er geen controle op AI zitten?
Of eigen stel je dat een medewerker gecontroleerd moet worden, maar dat bij AI dan niet is ofzo?
Omdat AI zijn gegevens uit de grote ongecontroleerde databak haalt. Als je dat handmatig wilt gaan controleren, gaat dat zijn doel voorbij, of niet? En AI door AI laten controleren is ook niet handig.
Klantenservice haalt de informatie net zo goed uit dezelfde databak, en dus geeft dan dus ook de foute informatie door.

Resultaat is gelijk.
Wat een onzin. Ik blijf het verbazend vinden dat mensen AI afserveren omdat het geen perfecte producten levert in 100% van de gevallen. Heb je wel is met mensen gewerkt? Dit halen perfectie in 100% van de gevallen niet zou ik zeggen.
Ja maar die hebben sociale skills ... waardoor complex samenwerken mogelijk is zonder dat jij alleen dirigent moet spelen van je "agents". Ik ben de laatste maanden al zo vaak van het kastje naar de muur gestuurd door domme chatbots dat ik het gewoon heb opgegeven.
Hier een mooi voorbeeld van hoe het bij Microsoft gaat op een QA forum:

13 nov 2024
Gebruiker: Hoe kan ik een Outlook agenda in Thunderbird krijgen.
AI-Assist: Sorry, I can't help with this. Please try again or share your feedback.

bron
https://learn.microsoft.c...with-thunderbird-calendar
Dat komt omdat een AI getraind is op veel scenario's, maar niet op onbekende scenario's.

Weet iedereen nog de introductie van de chatbots? Dit is dat opnieuw, maar dan met meer scenario's erin verwerkt.

Voor IT zaken zal veel hiervan goed gaan, daar veel casussen goed online gedocumenteerd zijn en gebruikt worden. In de directe zorg zal het al een stuk minder toepasbaar zijn.
De klantenservice-bot dus? Als ik iets met heel mijn wezen haat... Maar wie weet wordt wat komt wel anders, laten we het maar eens kans geven.
die bots zitten vaak vast aan voorgedefinieerde scenario's terwijl het de bedoeling juist is dat AI-agents flexibeler zijn qua input en dus ook output
Uiteindelijk doen AI-agents hetzelfde als de chatbots, ze hebben alleen een veelvoud aan parameters waardoor die flexibiliteit ontstaat.
Ik bel zelden met klantenservices, maar zodra ik merk dat ik een computer aan de lijn krijg hang ik sowieso meteen op, de paar keer dat ik het geprobeerd heb kreeg ik alsnog een medewerker aan de lijn omdat de computer gewoon standaard antwoorden opratelt. Alsof dat ding bepaalde trefwoorden in mijn vraag aanvinkt en het antwoord geeft waar die trefwoorden allemaal in voorkomen.
Klopt, tot nu toe is het gebaseerd op trefwoord- of woordcombinaties (of synoniemen of vervoegingen van de woorden die je gebruikt) . Net zoals een traditionele chatbot.
Een LLM kan dat beter gaan doen.

De antwoorden zullen klinken zoals de antwoorden die https://notebooklm.google/ geeft op vragen die je stelt aan de podcast.
Inclusief de lachetjes, zuchtjes, adempauze en complimentjes of grapjes.

[Reactie gewijzigd door djwice op 4 februari 2025 00:55]

De antwoorden zullen klinken zoals de antwoorden die https://notebooklm.google/ geeft op vragen die je stelt aan de podcast.
Ik kan me voorstellen dat het voor een 'klantenservice' achtig iets wel kan werken. Zolang je maar een 'escape' hebt naar een echt persoon.

Los hiervan, dat notebooklm ; daar krijg ik wel een beetje kriebels van. Hoe kom je ooit tot leren als je niet uitgedaagd wordt zelf samen te vatten, te begrijpen, etc, maar dat aan een tool overlaat. We krijgen een generatie mensen die niet zonder AI meer kunnen denken lijkt wel :?
Dat dachten we eerder ook van andere technologieën.

Vroeger dacht men dat in een encyclopedie uiteindelijk alle kennis zou staan. Bleek uiteindelijk toch niet alles omvattend.

En ook zo met AI die zal ook niet alle manieren van informatie vergaren omvatten of vervangen. En ook niet alle vormen van leren en begrijpen overbodig maken.

Uiteraard gaan we met de techniek samen dingen doen en dat wordt gewoon. Net als Google Maps nu gewoon is en bijna niemand nog een papieren kaart of een apart apparaat gebruikt om met de auto een route te volgen of te plannen.

Dat is niet erg, het is gewoon een verandering.
Ik krijg de laatste tijd ... text-to-speech belspam. Ik kan me wel inbeelden als dit blijft evolueren dat er heel veel mensen opgelicht gaan worden. Zeker als ze de intentie ervan wat meer kunnen verhullen.
Dan doet die computer goed zijn werk volgens de meeste bedrijven. Bij providers (energie, internet, tv noem maar op) boeit het de aandeelhouders namelijk niks of de klant wel of niet goed geholpen wordt, als ze maar kunnen aantonen dat ze een helpdesk hebben.
Die gasten bij OpenAI zijn niets anders dan ordinaire oplichters. Dit is niets anders dan een money grab. Nu ze eindelijk concurrentie hebben zullen ze met meer producten komen die in werkelijkheid niets toevoegen aan je bedrijf. Eerst dure abonnementen voor een platform dat na genoeg antwoorden toch crashed of simpele natuurkundige problemen niet kan oplossen, en nu AI-agents.
Wat is de volgende gimmick van OpenAI?

Als bedrijf zou ik niet zo snel dit aanschaffen. Voordat je het weet zuigt zo een corrupte AI agent alle data uit je toko en verstuurt het naar OpenAI die het vervolgens verkoopt aan je concurrent. Doet me een beetje denken aan EA: eerst maak je een competitive shooter, vervolgens creëer je tools die cheaten mogelijk maakt en ga je die ook verkopen.

Op dit item kan niet meer gereageerd worden.