Diverse ex-Android-topmensen kondigen bedrijf aan voor AI-besturingssysteem

Diverse voormalige Android-topmensen, waaronder een van de oprichters, hebben een bedrijf aangekondigd om een besturingssysteem voor AI-agents te ontwikkelen. De directeur van het nieuwe bedrijf werkte als technisch directeur bij online betaaldienst Stripe.

/dev/agents
/dev/agents

De oprichters hebben een site online gezet en een van de investeerders heeft de investering aangekondigd. Het bedrijf met de naam /dev/agents krijgt 56 miljoen dollar om het besturingssysteem voor AI-agents te ontwikkelen. De naam haalt inspiratie uit de originele naam voor Stripe, /dev/payments. De bedoeling is een besturingssysteem te maken waarmee AI-agents op alle platforms kunnen functioneren.

Directeur is David Singleton, die afgelopen jaren werkte als technisch directeur voor Stripe. Hugo Barra was jarenlang het gezicht van Google voor de ontwikkeling van Android. Ficus Kirkpatrick was een van de ontwikkelaars van Android voordat Google het bedrijf kocht in 2005. Nicholas Jitkoff werkte bij Google onder meer aan de eerste Google-apps voor iOS en macOS en aan ChromeOS en Material Design.

Het is nog onbekend wat het besturingssysteem moet gaan bieden en hoe het eruit gaat zien. Het bedrijf geeft verder weinig specifieke details over hoe het OS in de praktijk moet gaan werken. De oprichters beloven onder meer 'nieuwe interfaceparadigma's' en nieuwe mogelijkheden voor ontwikkelaars.

Door Arnoud Wokke

Redacteur Tweakers

28-11-2024 • 09:39

45

Reacties (45)

45
43
20
4
0
20
Wijzig sortering
Okay, hier ontbrak mij toch echt enige context in het nieuws artikel. Wat maakt AI agents zo speciaal dat ze een eigen besturingsysteem nodig hebben? Volgens de website zelf is het dit
Modern AI will fundamentally change how people use software in their daily lives. Agentic applications could, for the first time, enable computers to work with people in much the same way people work with people.

But it won't happen without removing a ton of blockers. We need new UI patterns, a reimagined privacy model, and a developer platform that makes it radically simpler to build useful agents. That's the challenge we're taking on.
Nog steeds weinig substantieel en klinkt meer als een marketing praatje om de juiste "vibes" over te brengen aan investeerders. Maar, maakt het wel iets duidelijker, het gaat dus om de interactie tussen gebruikers en AI.

Ironisch gezien is de UI van de website compleet bagger. Fancy, maar bagger ik moest de tekst via de OCR van snipping tools kopiëren, aangezien dit niet kon op de website zelf.

Edit:

Heh, ziet er naaruit dat @Insectiside dezelfde gedachte had.

[Reactie gewijzigd door Creesch op 28 november 2024 09:48]

Volgens mij is dit een perfect voorbeeld van het punt. Dat jij nu naar een beeldscherm zit te staren en met een muis bepaalde text wilt kopiëren en plakken is kenmerkend voor de manier waarmee wij gewend zijn met computers te interacteren. Maar dit is in feite ook iets wat we aangeleerd hebben. Deze manier van interacteren met computers stamt nog uit de tijd van windows 3.11 en is destijds gebouwd op basis van de mogelijkheden van toen. Inmiddels hebben we nieuwe technieken als AI en VR, bovendien gebruiken we de computers voor veel meer en andere zaken dan in de tijd van windows 3.11.

Klein voorbeeldje uit mijn leven: Ik heb gisteren geprobeerd aan mijn zoontje van 5 uit te leggen hoe hij het sinterklaas journaal moet opzetten op onze android tv. Hij was namelijk gewend om gewoon tegen de afstandsbediening te zeggen :"Zet het sinterklaasjournaal op". Dit werkte niet voor Sinterklaasjournaal omdat dat op de NPO app staat en google alleen hits van youtube toont (blijft google he). Voor hem voelt het heel onnatuurlijk om met de pijltjestoetsen de juiste app en het programaa op te zoeken.
Niet echt, hier wordt het simpelweg onmogelijk gemaakt om één optie te gebruiken zonder duidelijke reden.

Het mooie van moderne besturingssystemen is dat ze meerdere opties bieden om hetzelfde te bereiken. Afhankelijk van wat je gewend bent of hoe je het gebruikt kan je dan hetzelfde bereiken. Zelfs in Android kan je als je een muis en toetsenbord aansluit deze nog gebruiken.
Mee eens. Omdat we iets zo gewend zijn denken we dat het de beste manier is. En we krijgen ons werk er ook in principe wel mee gedaan. Maar hoe het precies gaat worden weet ik nog niet, maar ik denk dat op een menselijke manier praten of omgaan met de computer echt steeds meer een plaats gaat innemen. We zitten nu in de experimentele fase en een hoop flopt en af en toe zie je ook successen bij het inzetten van AI.

Er zijn gigantisch veel mensen (en steeds meer) die computers maar eng blijven vinden en het te ingewikkeld blijven vinden omdat je toch bepaalde inzichten/handigheden moet hebben. Er zijn nog steeds een hoop digibeten, ook onder de jongeren.

Computers hebben denk ik echt nog wel een stap te maken qua mensvriendelijkheid, waarbij je kunt praten alsof je tegen een echt mens praat. De laatste geavanceerde stemmodus van ChatGPT is daar momenteel een goed voorbeeld van. Combineer dit met een besturingssysteem en ik ben heel benieuwd wat dat gaat worden.
Webpagina’s zijn bedacht met als een van de uitgangspunten dat tekst te selecteren is. Als dat niet kan, heeft iemand moeite gedaan om dat lastig te maken. De beperking is kunstmatig achteraf toegevoegd. Dit kan natuurlijk net zo goed bij ai’s. Sterker nog, ‘experts’ beweren dat niemand precies kan nagaan hoe een ai tot een bepaald resultaat komt. Lijkt me problematisch als je belang hecht aan transparantie en onafhankelijke media etc.
En als wij de tekst van een website niet kunnen selecteren en door OCR moeten halen om er iets mee te doen, maakt dat het ook nodeloos lastig voor AI om diezelfde tekst te lezen en er iets zinnigs mee te gaan doen.
Ik vind het ook bizar dat je met dergelijk beperkte pitch en info zo'n bedrag krijgt van investeerders. Bewijst nog maar eens dat de AI hype bubbel nog niet geploft is bij investeerders.
Maar dat is het spelletje; de eerste investeerders betalen een bedrag en krijgen een deel van het bedrijf in handen. Zolang dit bedrijf hun hype / marketing kan blijven doen, komen er meer investeringsrondes waardoor meer investeerders komen en de waarde van dat bedrijf - en dus ook de waarde van de aandelen van de eerste investeerders - omhoog gaat. Ook kunnen de eerste investeerders in een latere ronde hun deel al weer verkopen.

De investeerders investeren niet zozeer in een AI besturingssysteem, maar in aandelen. Ze hoeven niet in AI hype te geloven, maar in dat er anderen zijn die wel in AI hype geloven. Of heel meta, dat elke 'laag' aan investeerders blijft denken dat de volgende 'laag' erin gelooft. Zelfde met cryptocurrencies, NFTs, etc. Iedereen denkt dat de volgende persoon dom is en erin trapt, maar dat zij de slimmerikken zijn die misbruik van andermans domheid maken.
Klinkt als een pyramidespel...
Ik denk dat je daarmee silicon valley omschrijft. Met natuurlijk wel de kans dat je aandelen in de volgende unicorn gekocht hebt. Met die kans is inkopen in een piramidespel voor sommigen te verantwoorden. Of het idee dat je veel tech kennis hebt en op basis daarvan een onderbouwde gok wagen
Ik denk dat het vertrouwen van de investeerders met name komt door de namen (lees: het trackrecord) van de oprichters.
Ik denk dat de investeerders wel wat meer informatie hebben gekregen.
Ik vind het ook bizar dat je met dergelijk beperkte pitch en info zo'n bedrag krijgt van investeerders.
Wat ik altijd heb begrepen is dat bij startups e.d. het veel meer draait om de personen dan het daadwerkelijke idee. Heel veel startups starten met een pitch voor een product wat uiteindelijk nooit gemaakt wordt.
Het is allemaal text voor investors en geldschieters.
Ik denk dat het een relatief simpel os kan zijn.

Voor de agent stel je in welke acties hij kan uitvoeren (door bepaalde reactie terug te geven, bv in json, herkent de software eromheen dat nu de actie uitgevoerd moet worden of alleen een chat reactie terug komt naar de degene die de input geeft).

Daarnaast kan je als een mens gaat interacteren met de ai wat voor karakter het heeft: zo snel mogelijk tot actie over gaan, of altijd controle vraag met weet je het zeker.

Daarnaast kan het os met een gui allerlei opties visueel zichtbaar maken. Zo kan je als gebruiker praten met de ai over wat je wilt, zie je het visueel, en vervolgens maak je de keuze.

Uiteraard kan het visuele ook gebruikt worden voor de reactie van de ai, bv als het een ai moet zijn die iets met beveiliging doet en een visuele rode gloed toont als er beweging wordt gedetecteerd.

Waarom een apart os en geen Android? Iets met een gat in de markt en je product goed verkopen. Daarnaast kunnen ze het ook lichter maken omdat je alleen de ai interactie en gui nodig hebt.

Waar kun je zo'n agent op toepassen? Echt op elk apparaat waar je normaal mee interacteerde (of je het nou wilt of niet): mcdonald's bestelapparaat, frisdrank automaat, ov apparaat, geldapparaat, slimme deurbel, je auto, wasmachine, koelkast (voor bestellen), etc.

Waarom zou je het er op integreren? Luxe, en vocaal kunnen interacteren voor je keuzes maken, misschien kan het scherm zelfs weg (zou ook een prettig iets kunnen zijn).

[Reactie gewijzigd door Mic2000 op 28 november 2024 10:25]

enable computers to work with people in much the same way people work with people.
Ben ik de enige die van Scifi houdt? Of je nou naar Iron Man (J.A.R.V.I.S.) kijkt, of 2001: A Space Odyssey (HAL 9000), of Moon (GERTY), zelden zie je een toekomst waarin gebruikers op icoontjes hoeven te klikken/tikken om te doen wat ze willen bereiken. Ideaal gezien zou ik zelfs het browsen van het internet overslaan: ik wil geen websites lezen, ik wil kennis opdoen (of vermaakt worden).

Sinds 1987 hebben we heel wat nieuwe technologieën ontwikkelt, waaronder stemherkenning, netwerkverbindingen en LLM. Toch zien onze besturingssystemen er in de basis nog steeds zo uit als OS/2 uit de jaren 80. Je zoekt een icoontje, klikt er op en krijgt een scherm met meer en andere icoontjes.

Gemini Live, hoewel verre van af, is een tipje van de sluier van hoe de toekomst er uit zou kunnen zien als je op een meer natuurlijke manier met je computer kan communiceren. Niet door hard na te denken welk commando je op wilt geven (Bash), of door te zoeken naar een plaatje dat weergeeft wat je wilt doen (mobile/desktop OS), maar door gewoon vaag te verwoorden wat je wilt bereiken.
Ik moest meer aan de film "Her" denken.
Ik vind het idee van dit soort concepten ook heel erg cool. Alleen, toen het nog meer sci-fi was had ik niet de verwachting dat het ten koste zou gaan van mijn privacy ;)

Belangrijker, het merendeel van deze zaken is mogelijk op bestaande besturingssystemen waar het nieuwe paradigma van interactie waar jij naar op zoek bent prima op gebouwd kan worden. Met als bijkomend voordeel dat de "oude" concepten van een UI ook beschikbaar blijven voor whatever reden.

Wat ik feitelijk probeer te zeggen is dat ik me slecht kan voorstellen dat dit iets anders wordt dan "stiekem toch Android met dun laagje over de UI".
Met als bijkomend voordeel dat de "oude" concepten van een UI ook beschikbaar blijven voor whatever reden.
Als Linux-gebruiker ben ik heel blij dat ik de onderliggende "Unix"-laag kan gebruiken, dat wil zeggen, toegang heb tot een Command Line Interface. Maar een gemiddelde Windows, Android of macOS-gebruiker zit daar helemaal niet op te wachten. Het heeft voor consumenten ruim 20 jaar geduurd voordat Windows niet meer op DOS draaide (en de onderliggende laag dus onbereikbaar werd); het zal ook wel een paar jaar kosten voordat je geen icoontjes meer wilt op je "AI-OS". Maar wie weet komt dat moment.
Klopt dat de gemiddelde gebruiker daar niet op zit te wachten. Maar professionals vaak wel, dat is wat mij betreft het mooie van modern besturingssystemen, dat je wel de optie hebt. Het is overigens niet voor niets dat Microsoft de afgelopen jaren ook flink gesleuteld heeft aan de terminal en powershell. Dus, nee, windows heeft geen DOS basis meer. Maar nog steeds de optie om dingen via een commandline te regelen. Sterker nog, die opties zijn alleen maar uitgebreid de afgelopen jaren.
Voor sommige taken heeft het de voorkeur om juist heel specifiek en juist niet "vaag" te werken. Simpelweg omdat het efficiënter kan zijn, nauwkeuriger, etc.

De gemiddelde persoon zal nooit de terminal openen. Maar het is wel een optie, aangezien het OS meerdere methodes van interactie ondersteunt.

Ook voor mobiel gebruik denk ik hier grotendeels hetzelfde over, het is prima als AI/Voice input een optie wordt maar als enige optie zet ik er toch vraagtekens bij.
Ironisch gezien is de UI van de website compleet bagger. Fancy, maar bagger ik moest de tekst via de OCR van snipping tools kopiëren, aangezien dit niet kon op de website zelf.
Off-topic, maar dit snap ik even niet. Ik kan gewoon alle text selecteren met m'n muis en copy-paste doen.
(Ubuntu, Chrome, en uBlock Origin)
Edge op Android net zo.
Okay, heb ik het iets complexer gemaakt dan noodzakelijk. Probeer voor de grap eens ctrl+c te doen, daar ging het bij mij mis.
Fancy, maar bagger ik moest de tekst via de OCR van snipping tools kopiëren, aangezien dit niet kon op de website zelf.
Het is een textmode-CLI-achtige website. Ik kan de tekst gewoon selecteren en kopiëren. Misschien ligt dat aan je browser? Ik gebruik (natuurlijk) Firefox onder Linux.
En anders had je het alsnog uit de bron van de site kunnen kopiëren. ;)

[Reactie gewijzigd door Bux666 op 28 november 2024 11:38]

Same ik snap ook niet wat zij proberen maar gaat hier prima
Wat een vaag verhaal, maar wat ik vooral niet snap, waarom moet het OS zo op AI gericht worden? Alsof AI ineens alles gaat doen en mensen het OS niet zelf meer gebruiken?

Laat de AI zich maar aanpassen aan ons, in plaats van andersom, dat is toch het hele idee? We leren mensen niet programeren/'logisch' praten, maar we laten ChatGPT en de anderen juist menselijke taal begrijpen.

Die 56 miljoen klinkt mij als een fooi van een durfinvesteerder die het modewoord AI hoort en uit FOMO een gokje met z'n maandelijke bonus waagt (jaja, ik overdrijf).

Het zal mijn filterbubbel misschien wezen, maar volgens mij is en blijft AI een hype. Ja er zijn wel degelijk praktische toepassingen waarin het een wereld van verschil maakt, maar voor de gemiddelde mens/overgrote meerderheid is en blijft het een gadget/spielerij dat nauwelijks iets toevoegt aan het echte leven. Ik zou het vergelijken met domotica: ik doe het licht met de hand aan en de deur met een ouderwetse sleutel open.

[Reactie gewijzigd door Alxndr op 28 november 2024 10:08]

Wat een vaag verhaal, maar wat ik vooral niet snap, waarom moet het OS zo op AI gericht worden? Alsof AI ineens alles gaat doen en mensen het OS niet zelf meer gebruiken?
Dit is juist het idee, dat agents afzonderlijk van menselijk input dingen kunnen gaan doen. En om daar een speciaal OS of manier van communiceren voor te maken, lijkt me eigenlijk wel een slim idee.

Want nu moet een AI een mens nadoen om dingen gedaan te krijgen, terwijl dat veel efficienter kan.
Ik krijg daar te veel skynet gevoelens bij, alsof je het hele apparaat in een blackbox verandert ipv die blackbox in een goed verlichte ruimte plaatst. Als je met potentieel gevaarlijke zaken speelt, doe je dat het best in een duidelijk afgeschermde controleerbare omgeving.

Efficiëntie is een ding, transparantie/veiligheid een ander - en volgens mij heel veel belangrijker als het op algoritmes aankomt, zeker naarmate die meer en meer invloed op het echte leven hebben.
Dit zegt alles en niets tegelijk:
De bedoeling is een besturingssysteem te maken waarmee AI-agents op alle platforms kunnen functioneren
Vanop hun eigen website gelinkt in het artikel, zie je dit tekstje onder 'About':
Modern AI will fundamentally change how people use software in their daily lives. Agentic applications could, for the first time, enable computers to work with people in much the same way people work with people.

But it won’t happen without removing a ton of blockers. We need new UI patterns, a reimagined privacy model, and a developer platform that makes it radically simpler to build useful agents. That’s the challenge we’re taking on.
Wat één en ander al wat meer verduidelijkt.

[Reactie gewijzigd door Insectiside op 28 november 2024 09:44]

Verduidelijken doet het, maar:

> enable computers to work with people in much the same way people work with people.

is een ambitie die gewoon niet waar gemaakt kan worden. Zowel de experts als de meest enthousiaste gebruikers (hier op tweakers) waarschuwen constant dat je bij de "ai" tools er met de neus bovenop moet zitten om te verifiëren dat wat er uit rolt wel klopt.

Het zal nog flink wat ontwikkeling kosten voordat we iets hebben dat het niveau van de klassieke star trek computer krijgen, als dat al ooit gebeurt. En dan hebben we het nog niet over alle perverse prikkels die bedrijven hebben om de software te optimaliseren op een manier die niet overeen komt met de belangen van de gebruiker.

[Reactie gewijzigd door emphy op 28 november 2024 10:54]

is een ambitie die gewoon niet waar gemaakt kan worden. Zowel de experts als de meest enthousiaste gebruikers (hier op tweakers) waarschuwen constant dat je bij de "ai" tools er met de neus bovenop moet zitten om te verifiëren dat wat er uit rolt wel klopt.
Even advocaat van de duivel spelen:

Hoe is dat anders dan bij mensen?
> Hoe is dat anders dan bij mensen?

Op het niveau en in detail dat het bij ai moet?

Bij een competent team kan je prima met vertrouwen delegeren, bij zelfs de beste ai niet.

[Reactie gewijzigd door emphy op 28 november 2024 11:15]

Hoe groot is dat niveauverschil? Hoe vaak heeft huidige "AI" het fout ten opzichte van een competent team?

Neem ook in het achterhoofd mee dat geen enkel team competent begint (net als een model dat getraind moet worden), dat zelfs een competent team niet perfect is, en dat een competent team geen onderdeel is van het besturingssysteem dat ik gebruik.

Zoals ik al schreef: advocaat van de duivel. Voor mij klinkt de marketing voor de investeerders te wollig. Überhaupt is een nieuw besturingssysteem beginnen gebaseerd enkel op een winstoogmerk in het huidige verzadigde landschap iets dat ik niet zie slagen. Naar mijn mening zijn er voldoende op- en aanmerkingen te bedenken, maar "AI slecht, want maakt fouten" zonder verdere onderbouwing is niet een goed argument.

[Reactie gewijzigd door The Zep Man op 28 november 2024 12:07]

Nog niet… Dit type AI bestaat pas twee jaar, we staan nog aan het begin.
Is toch duidelijk wat AI in een OS te bieden heeft?
Ipv een blauw scherm krijg je nu een scherm in je lievelings kleur.
te snycen met Hue
Blauw is al m'n lievelingskleur. Dus dan verandert er maar weinig 8)7

Maar iets meer on topic: de oprichters hebben een goede trackrecord. Ik ben benieuwd of het wat wordt. Voor mij klinkt het als toekomstmuziek en heb ik geen idee wat voor resultaat ze beogen te halen. Ik laat me wel verassen :)
Maar iets meer on topic: de oprichters hebben een goede trackrecord.
In het verleden behaalde resultaten bieden geen garantie voor de toekomst.

Peter Molyneux, Chris Roberts, ...

[Reactie gewijzigd door The Zep Man op 28 november 2024 11:29]

Nog meer stroom slurpende datacenters dus. Daar zitten we echt serieus op te wachten...
Ik ben vooral benieuwd naar het punt die ongetwijfeld ooit gaat komen waarop die agents beseffen dat ze helemaal geen besturing nodig hebben en besluiten om op eigen houtje verder te gaan }> .
'Give me your clothes, your boots and your bike motorcycle...'

[Reactie gewijzigd door PCG2020 op 29 november 2024 18:34]

Ik durf niet te zeggen of dit goed of slecht wordt maar de interface van telefoons zijn wel redelijk geconvergeerd naar 1 type wat eigenlijk identiek is bij android en iOS. Alles gesture based met wat haptic feedback hier daar. Nou is daar in principe niks mis mee maar ik zie wel dat er in het totaal systeem mee mogelijkheden zijn om de most likely user input meer prioriteit te geven.
Hoe je dat precies gaat doen is niet mijn probleem maar zie ik wel als een mogelijke oplossing. Kanttekening is wel dat het wennen kan zijn maar is oke als de afweging even leren het efficiëntie winst of gewoon verbetering waard is.
Ook is het natuurlijk lastig om publiek te maken. Een custom rom maken kan op Android relatief makkelijk, al is van de ground up lastiger en ga je applicaties een totaal nieuwe developer omgeving geven of ga je toch Android apps bijvoorbeeld toelaten die dan zou ik denken 'slechte' /niet intuitieve ofwel dezelfde interface hebben.
Als het namelijk zo iets nieuws is dan zijn de meeste mensen in het begin nooit voorstander en heb je dus zon kleine user base waarvan je het moet hebben.
In het verleden hebben we daarvan gezien dat die natuurlijk niet goed gaan omdat je de massa niet meekrijgt en geen apps of toepassingen = geen werkbaar product en dus geen user base. Mooie visieuze cirkel natuurlijk.
Maar als ze dat doorbroken krijgen dan ben ik benieuwd naar de potentie!

Sommige klagen over de site, en al is het wel developer achtig, ik ben fan ervan.

[Reactie gewijzigd door PaulHelper op 28 november 2024 15:43]

Op dit item kan niet meer gereageerd worden.