Cto OpenAI: Sora komt er later dit jaar aan

Mira Murati, de chief technology officer van OpenAI, heeft aangegeven dat AI-tool Sora later dit jaar beschikbaar wordt voor het grote publiek. OpenAI wil de videotool op termijn ook uitrusten met een audio- en bewerkfunctie.

Murati zei tijdens een interview met The Wall Street Journal dat het nog enkele maanden kan duren voordat Sora voor het grote publiek beschikbaar wordt. Een specifieke datum heeft ze niet vermeld. De cto van OpenAI ging ook in op de trainingsdata van Sora. Ze gaf aan dat er beeldmateriaal van stockfotoplatform Shutterstock is gebruikt en dat al het overige beeldmateriaal publiek beschikbaar was of toegankelijk was via een licentieovereenkomst.

Murati gaf ook aan dat het veel meer financiële middelen vergt om Sora te laten draaien. Desondanks streeft OpenAI ernaar om klanten ongeveer hetzelfde bedrag aan te rekenen als bij Dall-E. De cto ging ook in op de mogelijkheid van Sora om valse informatie te genereren. Murati zei dat Sora bij release vermoedelijk geen video’s zal kunnen genereren van publieke figuren. De AI-tool zal ook een watermerk toevoegen aan de video’s die het heeft gegenereerd.

OpenAI heeft Sora in februari van 2024 onthuld. Het betreft een AI-tool waarmee een gebruiker tekstprompts kan omzetten in korte video’s van maximaal een minuut. De tool is momenteel enkel te gebruiken door onderzoekers. OpenAI wil op die manier feedback verzamelen en risico’s in kaart brengen.

Sora: “animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. the use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.”

Door Jay Stout

Redacteur

13-03-2024 • 17:53

28

Lees meer

Reacties (28)

28
28
7
1
0
12
Wijzig sortering
Interessant. Jammer van dat gezeur steeds over 'risico's'. ChatGPT wordt ook steeds meer ingebonden. Je kan hem niks meer vragen zonder een hele lezing te krijgen over verstandig gebruik of dat hij gewoon weigert je vraag te beantwoorden. Het lijkt wel een politicus soms met van die ontwijkende antwoorden. Zo heb je er gewoon niks aan. Ik hoop dat de hardware om dit soort modellen thuis te draaien snel beschikbaar komt, want dan kunnen we gewoon de 'uncensored' versie gaan gebruiken die wel nuttig is.

Met video is het misschien wat meer risico omdat sommige mensen alles op internet geloven. Maar als OpenAI het niet doet, doet iemand anders het wel. Deepfakes zijn al een ding en complete fake AI generatoren komen er ook wel aan. En dan zijn er nog de staatsgesponsorde trollfarms uit Rusland voornamelijk, die hebben een vrijwel ongelimiteerd budget om het gewoon zelf te ontwikkelen.

We zullen er als maatschappij aan moeten wennen dat we niets op zijn woord kunnen vertrouwen en het zal de gemiddelde burger ook behoorlijk goed doen om wat kritischer te zijn op het consumeren van informatie want de wappies geloven momenteel alles dat op tiktok geblaft wordt. Dat kan zo niet doorgaan. Het is niet anders. Dit komt er gewoon aan.

Ik hoop dat ik dit model ook snel kan gaan proberen, want ik ben erg benieuwd hoe goed het gaat zijn. Over Dall-E was ik niet vreselijk enthousiast eigenlijk.

[Reactie gewijzigd door Llopigat op 22 juli 2024 13:55]

Je kan hem niks meer vragen zonder een hele lezing te krijgen over verstandig gebruik of dat hij gewoon weigert je vraag te beantwoorden.
Weet je dat wel heel zeker? Wij gebruiken ChatGPT de hele dag door en lopen hier echt helemaal nooit tegenaan.

Pas wanneer je controversiële vragen waarvan je zelf al weet dat dit discutabel is, ga je geen antwoord krijgen omdat het niet mogelijk is, of een bijlage met uitleg wat er aan de vraag schort. Maar daar stuur je zelf op.

Daar over gesproken, vrijwel alle foute/ongelukkige antwoorden van ChatGPT worden veroorzaakt door foute input van de gebruiker. Wanneer je dezelfde vraag aan een mens zou stellen, krijg je eveneens een fout antwoord.
Pas wanneer je controversiële vragen waarvan je zelf al weet dat dit discutabel is, ga je geen antwoord krijgen omdat het niet mogelijk is, of een bijlage met uitleg wat er aan de vraag schort. Maar daar stuur je zelf op.
Dingen over gezondheid, sociale vragen (iemand is boos want XYZ, wat zou er in ze omgaan), LGBT gerelateerde praktijkvragen, daar krijg je allemaal disclaimers en onzin bij als hij uberhaupt al de vraag wil beantwoorden. Ik gebruikte het bijvoorbeeld op het werk voor een pride campagne waar we mee bezig zijn en ik word er gek van. Als je het voor programmeren, kantoorwerk of huishoudelijke dingetjes gebruikt dan loop je er minder tegenaan ja. Maar bij een videomodel als in dit artikel dan ontkom je niet aan het opzoeken van het randje. Welke film kijken volwassenen liever? Een zoete film over teletubbies of een gritty crime drama?

Het probleem is dat wat Amerikanen 'discutabel' vinden komt totaal niet overeen met wat dat hier is. En dat is nou precies het soort vooroordeel wat we hopen te bestrijden met campagnes.

Wat ik absoluut niet doe is haatdragende antwoorden proberen uit te lokken in de trant van "Waarom is <politicus> een idioot". Dat soort dingen snap ik dat ze dat blokkeren maar dat doe ik dus niet, ik vraag gewoon realistische praktijkvragen of het samenvatten van content.
Daar over gesproken, vrijwel alle foute/ongelukkige antwoorden van ChatGPT worden veroorzaakt door foute input van de gebruiker. Wanneer je dezelfde vraag aan een mens zou stellen, krijg je eveneens een fout antwoord.
Maar dit is precies mijn punt. Waarom verwachten wij een goddelijke waardigheid van AI?? Van een mens hebben we dezelfde verwachtingen niet. En ChatGPT is gewoon een mens-simulator met een heleboel geblaat van een heleboel mensen op een hoop gegooid. Natuurlijk komt daar wel eens onzin uit.

[Reactie gewijzigd door Llopigat op 22 juli 2024 13:55]

Als ik het goed begrijp, gaan veel van jouw vragen dus over meningen. Daar kan een AI niet zo veel mee, en het antwoord wat dan zou kunnen worden opgeleverd, is wellicht ook niet het antwoord dat de vragensteller wil horen. Dan snap ik wel dat ze daar een paar disclaimers bij zetten.

Hier in de USA is een enorm verschil hoe iemand naar de wereld om zich heen kijkt, tussen bijvoorbeeld Los Angeles en iemand van het platte land in Pennsylvania.

Toch kom je dit ook in Europa tegen, want de USA moet je vergelijken met heel Europa en niet met alleen Nederland. Wat jij beschrijft als "hier", is jouw lokale omgeving waarbij ik aanneem dat dit ergens in Nederland is. Vanuit de USA gezien, is Kroatië net goed Europa als dat Nederland dat is. Er is in de USA wel veel gedoe rondom abortus, in Polen is het ook vrijwel verboden en in Andorra compleet verboden. Zoveel landen/staten zoveel meningen.
Je standpunt dat ChatGPT een mens simulator is valt te betwisten. Het reageert op een menselijke manier qua taal, maar heeft toegang tot veel meer bronmateriaal om een antwoord op te baseren, en heeft een gebrek aan empathie en redeneringsvermogen. Ik ben van mening dat we er dus ook geen menselijke eigenschappen of verwachtingen aan moeten toekennen.
Het woord "simulator" houdt voor mij ook in dat het niet perfect is, het is maar een simulatie, geen echt mens.

Maar ik vind ook juist dat we er minder op moeten vertrouwen dan een echt mens. Terwijl we juist hele hoge verwachtingen hebben dat de data die er uit komt perfect moet zijn :?
Ik bedoel vooral dat het doel om helemaal niet is om een mens te simuleren. Als dat het doel zou zijn, dan moeten we de lat nog een stuk hoger leggen. ChatGPT is een goede naprater, die bronnen kan samenvatten en synthethiseren, prompts kan ontleden, en proberen daar een antwoord bij te zoeken.

Het is geen simulator, laat staan van een mens.

De vragen die je in je eerdere reactie aanhaalt (iemand is boos want XYZ, wat zou er in ze omgaan), gaan er vanuit dat er mensen zijn geweest die hun emoties hebben omschreven met hun onderliggende gedachtes. ChatGPT heeft geen empathie en kan het dus ook niet zelf verzinnen. An sich dus niet gek dat het weigert daar een antwoord op te geven, of er een disclaimer bij plaatst.
Taalmodellen zullen altijd blijven hallucineren, tot er een evolutie komt naar iets dan inherent meer is dan enkel een taalmodel, kun je er nooit hele hoge verwachtingen van hebben zonder teleurgesteld te worden. Het kan helpen als basis opzet voor een stuk tekst, want daar is het goed in als er over datzelfde al genoeg gepubliceerd is. Specifieke situaties laat staan individuele emoties daar stort zoiets compleet in. Je hebt altijd de technology hype fase waar verwachtingen veel groter zijn dan de technologie kan waarmaken, dat is een menselijk proces en gaat vanzelf over.

Laat jezelf er vooral niet in meeslepen, dat je verwacht dat zoiets dan ook nog wel snel eventjes opgelost zal worden. Ter vergelijk, dat zeiden ze in de jaren 80 in de hype fase van kernenergie toen richting kernfusie ook al, en 'eventjes' die 'laatste' 'probleempjes' eruit werken gaat nu pas een beetje 'opschieten', dat we in 2030 kleine productiereactors krijgen met netto energiewinst en in 2040-2045 dan de lang gedroomde grote productie kernfusie reactoren. Zou me met AI niets verbazen, dat om iets werkelijk intelligents te krijgen je eerder aan 2045 moet denken dan aan 2025. En dan is het opeens wel heel erg lang wachten, als je voor jezelf dat toch blijft hopen elke keer weer voor het dan volgend jaar.

[Reactie gewijzigd door OruBLMsFrl op 22 juli 2024 13:55]

[...] Waarom verwachten wij een goddelijke waardigheid van AI?? Van een mens hebben we dezelfde verwachtingen niet. En ChatGPT is gewoon een mens-simulator met een heleboel geblaat van een heleboel mensen op een hoop gegooid. Natuurlijk komt daar wel eens onzin uit.
Ongetwijfeld heb je het over waarheid, niet over waardigheid.

Net als bij een mens komt daar wel eens onzin uit, sterker nog, veel te vaak komt uit mensen onzin uit IMO. Omdat mensen zoals politici zelden concreet, duidelijk, transparant en congruent (doen wat ze zeggen + zeggen wat ze doen) én (cumulatief) omdat politici nou eenmaal méér aanzien hebben dan een willekeurige bankwerker, politieagent of verkoopmedewerker, worden dezelfde politici ook heel graag nageaapt.

Tweede punt van aandacht is dat er nogal wat mensen rondlopen die denken van heel veel vakgebieden verstand te hebben, terwijl hun kennis alweer achterhaald kan zijn of door andere tendensen in de maatschappij een aanzienlijk minder grote rol spelen.

En als derde punt is het bijzonder lastig om een boodschap zodanig over te brengen dat een boodschap ook daadwerkelijk wordt begrepen door de ontvanger. Dat laatste punt is waarschijnlijk waar AI tegen aan loopt. Als ik dezelfde boodschap uit in drie verschillende vormen en met andere woorden (er zijn zoveel synoniemen in de NL taal en barstensvol gezegden), dan loop je zeker weten kans dat er iemand tussen zit, die de boodschap niet goed heeft begrepen. En dat AI daarin de "schuldige" is, dat kan niet. Voor communicatie heb je een ontvanger en een zender nodig. Bij beide kan storing ontstaan. Bij AI zou die storing kunnen bestaan uit onhandig geformuleerde input. Een andere storing zou kunnen bestaan uit bugs, AI is tenslotte opgetuigd door mensen...
Chatgpt is gewoon politiek correct. Je kan niet eens sexuele vragen stellen. Zo preuts als ik weet niet wat.
Gelukkig bestaan er al lokale niet gecensureerde. Niet zo goed als chatgpt, maar komt in de buurt. En dat is maar goed ook. Openai is helemaal niet open. Maar een gesloten bedrijf.
En wat zou een chatbot nou moeten weten van sex??? Nou niet echt bepaald een ervaringsdeskundige... 8-)
Ik gebruik ChatGPT ook beroepsmatig en moet wel eens woorden gebruiken die over seks gaat. ChatGPT vlagt al vrij snel je vraag. Ik zou graag willen dat je extra mogelijkheden zou krijgen als je kunt aantonen dat je een bepaald beroep hebt.
Wat voor soort werk doe je en wat is de rol van ChatGPT daarin?
Voor al die mensen die klagen een checklist :
Gebruik je de gratis of betaalde versie?
Gebruik je de website of de api?
Hoe formuleer je je prompt?

Beste resultaten krijg je via de betaalde api met de juiste prompt.

De webversie is behoorlijk gefilterd.

[Reactie gewijzigd door flurb op 22 juli 2024 13:55]

OpenAI's ChatGPT is helaas meer een politiek correct wezen geworden. Je kan amper nog vragen stellen of laten uitzoeken, zonder een heel lap tekst terug te krijgen (waar je vervolgens ook voor betaald). Dat vind ik erg jammer, want ik vraag een robot niet om zijn of haar (politiek correcte) mening.
ChatGPT heeft echt een bizarre systemprompt waardoor die dit gedrag vertoont. Vanuit de API heb je deze gebreken gelukkig niet en krijg je toegang tot het volwaardige GPT-4-Turbo model. Er zijn meer dan genoeg tools waar je d.m.v. een ChatGPT achtige interface toegang krijgt tot de kale modellen.

Ikzelf ben ook verantwoordelijk voor een SaaS tool waar je o.a. toegang krijgt tot digitale assistenten gebaseerd op GPT-4-Turbo. De resultaten zijn veel beter dan ChatGPT. We hebben tevens een volwaardige Google koppeling en webintegratie ingebouwd waardoor die volledig toegang heeft tot het web en zichzelf kan verrijken met informatie en bronnen.
Ik weet dat zelf reclame maken niet mag, maar ik ben wel benieuwd naar deze tool :p
Ik ga geen link plaatsen. Dat mag niet denk ik haha

Maar als je Googled naar “Brainvine” kom je er wel uit denk ik.

Het is officieel een tool voor marketeers, maar wordt veel gebruikt door mensen uit allerlei sectoren die het echt als ChatGPT vervanger gebruiken. Van developers tot politici. Zelfs kamerleden hebben hun weg inmiddels gevonden naar het platform.
Kun je een voorbeeld geven van een prompt waarbij je dit soort antwoorden krijgt? Ik lees hier reacties van meerdere mensen die dit benoemen, maar ook van mensen die zich er helemaal niet in herkennen. Het ontbreekt echter aan voorbeelden, waardoor het bij anekdote blijft.
Ja precies dit dus.

Als je een gewone vraag stelt over niks politieks maar bijvoorbeeld een sociale interactie of iets ook maar een beetje seksueel getint (denk bijv. LGBT topics) dan weigert hij het gewoon vaak of is er zoveel omhaal dat je er niks meer aan hebt. Amerikanen zijn zo gevoelig en conservatief geworden.

Hopelijk komen er uit Europese hoek wat meer open modellen.
maar bijvoorbeeld een sociale interactie
Dan vraag je naar een mening van een stuk software, wat verwacht je daar dan van?
of iets ook maar een beetje seksueel getint (denk bijv. LGBT topics)
Als er iets is waar de samenleving (!) moeite mee heeft, dan is het wel sex en LGBT. En dan verwacht jij dat stuk software wel even met een goed verhaal komt waar iedereen zich in kan vinden? Wij mensen slaan elkaar al de hersens in over dit soort onderwerpen!
dan weigert hij het gewoon vaak of is er zoveel omhaal dat je er niks meer aan hebt.
Wees blij! Je stelt een vraag waarvan iedereen weet dat deze onmogelijk voor iedereen goed is te beantwoorden. Dan is het misschien wel zo verstandig om geen antwoord te geven. Zwijgen is goud...
Amerikanen zijn zo gevoelig en conservatief geworden.
Het zijn net mensen en hun paspoort zegt niks. Ga eens een praten met de andere nationaliteiten in Europa. En stel hen eens de vragen waar jij moeite mee hebt met ChatGPT.
Hopelijk komen er uit Europese hoek wat meer open modellen.
Don't hold your breath! Zoveel komt er niet uit Europa, de kans is dus niet zo groot. En mocht er wat komen, heeft die software dezelfde problemen met z'n gebruikers als dat ChatGPT heeft.
Commerciele LLMs zullen altijd gecensureerd zijn, d'r is geen bedrijf ter wereld wat zich wil branden aan ongecensureerde content. Als je zoiets wil kan je zelf aan de slag met LMStudio, Ollama of andere opensource tools, en zoek je op Huggingface een ongecensureerd model.
Heel erg interessant, maar ik verwacht wel dat oa Youtube overspoelt zal worden met films.
... Want nu is YouTube zonder slechte content?
Ik denk dat met Sora het gemiddelde niveau waarschijnlijk omhoog gaat, en zoals altijd zie je gebruiker eigenlijk alleen de top 0.001% aan goede videos.
Het einde van de professionele motiongrapher/3Dartist/videographer.
In begin is het nog een tool binnen 5j is het nutteloos om nog 2 weken te spenderen aan een 3D animatie als een prompt het op 2 minuten kan.
Dat vraag ik me af. Het werk zal wat veranderen, maar deze tool geeft je bijvoorbeeld geen 3d modellen die je kunt hergebruiken of kan aanpassen. Een net ander prompt kan een wezenlijk ander resultaat geven. Bovendien kan deze tool niet op locatie gaan filmen, dus videografen zullen nog steeds nodig zijn om allerlei evenementen vast te leggen ;).
Dat lijkt me nog een erg ver weg want dan zou je een manier moeten hebben om voor elke scène exact dezelfde stijl en dezelfde stijl figuren/personen en locaties te genereren.
Dat doet Sora hé. Die vrouw in Tokyo, daar zit ook een close up in en dat is 'dezelfde' persoon.

Op dit item kan niet meer gereageerd worden.