OpenAI maakt spraakfunctie ChatGPT beschikbaar voor alle gebruikers

OpenAI maakt de spraakfunctie voor ChatGPT voor iedereen beschikbaar. Tot dusver was de Voice-functie alleen beschikbaar voor afnemers van een Plus- of Enterprise-abonnement. De spraakfunctie is via de appversie van ChatGPT beschikbaar.

Gebruikers kunnen via de ChatGPT-app op iOS en Android op het koptelefoonicoontje tikken, waarna ze met een spraakopdracht dingen aan de chatbot van OpenAI kunnen vragen. Met een text-to-speechmodel kan ChatGPT de gegenereerde informatie ook weer in audiovorm teruggeven.

Een persoon vraagt in het promotiefilmpje: "Het was een lange nacht voor het team en we hebben honger. Hoeveel 16"-pizza's moeten we bestellen voor 778 mensen?" Daaropvolgend maakt ChatGPT een berekening. Mogelijk refereert het bedrijf hiermee aan zichzelf, aangezien OpenAI ongeveer zoveel werknemers heeft en er momenteel veel ophef rondom beslissingen van het bestuur heerst.

Specifiek is er veel onenigheid over het plotselinge ontslaan van medeoprichter en ceo Sam Altman en zijn overstap naar Microsoft. Een andere medeoprichter, Greg Brockman, stapte in reactie hierop op. Intussen zijn beide topmannen weer terug bij het bedrijf.

Door Yannick Spinner

Redacteur

22-11-2023 • 13:40

45

Reacties (45)

45
45
22
0
0
18
Wijzig sortering
wat ik niet begrijp en automatisch vervelend vind is dat de App dus meer functionaliteit heeft dan de webversie. Is er een manier om deze functionaliteit ook op een desktop te verkrijgen?
Wist je dat een app veel meer tracking mogelijkheden heeft dan een browser? Daarbij kan men in een browser gebruik maken van anti tracking extensies. Een app is dus vele malen aantrekkelijker voor de developer dan de info die uit een browsersessie verkregen kan worden. Vandaar de push om je naar een app te lokken.
Weet je wat het mooie van een proxy is.
Je kan al die ET-Phone-home shit eruit filteren en alleen datgene doorlaten wat jij wilt dat doorgelaten wordt.
Er zijn open-source "producten" die dit soort dingen voor je kunnen doen.
Alleen, met je telefoon, wordt een beetje hannessen.

[Reactie gewijzigd door Alfa1970 op 22 juli 2024 19:28]

Android service voor Windows.. maar dan heb je de app nog niet.
Op een computer wil je toch een toetsenbord gebruiken?
Of mis ik iets
Dat is gebruiker afhankelijk, lijkt mij een legitieme vraag.

Ik ben zelf ook niet zo van de ‘mobile first’ maar als ik zie hoeveel gebruikers bij ons de app gebruiken ipv desktop dan vraag ik mij ook af wat de mensen precies doen, maar ja… wie ben ik…
Meestal wanneer een gebruiker op een computer geen toestenbord gebruikt heeft die al 1 of andere vorm van tekstherkenning.
Hij heeft het over "meer functionaliteit", niet perse alleen de spraakfunctie lijkt mij.
Och dat weet ik niet. Ik kan prima typen en spreken tegelijk op zich best aardig als je dit door elkaar zou kunnen gebruiken. Bijvoorbeeld om alvast een opdracht te geven voor het schrijven van scripts, of om vragen te stellen terwijl je werkt.
Je zou Windows Voice Typing in kunnen schakelen

https://support.microsoft...bd-329d-e59a-af033fa5689f

[Reactie gewijzigd door Vullisbak op 22 juli 2024 19:28]

Zou geweldig zijn als dit ook al een speech-to-text functie en vice versa heeft (dat je een gesproken bestand kan uploaden en dat dit wordt uitgetypt/uitgesproken)
The ability to talk to ChatGPT draws on two separate models. Whisper, OpenAI's existing speech-to-text model, converts what you say into text, which is then fed to the chatbot. And a new text-to-speech model converts ChatGPT's responses into spoken words.
Dank, hopelijk ook mogelijk om vanuit het Nederlands/buitenlands in het Nederlands/buitenlands.
Je kunt voor zover ik weet elke (of naja, de meeste) taal praten en ChatGPT zal in diezelfde taal terug praten. Nederlands is geen probleem, al is de dataset van de Nederlandse taal uiteraard veel kleiner dan bijv de Engelse, waardoor soms grammaticale imperfecties voor komen.

Heb zelf wel eens dat mijn kids er doorheen zitten te tetteren en dan begint ChatGPT opeens in een vreemde taal terug te praten omdat de detectie in de war is.
In Microsoft Word kan je een audiobestand uploaden en dan schrijft hij het uit. Ik gebruik het wel eens om een vergadering deels uit te typen. Misschien dat dat je kan helpen?
Dat heeft weer privacyconsequenties.
ChatGPT toch ook zeker?
FUTO is een offline speech-to-text op basis van Whisper.
Ik lees vaak comments in de hoop dit soort reacties te lezen. Dank!
Uh, gewoon voor iedereen een pizza? En wat er overblijft mag mee naar huis.
16" pizzas zijn enorm, dat zijn de Family XXL pizzas bij dominos (40cm). Dat krijg je in je eentje echt niet zomaar op. Een normale pizza bij dominos (medium) is 10". Een 16" is zo'n 2.6 keer de oppervlakte. (10"/25cm = 491cm², 16"/40cm = 1257 cm²)

[Reactie gewijzigd door MoonRaven op 22 juli 2024 19:28]

Een Amerikaan wel hoor :+
Maar eten Amerikanen over het algemeen niet een paar slices met patat er naast? Dan heb je dus juist minder nodig :+ .
Ik ben in mijn eentje een family :'( :'( :'(
Dat zegt echter nog niets over je pizza. :+
Meer dan 1 kg aan pizza?
Classieke "oh look a squirrel!" afleiding na alle commotie rondom OpenAI.
Je bedoelt dat er gewoon doorontwikkeld wordt.
nee hij bedoelt dat ze dit er nu precies uitgooien om zsm iedereen te laten vergeten wat er gebeurd is :).

nieuws: Sam Altman keert terug bij OpenAI als ceo

Vele malen makkelijker als alle tweakers praten over de net nieuwe functie die toevallig 1 dag nadat het drama opgelost is uitkomt :).
Tegenwoordig is iedere gebeurtenis een onderliggende agenda….

Software functionaliteit wordt gewoon geplanned gereleased
Dat klopt volledig , echter een beetje goede strateeg pakt dit uit de koker want dan kunnen ze laten zien. Ze hadden het ook volgende week kunnen releasen en nee het is echt geen toeval dat het nu uitgebracht word.

Op deze manier kun je de perceptie neerzetten dat OpenAI zo goed als geen negatieve gevolgen ondervonden heeft aan dit drama , het aantal gebruikers is toegenomen als bewijs en het wordt al snel vergeten wat er is gebeurd en het wordt een sidenote.
Software functionaliteit wordt gewoon geplanned gereleased
Hebben ze dan ook een specifieke roadmap beschikbaar waar dit onderdeel van is en stond het in de planning om bijv deze maand uit te brengen?
Geen idee of er een publieke roadmap is.
Ik wil toch wel zeggen dat ik behoorlijk onder de indruk ben van het model middels spraak. de context en het engelse dialect als er in het nederlands wordt gesproken.
Ik probeer nog steeds de blauwe headphones knop te vinden :P
Vraag gewoon aan chatgpt waar het blauwe headphones knopje zich bevind :+
Net even getest: Converting to text....
Conclusie: werkt nog niet
ah...jammer, zal mij een hoop tijd schelen
Wordt je stem lokaal omgezet naar tekst zoals FUTO doet door OpenWhisper offline te gebruiken, of wordt een opname van je stem naar de servers van OpenAI gestuurd?

[Reactie gewijzigd door Sando op 22 juli 2024 19:28]

Ik hoorde gisteren op Rogan dat de nieuwste Android op je mobiel de functionaliteit en capaciteit heeft om met pakweg een Japanner te bellen die in zijn eigen taal met jou spreekt en realtime de correctie translatie in jouw taal bij jou aan de telefoon te horen is. Nagenoeg zonder delay.

Is het al zover, of BS?
Geen idee, maar realtime lijkt me niet of anders niet praktisch. Ik kan me namelijk voorstellen dat er talen zijn, waarbij bijvoorbeeld een ontkenning pas aan het einde van de zin komt (of een bijvoeglijk naamwoord na het zelfstandig naamwoord). Dat kan je niet goed realtime vertalen, omdat je dan correcties moet toepassen of het eerdere vertaalde deel. Je zult toch moeten wachten op de gehele zin of context uitgesproken is.
Wel leuk, Chat kan dus ook Nederlands praten met een Amerikaans accentje.
Begint nu toch wel tijd te worden dat die Google home assistent ook dergelijke dingen kan... Ze hebben toch ook al de nodige technologie

Op dit item kan niet meer gereageerd worden.