OpenAI kondigt twee nieuwe functies voor ChatGPT aan: de mogelijkheid om afbeeldingen te verwerken en de mogelijkheid om stemmen te herkennen en terug te 'praten'. De functionaliteit wordt over een periode van twee weken uitgerold voor Plus- en Enterprise-abonnees.
Met de nieuwe spraakfunctie kunnen gebruikers tegen ChatGPT praten, waarna het taalmodel van OpenAI dankzij een text-to-speechmodel terugpraat. In principe zijn alle toepassingen van de chatbot ook mogelijk via de spraakfunctie; gebruikers kunnen verhalen, uitleg, recepten, tips en concrete informatie opvragen, en dat nu in audiovorm ontvangen. De audiofunctie is opt-in en komt vooralsnog alleen beschikbaar voor de iOS- en Android-versie van de chatbot. Daarvoor is dus wel een Plus- of Enterprise-abonnement nodig.
Het bedrijf raadt gebruikers aan om in het Engels tegen ChatGPT te spreken. Sommige andere talen zouden ook door het taalmodel verwerkt kunnen worden, maar de resultaten zouden vooralsnog het best in het Engels zijn. OpenAI heeft de vijf beschikbare stemmen op echte stemacteurs gebaseerd, maar kan in principe op basis van enkele zinnen iedere stem nabootsen. Eerder vandaag kondigde Spotify aan dat de muziekdienst van dezelfde technologie gebruikmaakt om podcasts te vertalen.
Verder kondigt het bedrijf een fotofunctie aan waarmee gebruikers afbeeldingen, documenten en foto's kunnen uploaden, waarna ChatGPT op basis van deze visuele informatie dynamisch kan reageren. Enkele voorbeelden zijn het vragen van technische hulp bij het verstellen van een fiets, het opvragen van recepten op basis van de inhoud van de koelkast of het analyseren van een grafiek. Deze functionaliteit komt in de komende twee weken beschikbaar voor alle platforms, alweer mits er een Plus- of Enterprise-abonnement wordt afgenomen.
OpenAI stelt dat beide functies ook risico's met zich meebrengen. Zo kunnen kwaadwillenden de spraakfunctie in theorie gebruiken om echte personen te imiteren. Daarom beperkt het bedrijf de technologie tot het gebruik binnen de voicechatfunctie van ChatGPT. Verder zegt de ontwikkelaar dat de afbeeldingsfunctie 'significant is begrensd' wat het reageren op echte mensen betreft.