ByteDance, het Chinese moederbedrijf van TikTok, zou de api van OpenAI hebben gebruikt om zijn eigen large language model te ontwikkelen. Dat is verboden volgens de gebruiksvoorwaarden van laatstgenoemde. OpenAI heeft het account van ByteDance voorlopig opgeschort.
ByteDance heeft voor de ontwikkeling van zijn eigen large language model in het geheim technologie van OpenAI gebruikt, en probeerde dat vervolgens te verdoezelen. Dat schrijft The Verge op basis van interne documenten. Voor vrijwel elke fase van de ontwikkeling van het concurrerende AI-model, dat intern bekendstaat als Project Seed, zou de api van OpenAI gebruikt zijn, waaronder voor de training en evaluatie van het model. Volgens The Verge is het misbruik zo ongebreideld dat werknemers regelmatig de limiet van hun toegestane hoeveelheid api-toegang bereiken.
Het TikTok-moederbedrijf heeft zijn werknemers naar verluidt gevraagd om het bewijs ervan 'wit te wassen' door middel van 'datadesensibilisatie'. In de gebruiksvoorwaarden van de api staat namelijk dat deze niet gebruikt mag worden 'om AI-modellen te ontwikkelen die concurreren met onze producten en diensten'. Toen het bedrijf enkele maanden geleden toestemming kreeg van de Chinese overheid om zijn eerste chatbot uit te brengen die wordt aangedreven door het Project Seed-model, vroeg ByteDance zijn werknemers om geen GPT-gegenereerde tekst meer te gebruiken voor de ontwikkeling, aldus The Verge. Desondanks zou de api ook daarna nog gebruikt zijn om de prestaties van zijn eigen chatbot te beoordelen.
OpenAI-woordvoerder Niko Felix laat aan The Verge weten dat het AI-bedrijf het account van ByteDance voorlopig heeft opgeschort: "Alle api-klanten moeten zich houden aan ons gebruiksbeleid om ervoor te zorgen dat onze technologie niet wordt misbruikt. Hoewel ByteDance minimaal gebruikmaakte van onze api, hebben we diens account opgeschort terwijl we verder onderzoek doen. Als we erachter komen dat het bedrijf dit beleid niet volgt, zullen we het vragen om de benodigde aanpassingen te maken of diens account beëindigen."
ByteDance ontkent in een verklaring dat het de licentieovereenkomst met OpenAI heeft geschonden. Het bedrijf heeft naar eigen zeggen aan het begin van de ontwikkeling door GPT gegenereerde data gebruikt, maar er wordt volgens het bedrijf inmiddels geen OpenAI-data gebruikt voor zijn model. "In markten buiten China gebruiken we GPT om producten en functies aan te drijven, maar voor chatbot Doubao, die enkel beschikbaar is in China, gebruiken we ons zelfontwikkelde model."