OpenAI werkt aan betaalde zakelijke versie van ChatGPT

OpenAI werkt aan een zakelijke, betaalde versie van zijn chatbot ChatGPT. Dat blijkt uit een wachtlijst die het bedrijf open heeft gesteld. Het is een manier voor OpenAI om geld te verdienen met zijn chatbot.

OpenAI heeft een formulier online gezet, waaruit blijkt dat de naam ChatGPT Professional lijkt te worden. OpenAI wil de betaalde versie onderscheiden met een gegarandeerde beschikbaarheid, altijd snelle antwoorden van de chatbot zonder te throttlen en een verdubbeling van de dagelijkse limiet ten opzichte van reguliere gebruikers.

OpenAI benadrukt dat de betaalde, zakelijke versie vooralsnog niet algemeen beschikbaar zal zijn. Het gaat om een pilot en de voorwaarden kunnen nog veranderen. ChatGPT Professional zou een manier zijn om geld te verdienen met de chatbot, die sinds enige tijd gratis te gebruiken is. OpenAI bracht in november een publieke versie uit van AI-gesprekstool ChatGPT.

Daarnaast krijgt OpenAI investeringen om de ontwikkeling van zijn technologie te financieren. Zo wil Microsoft naar verluidt tien miljard dollar investeren om 49 procent van OpenAI in handen te krijgen. Een paar jaar geleden investeerde Microsoft al een miljard dollar.

ChatGPT

Door Arnoud Wokke

Redacteur Tweakers

12-01-2023 • 17:15

113

Submitter: TheVivaldi

Lees meer

Reacties (113)

113
112
44
5
0
62
Wijzig sortering
Hoe wordt er in de professionele variant rekening gehouden met data die proprietary is of waar, op zijn minst, een copyright op berust? Voor een opensource product lijkt me dat minder relevant (iedereen kan er immers van profiteren), maar een betaalde variant?

Of zit er alleen publieke data in ChatGPT die zonder licenties en/of copyright te gebruiken zijn?
De vraag is wie de uitkomsten van de ChatGPT bezit. Je praat over copyright, maar het is eigenlijk de vraag hoe de oude wereld (= oude legal concepten) wel of niet passen bij deze nieuwe wereld (= AI gebaseerde tools).

Bezit hoorde driehonderd jaar geleden puur bij natuurlijke personen. Inmiddels ook bij rechtspersonen. Het is de vraag hoe het recht zich aanpast aan deze nieuwe ontwikkelingen.
Het is geen nieuwe wereld en het concept is nogsteeds toepasbaar. Iemand die iets origineels maakt is de eigenaar. Tot nu toe zijn de AI modellen nog niet in staat geweest iets daadwerkelijks origineel te produceren. Het remixed, of het nou text concent is met ChatGPT of beelden door middel van Midjourney. Het heeft indirect menselijke input nodig. Bezit is digitaal ook toepasbaar.
Hmm, volgens mij is dat exact wat de meeste artiesten doen. Niemand leeft in een vacuum, iedereen staat "on the shoulders of giants" en "immitation is the highest form of flattery".

Denk maar eens aan iedereen die het akkoordenschema van Canon in D als inspiratie gebruikt.

Daarnaast is "daadwerkelijk origineel" niet een heel sterk criterium. Je kan dingen alleen begrijpen in context van en in contrast met dingen die al bestaan. Elke keer dat een (virtueel) pak kaarten wordt geschut komt er een unieke volgorde uit. Een plaatje met random gekozen pixels is ook uniek. Beide zijn wel "origineel" (nieuw), maar niet perse mooi, waardevol of met betekenis.

Ik denk dat het lastig is om een definitie te maken van betekenisvolle of "daadwerkelijk originele" kunst, die per definitie niet door een computer gemaakt kan worden, zonder iets te zeggen als "gemaakt door een mens". En dan wordt het een cirkelredenering dat een computer niets origineels kan maken omdat een computer het maakt.

[Reactie gewijzigd door Eomer op 22 juli 2024 16:46]

Hmm, volgens mij is dat exact wat de meeste artiesten doen. Niemand leeft in een vacuum, iedereen staat "on the shoulders of giants" en "immitation is the highest form of flattery".
Er zit heir veel nuance in, ik kan iets na tekenen maar je ziet nogsteeds dat ik diegene ben die dat gedaan heb. Het niveau van mijn verfijndheid met een potlood, mijn druk op het papier etc. Of als ik gitaar speel, horen mensen dat ik het ben. Dat is wat anders dan een image 1 op 1 overnemen en dan door een filter gooien om het te mergen met wat andere overgenomen images.
Denk maar eens aan iedereen die het akkoordenschema van Canon in D als inspiratie gebruikt.
Gelukkig is er een hele muziekmarkt eromheen die echt een eigen ding brengen. Ik zou dat niet als de maatstaaf zien.
Ik denk dat het lastig is om een definitie te maken van betekenisvolle of "daadwerkelijk originele" kunst, die per definitie niet door een computer gemaakt kan worden, zonder iets te zeggen als "gemaakt door een mens". En dan wordt het een cirkelredenering dat een computer niets origineels kan maken omdat een computer het maakt.
Voor mij is het probleem niet het medium dat het maakt, als een computer iets moois uit zichzelf kan maken si het mooi. Maar wat er nu gebeurt. In het geval van midjourney wanneer je bijvoorbeeld vraagt "a modern car brand website UI". Komt er een mix uitrollen van dribbble auto website UI's met een midjourney kleuren filter eroverheen. Dat is dus andermans werk presenteren als het een Midjourney eigen zonder credits en zonder context.
Het is geen nieuwe wereld en het concept is nogsteeds toepasbaar. Iemand die iets origineels maakt is de eigenaar. Tot nu toe zijn de AI modellen nog niet in staat geweest iets daadwerkelijks origineel te produceren. Het remixed, of het nou text concent is met ChatGPT of beelden door middel van Midjourney. Het heeft indirect menselijke input nodig. Bezit is digitaal ook toepasbaar.
Ik ben niet akkoord dat het remixed.
Het leerd effectief zoals een mens zou doen, zo kan je bijvoorbeeld vragen om de teksten te lezen van een bepaalde auteur , nadien een analyse geven van een ander boek genaamd "12 manieren om je bedrijf te verbeteren" en dan kan je de ai vragen in context van de eerste auteur om een 13de punt te bedenken voor het boek van de 2de auteur , en dat zou lukken met chatgpt.
Hij leert namelijk de stijl van de auteur naast de inhoud.EN daarnaast leer hij ook de context van de inhoud tegenover de inhoud dat hij bij andere items al geleerd had, Dat is hoe menselijke studenten ook leren.

Zo zal je merken dat jonge studenten vaak antwoorden op ongeveer dezelfde manier als de leraars die hij gehad heeft.Elke leraar heeft een bepaald inzicht in taal en formuleringen gegeven naast de inhoud zelf. EN die combinatie zorgde er voor dat de student zijn eigen gecombineerde en unieke stijl ontwikkeld. Dat is ook zo bij chatgpt.

Dus nee het is echt geen remix, en de output heeft ook niets meer te maken met de input als de leermateriaal divers genoeg is geweesd.
Momenteel was het maar getraind op 40gb data, wat dus echt niets voorsteld.Bovendien reageerde het op vragen op basis van redelijk weinig parameters (iets wat fel zal verhogen met chatgpt 4)
AI leert totaal niet zoals mensen leren. Het optimaliseert een algoritme waarmee een antwoord wordt geformuleerd. Van de vraag die jij stelt aan ChatGPT leert hij niet. Een mens leert wel van een vraag, omdat die niet puur bezig is met het antwoord maar ook in rust nog zaken "verwerkt". AI leert alleen maar door een trainingsset gevoed te krijgen met de opdracht om ergens voor te optimaliseren. AI onthoud de trainingsset ook niet, alleen het algoritme. Een mens pakt er een van gogh bij om in die stijl iets te maken, AI niet, die heeft een van gogh algoritme, geen voorbeeld dat nagedaan wordt.
Niets zegt dat AI zichzelf niet mag trainen. Dat lijkt mij een logische evolutie.
AI heeft geen bewustzijn. Het verwerkt een vraag en levert een uitkomst. Het gaat niet spontaan iets doen. Dat is science fiction.
Ten eerste is er niets gezegd over bewustzijn
Ten tweede is de term bewustzijn iets dat moet vastgelegd worden.
Is een kat zelfbewust? Wat maakt iets zelfbewust?

Het is ook niet omdat we onze mening van bewustzijn bepalen, dat dit de enige bewustzijn is die bestaat, misschien moeten we onze bepaling/definitie op een bepaald moment veranderen.
Ook al denken we dat dit betekend dat iets zichzelf herkend, zichzelf in leve probeerd te houden of zichzelf probeerd voort te planten. Die laatste twee voorbeelden zouden dan al willen zeggen dat sommige mensen niet zelf bewust zijn omdat ze zelfmoord willen plegen of omdat ze geen kinderen kunnen hebben of willen hebben.

Los van zelf bewust zijn betekend dat niet dat iets niet kan leren van zichzelf.

Een baby kon ook niet leren van zichzelf, het hangt af van ouderen om kennis overdracht te krijgen
Dat is een beetje het marketing praatje erachter om eerlijk te zijn, je ziet zodra het over beeld gaat, dat er letterlijk hele beelden van bekende sources als Behance getrokken wordt en door een shader based filter gehaald wordt om het aan andere images te koppelen. Het enige wat het model doet is het zichzelf voornamelijk trainen om objecten te herkennen en de context waar deze in geplaatst worden.
Oef, dan zijn artiesten al heel lang niks anders dan remixes aan het maken. Nieuwe akkoorden worden er namelijk niet echt meer bedacht. Muziek is al uitgewerkt naar theorie en het enige nieuwe is - soms dan en steeds minder - de arrangementen. Met andere woorden: een remix. Zullen we nu door gaan naar kleuren op een canvas of 'do you get the picture'?
Zo is het volgens mij met alles. Ik zou geen enkele uitvinding kunnen noemen die niet voortborduurde op iets wat er al was. Het wiel was gewoon een ronde schijf, mensen gingen door met het graven van 10 meter diepe water kanalen voor transport totdat er degelijke (kogel) lagers waren.
Ben ik het totaal niet mee eens als muziek liefhebber. Al het muziek heeft iets van een heritage in zich zitten van wat ervoor kwam.

Maar als je dit van eind jaren 80 begin jaren 90 pakt waar muziek theorie ook al uitgewerkt was
https://www.youtube.com/watch?v=DtJzRErAJ3Q

Is het totaal niet te vergelijken met wat artiesten vandaag schrijven en produceren. Er is altijd ruimte voor iets nieuws.
https://www.youtube.com/watch?v=pFKSiOkRzb4

Er is een hele muziek wereld om het fastfood mainstream heen waar constant de grenzen opgezocht worden.
Jij als mens bent ook niet in staat iets origineels te produceren, het enige waar je brein toe in staat is is om dingen die hij al weet en kent toe te passen. Het is fundamenteel onmogelijk om iets nieuws te verzinnen uit gebakken lucht.
Alleen is dat dus niet onmogelijk een dat toont de mensheid keer op keer.
Uiteindelijk is AI ook gewoon data, en moet alle data die een AI-tool heeft ergens naar te traceren zijn. Die originele bron is de eigenaar.
AI van de eerste generatie is misschien gewoon data. Maar latere generaties zeker niet. Daarin worden ook nieuwe patronen en data 'gegenereerd'. En van wie is dat dan?
Dat doen academici en studenten ook, in die wereld is een bronvermelding altijd verplicht, anders is het plagiaat.

ChatGPT is ontzettend slecht als het gaat om het geven van bronvermeldingen.
Ironisch dat het een van de weinige informatieverstrekkers is die zijn bron daadwerkelijk in zijn naam heeft verwerkt. (https://en.wikipedia.org/wiki/GPT-3) ;)

Maar ik snap wat je bedoelt, maar ik denk dat het technisch ook vrij onhaalbaar is met het huidige model om een inverse lookup te doen van de trainingsdata om te achterhalen waar het een feit op baseert, mits het de AI is geleerd om te kunnen doen. Bijv. bij citaten kan ik het me voorstellen, maar dan zou je daar expliciet om moeten vragen.

Van de andere kant, als je als mens/onderzoeker iets leert in een opleiding en iemand vraagt je na 10 jaar studeren om een feit/conclusie van iets, dan kun je het óf niet meer weten waar (op welke bron(nen) je die kennis exact op baseert, óf je kunt 500 boeken die je tijdens je studie hebt gebruikt vermelden als bron, óf het gaat specifiek om 1 of een paar bronnen welke je wel zou kunnen benoemen. En dat laatste zou in principe gewoon opvraagbaar moeten zijn als je de AI vraagt waar hij dat vandaan haalt. Maar zodra het van die miljarden bronnen ook maar 1 bron meer gebruikt in zijn antwoord, dan is dat al niet meer te doen.
Het is technisch niet onhaalbaar, er zijn echt wel manieren om dat op een redelijke manier toe te passen. De èchte reden heeft te maken met vermijden van aansprakelijkheid. De AI-bedrijven maken doelbewust gebruik van andermans materiaal. In het geval dat dit ooit als auteursrechtenschending beschouwd wordt, zou dat betekenen dat ze zich schuldig maken aan plagiaat / diefstal van intellectueel eigendom op een gigantische schaal, met als gevolg faillisement door het veelvoud aan rechtzaken die hieruit kunnen voortvloeien. Dus de algoritmes (met inbegrip van scrapers, processors en andere elementen in het gehele proces) zijn zodanig ontworpen dat er geen directe correlatie te bewijzen is tussen een resultaat en de input waardoor dit resultaat mogelijk gemaakt is.

[Reactie gewijzigd door Lapjespoes op 22 juli 2024 16:46]

Het is technisch gezien zeker niet moeilijk om de semantische bron(nen) van iets dat GPT uitspuugt te vinden. Het is een geoptimaliseerde Google, dus het moet nog steeds duizenden pagina's doorzoeken alvorens een antwoord te kunnen maken.

Het is uiteindelijk gewoon een filter, dus als je een tag zet op de bronnen en die tags gaan onaangepast door de filter, kun je een lijst van bronnen maken met een percentage van de bron die in het antwoord zit.

Het probleem met GPT is ook dat veel zaken heel duidelijk achteraf aangepast zijn door mensen met hun eigen bias ipv statistisch rechtstreeks van de bronnen te gebruiken. Daarnaast kan GPT wel degelijk bronnen citeren, alhoewel het regelmatig die bronnen zelf verzint.

[Reactie gewijzigd door Guru Evi op 22 juli 2024 16:46]

Jaja, en die labels worden dan door het neurale netwerk heen gehaald? Ik zie het even niet. Ik heb liever ook bronvermelding, maar bovenstaande voelt me aan als te makkelijk.
Het is geen geoptimaliseerde Google en het is geen filter. Ik denk dat het nuttig is je in te lezen over neuronale netwerken alvorens sterke meningen te hebben.
Doet mij denken aan veel moderne onderzoeken. Veel moderne onderzoeken zijn gebaseerd op eerdere onderzoeken. Het doet mij een beetje denken aan Diederik Stapel die veel onderzoeken uit zijn duim had gezogen, maar zijn publicaties worden nog altijd gebruikt voor nieuwe onderzoeken.
Ook de nieuwe patronen en data kan je uiteindelijk herleiden naar een menselijk bron. Zolang deze bron gebruikt wordt lijkt het me dat dat de eigenaar is, hoe ver je de data ook terug moet herleiden.

[Reactie gewijzigd door MrFax op 22 juli 2024 16:46]

Vanuit een idealistisch oogpunt heb je volledig gelijk. Het probleem is echter dat deze bedrijven geen register bijhouden waarin een duidelijke lijn tussen het product en de oorspronkelijke input te vinden is. Uiteraard doelbewust zo opgezet om potentiële rechtzaken om intellectueel eigendom te vermijden, het is immers zeer moeilijk om te bewijzen dat precies jouw werk gebruikt is en niet dat van een ander.
Het is toch een (menselijke) bedrijfsbeslissing dat die lijn niet getrokken wordt.

Je kunt dan evengoed zeggen dat bij vb Napster of Kazaa doelbewust geen duidelijke lijn getrokken werd tussen publiek en copyrighted materiaal, en daarom zijn ze niet aansprakelijk als iemand een muziekbestandje downloadt?

[Reactie gewijzigd door Guru Evi op 22 juli 2024 16:46]

Maar die connectie is met piracy juist heel eenvoudig te trekken. Je downloadt een muziekbestand wat extreem eenvoudig te herleiden is naar de oorspronkelijke titel en artiest. In bijna 100% van de gevallen gebruik je die informatie zelfs om überhaupt bij het bestand terecht te komen.

Met AI-generated meuk is dat niet zo eenvoudig. Stel je hebt een dataset van 10 afbeeldingen met daarin een personage dat een t-shirt draagt. Model is getrained op deze data, kan op commando een personage met een t-shirt renderen. De vraag: welke van de 10 afbeeldingen zijn gebruikt als bronmateriaal? Allemaal? 1? Meerdere? En hoe bewijs je dit aan een rechter?

Nu de hierboven genoemde situatie, maar de AI-maker heeft heel slim besloten om zijn onethische zaakje wat minder open te doen. Geen idee welke afbeeldingen gebruikt zijn in de dataset om de AI te trainen. Hoe weet je dan überhaupt of de render gebaseerd is op auteursrechtelijk beschermd materiaal? Wiens digitale shirtje is gejat? En hoe bewijs je dàt aan een rechter?

Het is inderdaad een bedrijfsbeslissing... en dat is het geniepige eraan. Ze weten heel goed waar ze mee bezig zijn en hebben hun constructies zo opgezet dat ze wegkomen met wat ze doen. Als ik geen moreel besef zou hebben, zou ik hartstikke jaloers zijn met de gigantische hoeveelheden geld die ze binnenslepen met geautomatiseerde en onbestrafte plagiaat. Slapend rijk worden is het bijna, minus de overhead van het ontwikkelen van het model.
In geval van kunst heb je meestal beschermingen op het verwerken van andere kunst in je eigen werk.

ChatGPT echter wordt vaak betrapt om echt copy/paste te doen van bepaalde bronnen, vooral als de vraag relatief specifiek ligt. Zelfde met de GitHub AI, die ik zelf al gezien heb mijn eigen code inclusief commentaar rechtstreeks te kopiëren.
Die uitspraak is duidelijk gemaakt door iemand die niets kent van talen en semantisch modellen.

De data die het geleerd heeft, heeft niets meer te maken met de output. Een AI is net als een student, het leert van verschillende bronnen en de antwoorden die het geeft zijn conclussies dat het maakt op basis van de bronnen. Bij een mens zijn er heeeel veel bronnen geweesd (je fammillie, school(alle leraars dat je ooit gehad hebt voor alle vakken die je ooit gehad hebt), sociaal leven(vrienden/toevallige kennisen))

Bij chatgpt is de bron momenteel gelimiteerd tot maar 40gbyte of data, ruwe data van internet, als je de data meer differcifieerd en ook toegang zou geven tot boeken dan gaat hij veel efficienter kunnen leren en antwoorden dan menselijke studenten.Zijn conclussies zullen ook veel meer parameters gebruiken dan dat een mens zou kunnen in acht nemen (we zijn gelimiteerd tot ons inzichtelijk vermogen).
Hierdoor zal een ai met buitenwereld informatie conclussies en analyses kunenn maken dat een mens nooit zal kunnen matchen, en je mag verwachten dat je dit al in 2023 zal zien
Tsja, als ik Mickey Mouse heb gezien en daarna een muis teken met grote oren heeft Disney daar een mening over. Ik verwacht met AI niet anders.
Volgens de U.S. Copyright Office zijn werken geproduceerd door kunstmatige intelligentie (of anderzijds niet-menselijke bronnen) niet onderhevig aan het auteursrecht. Het is nog onduidelijk hoe het Europese equivalent hier tegenaan kijkt.
Ik vind dit vreemd. De AI heeft iemands werk gelezen en gebruikt het. Je kunt het anders verwoorden, maar daar verandert het bronwerk niet door.
Vanuit een ethisch en legaal standpunt zou je inderdaad redeneren dat het auteursrecht bij de makers van de oorspronkelijke werken gebruikt als input ligt. Maar er zijn een aantal problemen die dit principe heel moeilijk maken.

Zo zijn de algoritmen doelbewust ontworpen om geen direct verband tussen resultaat en input op te slaan. Logisch, anders zouden de bedrijven al lang failliet zijn door rechtzaken, er wordt immers zonder toestemming gebruik gemaakt van auteursrechtelijk beschermd materiaal.

Een ander belangrijk probleem is dat zelfs al zouden ze dergelijke verbanden wel opslaan in een beheersbare manier, je te maken hebt met een gigantische hoeveelheid oorspronkelijke werken die allemaal gebruikt (kunnen) zijn om tot een bepaald resultaat te komen. Zelfs voor een enkele zin. Hoe zit het dan met de regelgeving? Wie heeft er dan een controle over het resultaat? Alle duizend oorspronkelijkje auteurs tegelijk? En wat als één nee zegt en de anderen ja? Om dan te bedenken dat een nieuw werk uit vele zinnen bestaat... Het is een logistieke en legale nachtmerrie.

Het is echter niet geheel vreemd. Een auteursrechtenhouder beheerst een aantal rechten over zijn eigen werken en kan daarmee bepaalde toepassingen van afgeleiden aan banden leggen. Maar hij wordt niet de eigenaar van deze afgeleiden. Als ik een werk van jou traceer zonder toestemming en dit publiceer, kan jij terecht met je auteursrecht een schadevergoeding eisen. Maar je wordt nooit eigenaar van de trace die ik gemaakt heb. Daarentegen heb ik simpelweg geen auteursrecht op dit werk. Deze redenering gaat ook op voor complexe vormen van plagiaat zoals het gebruik van AI om teksten/afbeeldingen/muziek te genereren, hoewel de redenering voor de U.S. Copyright Office voor dat besluit anders was.
Zo zijn de algoritmen doelbewust ontworpen om geen direct verband tussen resultaat en input op te slaan.
Dat zou dus aangepakt kunnen worden.

Ik heb gemengde gevoelens bij AI.
Aan de ene kant zie ik enorme mogelijkheden voor bijvoorbeeld "digitale dokters" die over alle medische kennis beschikken.
Aan de andere kant zal oorspronkelijk werk maken voortaan minder lonen want de AI gaat er mee aan de haal.

Ik vind de traceerbaarheid ook een probleem in onze rechtstaat. Onze overheid verzamelt zeer veel gegevens van de burgers en laat daar AI op los om te checken of er burgers buiten de normale patronen vallen. Deze burgers zijn dan voortaan "verdachte". De overheid kan zelf echter niet aangeven op basis van welke wettelijke regel de burger precies verdacht wordt.

AI is een prachtig hulpmiddel maar het is net als met keukentrapjes: je moet er voorzichtig mee omspringen.
AI is een prachtig hulpmiddel maar het is net als met keukentrapjes: je moet er voorzichtig mee omspringen.
Leuke uitspraak, ga ik onthouden. Kan je een leuk plaatje van maken, een keukentrapje ziet er al uit als een 'A', zet er iemand voor en je hebt de 'I'.
Heel simpel de rechtspersoon die chatgpt erom vraagt.

Hoezo zou dit anders werken dan alle andere tools die we gebruiken om productiever te zijn? Als je wat maakt met de tools van photoshop ben je toch ook de eigenaar?
Als ik jouw kunstwerk download en er een filter overheen gooi in Photoshop, ben ik dan de eigenaar? En wat als ik eenzelfde principe toepas maar dan voor tientallen afbeeldingen tegelijk en met wat complexere methodes om de boel samen te voegen, wat dan?
Een filter over gooien is een beetje simpel en weet je best dat niet toegelaten is.

Maar welke SF auteur maakt volledig nieuwe content? Ze zijn allemaal gebaseerd op vroegere boeken. Er zijn zelfs honderden/duizenden auteurs die zich bij hun boeken baseren op de roboticawetten van Asimov. Zijn die ook allemaal illegaal? Want dat is letterlijk wat deze tool doet als het een tekst schrijft: het heeft geleerd van die honderden boeken die hij gelezen heeft van wat een lezer verwacht. Hoe verschilt dit met een menselijke auteur?
Auteursrecht gaat niet over originaliteit maar om het overnemen van bestaande werken, op welke manier dan ook. Mensen kunnen prima dingen bedenken die toevallige overeenkomsten met bestaande werken hebben (immers kan je een banaan maar op zoveel manieren tekenen voordat het repetitief wordt), maar ze kunnen ook volledig nieuwe dingen bedenken. Meestal wordt inspiratie uit persoonlijke ervaringen en het echte leven gehaald om er een vorm van kunst van te maken.

Machine learning algorithms kunnen dit niet en zijn geprogrammeerd om informatie uit bestaande werken te halen en om te vormen in een bruikbaar resultaat middels statistische formules en metadata. Het is een structurele en complexe vorm van het maken van afgeleiden, van uitsluitend bestaande werken waarop grotendeels het auteursrecht berust. Zo verschilt dat met een menselijke auteur. Laatstgenoemde kan ook plagiaat plegen, terwijl de machines dat bij uitstek doen.
Daar ben ik het niet 100% mee akkoord. Machine inforced learning zoals ze nu deze AI's trainen, verschillen voor mij niet veel van hoe een kind leert. Volgens uw redenering kan dall e geen enkel plaatje genereren zonder dat het een één-op-één copy is van onderdelen van bestaande tekeningen. Ik denk dat het ondertussen al duidelijk is dat dit niet het geval is.
Machine inforced learning zoals ze nu deze AI's trainen, verschillen voor mij niet veel van hoe een kind leert.
Okee dat is fijn, maar het is hier geen meningskwestie. Dit is een puur feitelijk onjuiste stelling die je hier maakt.

We weten dat de machine learning algoritmes niet op dezelfde manier werken als het menselijk brein. We weten dat deze software op een heel specifieke manier geprogrammeerd is om een bepaalde taak uit te voeren, niets meer en niets minder. En voor deze taak wordt gebruik gemaakt van een dataset bestaande uit afbeeldingen gescraped van het internet. Er is totaal geen cognitie betrokken in dit process. Geen inspiratie ofwel het opdoen van ideeën. Geen persoonlijke ervaringen. Geen emoties. Geen motivaties. Dit is niet hoe het menselijk brein werkt, ook al ben jij van mening dat het wel zo is.

Laat jij maar eens een kind zien dat, om kunst te maken, eerst miljoenen tot miljarden afbeeldingen van het internet haalt, hier een complex statistisch algoritme op loslaat, een metadata-enhanced composietmodel van de verkregen informatie maakt en vervolgens een prompt algoritme opstelt om andere gebruikers afbeeldingen te laten genereren. Zou ik erg knap vinden, ik kwam niet verder dan potlood en papier.
Volgens uw redenering kan dall e geen enkel plaatje genereren zonder dat het een één-op-één copy is van onderdelen van bestaande tekeningen.
En dat is dus een glasharde leugen, want dat heb ik nooit gezegd. Het is duidelijk dat je niet doorhebt dat de auteursrechtenwetgeving ofwel copyright meer omvat dan enkel het maken van exacte kopieën. Verplicht leesvoer: https://en.wikipedia.org/wiki/Copyright
[...]


Okee dat is fijn, maar het is hier geen meningskwestie. Dit is een puur feitelijk onjuiste stelling die je hier maakt.
Ik ben geen specialist maar jij blijkbaar wel dat je hier stelt dat het menselijk brein zo niet werkt? Ik ben vrij zeker dat de wetenschap nog niet te veel weet over hoe het werkt.
Laat jij maar eens een kind zien dat, om kunst te maken, eerst miljoenen tot miljarden afbeeldingen van het internet haalt, hier een complex statistisch algoritme op loslaat, een metadata-enhanced composietmodel van de verkregen informatie maakt en vervolgens een prompt algoritme opstelt om andere gebruikers afbeeldingen te laten genereren. Zou ik erg knap vinden, ik kwam niet verder dan potlood en papier.
Zeg dan eens hoe wij dit doen? Wij halen blijkbaar geen inspiratie uit onze omgeving? Een kind kan zonder ooit een boom te hebben gezien een boom tekenen? Wat is het verschil van tegen een kind te zeggen: "teken een boom" en in een prompt te schrijven: "teken een boom"?
[...]
En dat is dus een glasharde leugen, want dat heb ik nooit gezegd. Het is duidelijk dat je niet doorhebt dat de auteursrechtenwetgeving ofwel copyright meer omvat dan enkel het maken van exacte kopieën. Verplicht leesvoer: https://en.wikipedia.org/wiki/Copyright
Ben je met het verkeerde been uit bed gestapt? Ik maak een interpretatie van uw opmerking en jij beschuldigd mij van liegen? Uiteraard is het allemaal wat kort door de bocht maar je mag eens wat online manieren gaan leren. En dat voor een karmakeizer...
We weten inderdaad nog niet volledig hoe het menselijk brein werkt. We weten wel hoe het niet werkt en dat het niet hetzelfde is als een computerprogramma dat miljoenen afbeeldingen verwerkt op de manier die ik hierboven beschreven heb. Dus tenzij jij bewijs kan leveren voor het tegenovergestelde (iets met bewijslast), klopt er niets van je stelling.
Zeg dan eens hoe wij dit doen? Wij halen blijkbaar geen inspiratie uit onze omgeving?
...wat? Wij halen WEL inspiratie uit onze omgeving. Machine learning doet dat niet. Dat was het hele punt van mijn vorige reactie.
Wat is het verschil van tegen een kind te zeggen: "teken een boom" en in een prompt te schrijven: "teken een boom"?
Dat kind kan een boom tekenen zonder ooit kunst van een boom gezien te hebben, laat staat duizenden tot miljoenen afbeeldingen ervan. AI niet. Het is waanzin om te denken dat het menselijk brein hetzelfde werkt als een prompt. Als ik jou instrueer om een hyperrealistiche alien met het hoofd van Scarlet Johanson te tekenen, met een blauw bos met draken in de achtergrond, ga jij dan volautomatisch je mentale bibliotheek van relevante afbeeldingen bij langs om op een complexe manier amalgamaten ervan te maken in een tiental seconden? Knap.
Ben je met het verkeerde been uit bed gestapt?
Nee hoor, ik verweer me slechts tegen iemand die niets van het onderwerp begrijpt en hierover liegt.
Ik maak een interpretatie van uw opmerking en jij beschuldigd mij van liegen?
Correct, je interpretatie is incorrect en gebaseerd op een valse aanname die je over mijn stelling gemaakt hebt. Voldoet aan de definitie van "leugen".
Uiteraard is het allemaal wat kort door de bocht maar je mag eens wat online manieren gaan leren. En dat voor een karmakeizer...
Right back atcha! Misschien moet je geen leugens over anderen verspreiden over een onderwerp waar je geen verstand van hebt, dan krijg je ook niet dergelijke weerstand.

Maargoed, je bent vrij zeker van je zaak dus ik nodig je uit om een wetenschappelijk artikel te linken waarin onomstotelijk bewezen wordt dat het menselijk brein op dezelfde manier functioneert als een machine learning algoritme als DALL-E. Wat zou dat een uitstekende kans voor je zijn om mij op mijn plaats te zetten.
Ik ga er niet te veel woorden meer aan vuil maken dus dit is de laatste keer dat ik op u reageer maar ik zou toch zeker aanraden de definitie van een leugen eens te lezen (spoiler: het is niet wat je denkt, opzet is wel degelijk een vereiste). En wat bewijsvorming betreft: Als ik zeg "het verschilt volgens mij niet veel van hoe een kind leert" en jij zegt "dikke BS, achterlijke leugenaar en als je mij niet gelooft, toon mij dan wetenschappelijk bewijs dat jij gelijk hebt" zonder zelf iets van bewijs te geven, zorgt er voor dat ik je niet serieus kan nemen.
Ik ben me bewust van de definitie en deze komt overeen met jouw intenties. Je maakt, expres en doelbewust, valse stellingen over zowel hetgeen ik gezegd heb als het onderwerp zelf.
Als ik zeg "het verschilt volgens mij niet veel van hoe een kind leert" en jij zegt "dikke BS, achterlijke leugenaar en als je mij niet gelooft, toon mij dan wetenschappelijk bewijs dat jij gelijk hebt" zonder zelf iets van bewijs te geven, zorgt er voor dat ik je niet serieus kan nemen.
Dan raad ik je aan het concept "bewijslast" eens op te zoeken. Jij maakt een niet-onderbouwde stelling, iemand anders kan die dan zonder onderbouwing onderuit halen. Als jij je gelijk wil halen, moet jij daar bewijs voor leveren. Gezien het gebrek hieraan ben ik ervan overtuigd dat je geen idee hebt van hoe zowel AI als het menselijk brein wel en niet werken.
Nee, niet zo simpel natuurlijk maar als je het als inspiratie gebruikt voor je eigen kunstwerk is dat geen enkel probleem. Dat is wat deze tools tegenwoordig steeds meer doen.

Als dat niet meer mag mag je als mens ook niks meer maken tegenwoordig want er zal altijd wel iets te vinden zijn wat erop lijkt.
Deze tools doen geen inspiratie op. Het zijn geen cognitieve wezens die ideeën kunnen krijgen en op basis hiervan nieuwe werken te maken, zonder gebruik te maken van andermans werk. Het zijn in essentie complexe vormen van geautomatiseerde plagiaat.

Op basis van je laatste zin vermoed ik dat je het verschil tussen originaliteit en het niet namaken van andermans werk niet doorhebt. Dat zijn twee verschillende dingen. Een tekening van een banaan is verre van origineel, maar zolang je deze maakt zonder andere werken hiervoor te gebruiken is er geen sprake van auteursrechtenschending. Het auteursrecht beschermt werken, niet ideeën. En nogmaals, AI doet geen ideeën op, het verwerkt uitsluitend bestaande kunst.
maar zolang je deze maakt zonder andere werken hiervoor te gebruiken is er geen sprake van auteursrechtenschending
Als jij nog nooit een banaan gezien hebt dan zou je ook niet zomaar een banaan schilderen. Stiekem gebruiken wij mensen altijd wel iets wat weer voor bouwd op andermans werk.
...zucht. Nogmaals, er is een verschil tussen het opdoen van inspiratie en het overnemen van beschermde werken. Auteursrecht gaat NIET (!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!) over originaliteit. Nadruk op "NIET", aangegeven met een passend aantal uitroeptekens.
Stiekem gebruiken wij mensen altijd wel iets wat weer voor bouwd op andermans werk.
Nee.
Een betaalde variant kan nog steeds opensource zijn. En copyright regels van content trekken zich niets aan van of iets betaald is of niet. Als op een tekst copyright zit mag je het niet gratis geven maar ook niet betaald als je niets aan de copyright eigenaar betaalt.
Alleen al het feit dat openai niet open is over dit soort fundamentele vragen lijkt aan te tonen dat je er maar beter rekening mee kan houden dat het hoe dan ook niet zomaar redelijk is om je eigen of andermans gegevens door te laten verwerken. Het heeft eerder alle kenmerken dat het ze niet gaat om het helpen, maar aan het verdienen aan de gegevens en zo min mogelijk verantwoordelijkheid daarover nemen. En dat is niet alleen een probleem voor betalende bedrijven. Die bedrijven stoppen er namelijk niet zomaar alleen hun eigen gegevens in. Vandaag is een uitspraak geweest dat je recht hebt te weten met welke bedrijven je gegevens gedeeld zijn om vergeten te kunnen worden. Maar dt soort handel maakt het kennelijk opzettelijk vaag en onmogelijk, door niet transparant te zijn wanneer ze je nog recht gunnen of zelf recht nemen.
Daar gaat het inderdaad mis. De vraag is waarom je nog origineel werk zou leveren als de AI er gratis mee aan de haal kan.
Als ze met de niet-professionele variant geen rekening houden met auteursrecht en andere vormen van intellectueel eigendom, doen ze dat met de professionele ook niet. In beide gevallen zouden ze even vatbaar zijn voor rechtzaken en blijkbaar komen ze weg met wat ze nu doen.

De huidige versie van ChatGPT is gebaseerd op een enorme verscheidenheid aan bronnen en ze zijn hier erg onduidelijk over. Logisch, als er namelijk een spoor was van intellectueel eigendom naar resultaat, is dat bewijs van auteursrechtenschending. Waarom jezelf open en bloot opstellen voor de wet als je weg kan komen met (potentiële) auteursrechtenschending op massale schaal door de oorspronkelijke werken niet te registreren?
Dat lijkt me wel...

In een betaalde versie wordt er rekening gehouden met data die proprietary is of waarop een copyright berust. Dit is van groot belang om te voorkomen dat er inbreuk wordt gemaakt op de rechten van derden en om juridische problemen te voorkomen. Hiervoor zijn licentie- en / of gebruiksvoorwaarden opgesteld om de toegang tot deze data te reguleren en te beperken tot geautoriseerde (lees paying) gebruikers.

Wat betreft ChatGPT, de data die wordt gebruikt om het model te trainen, bevat zowel publieke als proprietary data. OpenAI heeft ervoor gezorgd dat alle data die wordt gebruikt voldoet aan de juiste licentie- en gebruiksvoorwaarden en dat er geen inbreuk wordt gemaakt op de rechten van derden. Gebruikers van ChatGPT worden verplicht om zich te houden aan deze voorwaarden en om geen gebruik te maken van de data in een manier die inbreuk maakt op de rechten van derden.

Zie ook de OpenAi website voor de gebruikersvoorwaarden en ook hoe kan worden omgegaan met API koppelingen etc.
Deze AI is echt revolutionair. Hij snapt de meest ingewikkelde vragen en komt echt met goede antwoorden.

Maar er is een zeer groot zwak punt: in sommige gevallen is het antwoord wat hij geeft echt compleet onjuist. Maar wordt wel met veel overtuiging gegeven.

Het is een beetje als bij zelf rijdende auto’s. 99% betrouwbaarheid is heel goed, maar uiteindelijk daardoor te gevaarlijk en onbruikbaar. Het probleem is dat die laatste procent misschien wel 1000x moeilijker te behalen dan de eerste 99%.
ChatGPT snapt helemaal niks, het kan heel goed combineren en inderdaad vertalen gaat uitstekend. Waar ik het voor gebruik is om concepten boven te halen uit de brij van data, die ik zelf niet of nauwelijks gevonden zou hebben. . Begrip....dat heeft het zeker niet, er moet vaak nog teveel aan gesleuteld worden.

Oude bronnen, die niet digitaal zijn, daar kan het helemaal niets mee. Laat nou juist in die sectie in onze bibliotheek heel veel info staan die allang vergeten, maar zeker niet minder relevant voor ons werk is (ja, gewoon in papieren banden, netjes gecatalogiseerd). Het is echt jammer dat het vak van bibliothecaris zo ondergewaardeerd is.

[Reactie gewijzigd door divvid op 22 juli 2024 16:46]

Even nieuwsgierig, voer je dan je data in in het chat venstertje? Of is er andere interfacing?
En dan de juiste gerichte vragen stellen om het eruit te krijgen.
Of lukt het zelfs met algemene vragen?
Ik gebruik https://github.com/isinaltinkaya/gptchatteR
de vragen moeten heel gericht zijn en soms komt er inderdaad iets uit dat voor ons specfiek een idee geeft in een andere richting. Waarschijnlijk omdat de database waarop het model getrained is vrij veel open publicaties bevat over ons onderwerp. als onderzoeker kan je nou eenmaal niet alles lezen, dus een chatGPT getrained op wetenschappelijke data alleen!, met goede bron verwijzing, zou een grote hulp kunnen zijn bij het formuleren van nieuwe inzichten.
Ik heb alleen niet de illusie dat AI ooit zelf nieuwe inzichten gaat genereren. Al was het maar omdat het af moet gaan op gepubliceerde data en niet alle data is gepubliceerd of zelfs maar gedocumenteerd.
Ok bedankt voor de info.
Ik heb de aanname/verwachting dat er wel goede interfacing komt om data in te proppen en daar mee te laten werken. En dan vooral in een betaalde zakelijke omgeving.
Kan erg interessant zijn. Ik ben heel benieuwd naar wat voor pakketten ze zullen aanbieden, en in hoeverre je hem bij het software schrijven kan hebben.
Ja, die is lekker. ChatGPT is getrained op een 40GB dataset. En nee, niet digitale bronnen daar kan het niets mee. PDF's ook niet overigens, tot mijn verbazing zegt ChatGPT zelf dat het alleen web-pagina's heeft gescanned (wat misschien ook niet waar is, maar goed).

Dit voelt meer aan als een reclame voor je vak dan een kritiek. En ja, er zou meer digitaal moeten worden, Google was daar onder andere mee bezig natuurlijk.
mijn vak heeft niets te maken met het al dan niet beschikbaar zijn van digitale/papieren bronnen. Ik heb alleen diep respect voor de mensen uit het klassieke bibliotheek wezen. Om een idee te geven hoe die twee in elkaar overlopen: een student heeft zeer interessante en relevante observaties gevonden in oude papieren wetenschappelijke tijdschriften uit 1919 en 1923 resp. De ene in het Frans, de andere in Russisch (en betrek aub niet de huidige situatie op wetenschap van 100 jaar oud).

Zonder Google Translate had hij die nooit kunnen lezen en zijn onderzoek niet kunnen uitvoeren. Zou je al die oude bronnen als input kunnen gebruiken in een GPT3 model, dan kun je die makkelijker doorzoeken door vragen te stellen die wellicht in lang vergeten tijden al zijn beantwoord. Een goede brondverwijzing moet daarvoor wel worden ingebouwd natuurlijk

Op dat vlak zie ik zeker nut voor GPT3 modellen, met de kanttekening dat je de uitkomst slechts als hint moet gebruiken voor verder onderzoek, op wat voor vlak dan ook. Dus kritiek: nee, een mogelijke toepassing? zeker ja. Nu maar hopen dat de Elseviers er niet mee vandoor gaan.
Is OpenAI niet non-profit?
Nee, daarom is de naam “open” ook erg misleidend.
Open zegt niets over wel of geen geld ergens mee te verdienen. Je mag ook gewoon geld verdienen met open source software. En iets als bijvoorbeeld 3GPP specificaties zijn open maar iedereen kan op basis daarvan producten maken waar geld mee wordt verdient.
Maar wel over hoe toegankelijk alles is. En dat is OpenAI niet: de modellen lokaal draaien kan en mag niet. Open is hier voor de buhne.
ChatGPT is anders open voor iedereen, iedereen kan het gebruiken. Dat het niet Open Source is doet daar niet aan af, net zo min als het feit dat je het niet lokaal zou kunnen draaien.
Open hoeft niet altijd dezelfde soort toegankelijkheid aan te geven.
Open is iets anders dan gratis. Heroine is het eerste shot ook "open". Daarna ga je betalen. Dus nee, ChatGPT is alles behalve open.
Ok, dus een deur die open staat is ook niet open?
Open heeft meerdere definities, één daarvan is toegankelijk.
Waarom is het misleidend?
Open is geen synoniem voor Gratis.
Omdat er aan GPT3 en ChatGPT niets “open” meer is.
Het heet OpenAI omdat ze in het begin de doel hadden veel meer open te zijn, niet omdat ze geen geld wouden verdienen. GPT-1 en GPT-2 waren open releases. Ze kwamen er alleen achter dat de open releases niet competitief genoeg waren. Elk ander AI-bedrijf kan zo alles inlezen en jatten. Dat maakt het lastig.

[Reactie gewijzigd door MrFax op 22 juli 2024 16:46]

Elk ander AI-bedrijf kan zo alles inlezen en jatten.
Dat is hoe open licenses al tientallen jaren werken en met succes.
Opensource kan ook geld kosten dus is niet misleidend en bevat ook het woord open.
Het gaat niet zozeer om geld, maar om het feit dat de achterliggende parameters van de modellen niet meer te onderzoeken zijn.
Je moet ergens geld mee verdienen. En je zou gek zijn dit helemaal gratis beschikbaar te stellen.
Wilt daarom niet zeggen dat ze alles gratis ter beschikking moeten stellen. Het systeem dat ze hebben uitgebouwd komt ook niet uit de cloud gevallen.
Van wikipedia: "OpenAI is an artificial intelligence research laboratory consisting of the for-profit corporation OpenAI LP and its parent company, the non-profit OpenAI Inc."

Dus nee.
Non-profit wil zeggen dat er geen winstoogmerk is, niet dat iets gratis is. Ze maken tenslotte ook kosten
Non-profit mag geen geld binnenkrijgen?
Mozilla is ook non-profit, maar ze hebben ook betaalde diensten, zoals die betaalde vpn-dienst. Ze moeten ergens geld vandaan halen.
Dus de mensen die er werken, werken gratis?
OpenAI LP
We’ve created OpenAI LP, a new “capped-profit” company that allows us to rapidly increase our investments in compute and talent while including checks and balances to actualize our mission.
Returns for our first round of investors are capped at 100x their investment (commensurate with the risks in front of us), and we expect this multiple to be lower for future rounds as we make further progress.
Het idee is dat ze maximaal 100x winst maken op elke $ geïnvesteerd. De rest gaat naar de non-profit. 10 miljard kan dus een biljoen worden.

TechCrunch heeft er destijds een vrij uitgebreid artikel over geschreven: OpenAI shifts from nonprofit to ‘capped-profit’ to attract capital
Wel een bijzonder idee, "de rest gaat naar de non-profit", wat eigenlijk gewoon een zusterorganisatie is en in het totaalplaatje dus hetzelfde bedrijf. Waar gaat het geld uiteindelijk naar toe? Een goed *proest* doel?
Er is een foundation (Not for profit) en een bovenliggende commerciele entitieit (of vice versa)
Anyway, hier zijn een aantal mensen nu of straks goed aan het verdienen, ook wel één van de meest leuke startup van de laatste jaren misschien wel.
soms merk ik bij bepaalde vragen dat de AI America-centrisch is.

Dat terzijde ik vraag mij af op den duur of de AI gekleurde antwoorden zal geven i.e. misbruikt om bepaalde informatie te verspreiden om beslissingen te beïnvloeden. Ik heb zelf hier nog geen idee hoe dat zou moeten maar soms schiet zo'n idee mij binnen.
Sluit wel aan bij de trends die ik meer en meer merk. We vieren geen sinterklaas meer maar de kerst. We doen opeens aan halloween.

Ik ben blij dat als het luchtalarm afgaat, we met zijn alle naar de nos.nl gaan en dat dat nog netjes volledig in nederland gehost word. Ik hoop dat dat zo blijft. We leunen veel en veelste veel op americaanse dingen. Deze AI is de volgende stap waar we niet eens meer de keuze hebben.
Het ligt natuurlijk ook aan de Engelse taal die door erg veel mensen ter wereld wordt gesproken, waarbij Amerika een land is waar relatief veel van die content wordt geproduceerd. De bias is dus niet raar.
we met zijn alle naar de nos.nl gaan en dat dat nog netjes volledig in nederland gehost word
Waar komt de software op de servers van de NOS vandaan? En het CMS dat ze gebruiken?
De software op de servers zal wel niet uit Nederland komen, maar de CMS die ze gebruiken is door hunzelf ontwikkeld en daarmee dus Nederlands: https://www.svdj.nl/nieuw...n-redactiesysteem-en-cms/
Het succes van iNOS: de NOS bouwde zijn eigen redactiesysteem en CMS

[Reactie gewijzigd door TheVivaldi op 22 juli 2024 16:46]

Zeker niet waar. De storage wel. Maar de backend draait op een door NPO beheert cluster bij AWS. Hierbij wordt gebruik gemaakt van Kubernetes op basis van Openshift. (Voorheen draaiden ze wel alles zelf.

NPOstart draait volgens mij wel in NL bij NEP.
“doen opeens aan Halloween” is niet helemaal waar: dat vierden we hier ook al in de vorm van Allerheiligen en, volgens de Keltische kalender, als Oudejaarsdag: https://nl.wikipedia.org/wiki/Halloween#Geschiedenis. Het enige wat veranderd is is de manier waaróp we het vieren, namelijk uitbundig en met allemaal kostuums en zo. Maar om nu te zeggen dat dat direct uit de VS afkomstig is… met Sint-Maarten verkleedden we, in elk geval waar ik ben opgegroeid in net iets boven het midden van het land, ons ook altijd. Het zat dus al wel een beetje in de traditie, maar ik ben zeker met je eens dat het flink is uitgebreid onder Amerikaanse invloed, helemaal met al die horrordingen en feestjes en zo.

Maar Sinterklaas zie ik niet echt verschil in: dat blijft een razendpopulair feest. Het is alleen meer een kinderfeest dan Kerstmis, wat de reden kan zijn dat laatstgenoemde op latere leeftijd meer wordt gevierd (binnen mijn familie in elk geval wel).

[Reactie gewijzigd door TheVivaldi op 22 juli 2024 16:46]

Zwarte Piet is discutabel, maar ik reageerde op de verschuiving van trends in wat we vieren. Zelfs al verandert Zwarte Piet wat, dat neemt niet weg dat het feest an sich nog steeds populair is, i.t.t. wat de persoon boven mij beweerde.
Een model zal altijd binnen een bepaalde context starten. Dat zou dus best amerikaanse feiten kunnen bevatten. Naarmate het model meer leert, zal dit verdwijnen.
Hangt er ook maar vanaf hoe het model verder leert, als de bias daarin in stand blijft (input is overwegend Amerikaans, gebruikers bevestigen Amerikaanse context vaker als waar), dan blijven de resultaten ook een bias houden.
hoe meer data je aanbiedt, ook niet niet-amerikaanse bron, dan zal de bias ook verdwijnen. Als de bias 'hard ingebakken' zit, dan lijkt het op een erg 1e generatie AI systeem met een inferentieschema. Dat zou ik haast geen AI noemen.
stel uw vragen eens in het nederlands
Dan krijg je antwoorden gebaseerd op dezelfde informatiebronnen, maar dan vertaald.
Het "ding" kletst overigens prima Nederlands.. Ze doet tegenwoordig al ons meertalig vertaalwerk, net zo goed of beter dan een medium range vertaalservice.
Ik heb me vast op de wachtlijst gezet, maar ben erg benieuwd naar de prijs. Ik heb maar mooi lage (maar in mijn ogen niet onrealistische) bedragen ingevuld.

We gebruiken het hier thuis dagelijks voor werk en het scheelt ons uren werk. Hoewel de kwaliteit goed is, is het wel nog verre van perfect. Aan de ene kant goed, want dan doe ik zelf ook nog wat, maar aan de andere kant wil ik er daarom ook niet de hoofdprijs voor betalen.

Als de prijzen van hun andere product (de API) een indicatie geven, waarbij je 2 cent per 1000 tokens (een token is 4 tekens) betaald, zal het ook nog wel eens mee kunnen vallen.

Wat ik wel het liefst zou zien is dat je de chatbot ook zelf kunt trainen, net als bij de API, al gaan de prijzen dan (logisch) wel aanzienlijk omhoog.
vraag me wel af op welke manier je dit kan gebruiken voor werk...
Vooral als startpunt.

Om even snel termen op te zoeken. Of commando's zoals shell commando's. Of om een manier te vinden om wat met een applicatie te doen. Of om een goed geformatteerd lijstje te krijgen. Of om wat boiler code te genereren. Of om te zoeken welke classes ik voor een programma kan gebruiken.

Heck, ik vroeg aan ChatGPT wat ik nodig had om in de winter te kajakken en kreeg een lijst van 10 middelen, alle 10 correct. Alleen de warme schoenen misten. Dat lijstje is ongetwijfeld gejat maar goed.

En nee, je kan dit niet voor een rapport ofzo gebruiken, en als je voldoende technisch werkt dan heeft het ding gewoon niet de juiste informatie. Ik vroeg ook of Diffie-Hellman quantum safe is en kreeg terug dat het niet aangevallen kon worden door een quantum computer, met uitleg dat het DL-probleem niet aangevallen kon worden. Dat is 100% onzin.

Maar voor mundane dingen of om dingen simpelweg te vinden is het prima geschikt en vaak handiger dan Google omdat je daarbij vaak nog de resultaten moet doorzoeken. Nou ja, het was geschikt want momenteel kom ik er niet doorheen.

[Reactie gewijzigd door uiltje op 22 juli 2024 16:46]

ik stelde 49 euro per maand voor als "hmm hier moet ik even over nadenken".

Het ligt ook een beetje aan de beperkingen. Bij ongelimiteerd gebruik in de vorm van een API, wil ik hier best meer voor betalen ook.
Ik kijk naar de language models en dan specifiek Davinci (=GPT 3.0, de chatbot is 3.5 en (nog) niet beschikbaar).

Van de site

"Multiple models, each with different capabilities and price points. Ada is the fastest model, while Davinci is the most powerful.

Prices are per 1,000 tokens. You can think of tokens as pieces of words, where 1,000 tokens is about 750 words. This paragraph is 35 tokens."


1000 tokens voor Davinci kosten ... $0,02

Voor $/€ 49 moet je er dan wel heel veel gebruik van maken, zeg zo'n half miljoen tokens per maand of 20K per dag.
Misschien wel handig. Ik zet chatgpt vaak open aan het begin van de dag en gebruik het als ddg/stackoverflow in 1. Maar ja ik kan er geen “business secrets” of proprietaire informatie in gooien want ze slaan natuurlijk alles op. Als je betaald en ze doen dat niet (of je draait het dan echt zelf ergens in het netwerk) zou dat wel handig zijn.
Pas op dat het ook wat betreft programmeren het er behoorlijk naast kan zitten. Meestal merk je dat zelf ook wel op tijd op natuurlijk, dus da's geen onoverkomelijk probleem - zolang je er maar vanuit gaat dat het fout kan zitten.

Waarvoor het superhandig is is voor boilerplate en om dingen op te zoeken. Ik had bijvoorbeeld een specifieke parameter class nodig en als ik dan om een voorbeeld vraag staat die parameter class er netjes in... kan ik weer verder.

Ja, ik heb laatst een interne presentatie gegeven en gaf aan dat het invoeren van klantgegevens echt uit den boze is. Geen idee wat ze nou precies opslaan, maar zelfs al zouden ze mij een statement geven dat ze niets opslaan...
Ja klopt, laatst had hij mij een optie voor een programma met allerlei sub opties. Precies wat ik nodig had! Alleen had hij alles verzonden want het werkte niet en ddg vond geen spoor van de suggesties :)
Lijkt me niet meer dan logisch, want als een bedrijf verdiend aan jou werk dat je erin steekt/hebt gestoken dan mag je zelf ook wel iets van de gemaakte kosten terug gaan zien. Uiteindelijk wint iedereen erbij
Chatbot: "Schrijf in mijn eigen stijl het essay dat ik morgen moet inleveren".
dit is een interessante ontwikkeling

Op dit item kan niet meer gereageerd worden.