Apple keurt app met ChatGPT-integratie zonder wijzigingen goed na afkeuring

Apple heeft de update van een app die ChatGPT integreerde goedgekeurd, nadat het bedrijf de app eerder meerdere malen afkeurde. De ontwikkelaar heeft niets gewijzigd aan de app, maar de wijziging kreeg wel media-aandacht.

Apple heeft de app zonder wijzigingen vlak voor het weekend toegelaten in de App Store, schrijft The Wall Street Journal. Apple had aan de ontwikkelaar gevraagd om contentmoderatie in te bouwen vanwege de ChatGPT-integratie en de ontwikkelaar had al eerder gezegd dat hij dat had gedaan. Toch bleef Apple de app afkeuren.

Apple maakte zich volgens de appreviewers zorgen dat kinderen met de app ongepaste content konden genereren door de integratie van ChatGPT. Het gaat om een mailapp, Bluemail, die op basis van eerdere mails met de ChatGPT-integratie nieuwe mails kan opstellen. Er zijn geen officiële regels rond kunstmatige intelligentie die content kan genereren voor de App Store.

BlueMail GEMBlueMail GEM

Door Arnoud Wokke

Redacteur Tweakers

06-03-2023 • 18:13

57

Reacties (57)

57
57
19
1
0
26
Wijzig sortering
Tja, niet dat ik nu Apple fan ben of iets heb tegen Apple maar het is wel ietwat triest dat Apple blijkbaar bezwijkt voor media-aandacht. Althans dat ligt er toch wel duimendik bovenop nu Apple de ongewijzigde app opeens wel goedkeurt.

Evenzogoed, laatst eens even ge-experimenteert met ChatGPT, maar dat ik nou echt ervan onder de indruk ben, nee. Ik ben er niet echt lang en diep mee bezig geweest maar een beetje slim iemand kan dan zo'n 'gesprek' sturen. Denk als je een vraag op tig verschillende manieren stelt dat je ook elke keer totaal andere antwoorden zal krijgen.

Maar buiten dat blijf ik het gewoon beangstigend vinden dat je door gebruik van AI dadelijk geeneens meer weet of het nu een fysiek persoon is of een of andere robot. Ook voorzie ik dat er nog genoeg problemen gaan ontstaan door foute interpretaties. Of dat bedrijven er dankbaar misbruik van gaan maken door vooral klanten handig aan het lijntje te gaan houden.
Dat is het ook niet persé. Er zijn veel mensen die de apps keuren en daar zitten verschillen tussen, er worden weleens fouten gemaakt. Of soms vragen ze om verduidelijking. Je kunt altijd bezwaar maken.
Dat werkt erg goed, want je praat gewoon direct met mensen in plaats van een gezichtloze instantie die je bij afkeuren één of ander vaag bericht stuurt.
Naar mijn ervaring (enkele jaren geleden) was het approval proces in de appstore zeer irritant. Standaard antwoorden, die de vraag niet beantwoorden (iedere keer weer), zeer lange verwerkingsduur (eerder weken dan dagen) en vooral zeer onpersoonlijk, absoluut star (game afwijzen omdat er joystick support aangevraag werd, een geaccepteerde app die nog niet gereleased is niet kunnen updaten - zonder vooreerst de geaccepteerde versie te moeten releasen want anders loop je het risico dat de nieuwe app afgewezen wordt en de oude dan ook 'weg' is, repro-case voor een openGL drivercrash opgestuurd via priority ticket, na 6 maanden (1 mailwisseling per 4-6 weken) werden we 'weggestuurd' met het verzoek het op apple radar te posten (ja dag, ik ga hier niet nog 6 maanden discussies beginnen - jullie hebben alles wat nodig is inclusief een mini repro-case, en het is niet uniek want andere apps crashten met dezelfde callstack).

Verder tevreden osx gebruiker, maar ik werk persoonlijk liever niet meer aan een osx versie van software.

In vergelijk, Oculus was echt mijlenver vooruit, gewoon menselijke antwoorden en in ons geval (unieke situatie die niet precies binnen de regels viel) de flexibiliteit om mee te denken - redelijke wijzigingen voor de stellen - zeer onproblematisch allemaal.

[Reactie gewijzigd door rboerdijk op 24 juli 2024 06:43]

Helaas is Oculus nu ook hel voor developer tickets. Maar daar is wel verandering aan het komen hoor ik.
Misschien gebruiken ze bij Apple een geautomatiseerd systeem om apps te keuren? Een AI :Y)
Het kan ook gewoon zijn dat de reviewer deze keer er simpelweg geen probleem in zag. Niets garandeerd dat je review telkens door dezelfde persoon gebeurdt of dat iedereen dezelfde reactie heeft.
Inderdaad, dat is waar. Apple reviews zijn best nogal willekeur.

Ik heb in het begin van iOS apps geschreven en toen was het helemaal drama. Als ik een update/bugfix pushte van 2 regels dan kreeg ik vaak klachten over dingen die er sinds het begin allang in hadden gezeten 8)7 En gebruikers maar vragen waarom het zo lang moest duren.

Uiteindelijk maar mee opgehouden want het was puur hobby, ik deed niks betaalds en ook geen ads. Het was al het gezeur niet waard. Tegenwoordig hebben ze wel meer processen eromheen begreep ik maar die willekeur is er moeilijk uit te krijgen.

Ook vind ik dat Apple veel te moeilijk doet. Geen erotica, geen emulatoren, geen browser engines.. Laat gebruikers eens zelf beslissen. Om die reden heb ik allang al geen iOS meer.

[Reactie gewijzigd door GekkePrutser op 24 juli 2024 06:43]

Apple heeft geen recht om zich te verdedigen? Dit is een eenzijdig verhaal zonder dat Apple ook maar heeft kunnen reageren (staat alvast niet in het artikel, wat normaal wel gedaan wordt als er geen antwoord komt van een partij). Wie zegt dat het klopt dat er niets aan de code veranderd is?
Apple heeft geen recht om zich te verdedigen?
Vandaar dat ik ook 'blijkbaar' erbij om het in het midden te houden en Apple ongetwijfeld nog wel zal reageren.

[Reactie gewijzigd door Roel1966 op 24 juli 2024 06:43]

Je kunt Apple vragen om een reactie maar die komt 99% zeker niet.
Ergens wel jammer want op die manier blijf je wel houden dat er van allerlei verhalen de ronde doen, maar ja, dat is wel bekend bij niet alleen Apple maar ook vele anderen.
Klopt maar in dit soort gevallen kun je als bedrijf beter niets zeggen. Damned if you do damned if you don’t maar minder zeggen is het veiligste :/
Keuren van apps is mensen werk en onderhevig aan de interpretatie van degene die de keuring doet. Ik heb al vaker meegemaakt dat identieke apps met een andere stijling anders werden beoordeeld. De ene app werd dan goedgekeurd, de andere niet.

Wat betreft je angst voor AI gegenereerde tekst, het is al lang zo dat je bij chats antwoord krijgt van AI robots. Vaak was dat zo slecht dat mensen er echt een hekel aan hadden, net zoals het doorlopen van een heel menu als je de klantenservice belt. Tegenwoordig zijn AIs een stuk beter in het genereren van gesprekken die niet veel afwijken van wat een echte persoon zou antwoorden. Zolang het duidelijk is dat je in gesprek bent met een robot zie ik het probleem niet zo, maar ik vraag me af of dat altijd wordt vermeld. Ik denk het namelijk niet.

Edit: autocorrect typo

[Reactie gewijzigd door david-v op 24 juli 2024 06:43]

Wat betreft je angst voor AI gegenereerde tekst, het is al tien zo dat je bij chats antwoord krijgt van AI robots.
Dat weet ik en daar heb ik mij ook al vaak aan geërgerd want je krijgt dan vaak toch een soort van standaard gegenereerde antwoorden.
Zolang het duidelijk is dat je in gesprek bent met een robot zie ik het probleem niet zo
Nee oke, als er duidelijk chatrobot vermeld staat dan erger ik mij wel maar dan is het wel duidelijk.
maar ik vraag me af of dat altijd wordt vermeld. Ik denk het namelijk niet.
Ik weet bijna zeker van niet want het valt mij de laatste tijd vooral op bij mails van helpdesks. Er word vaak met vrouwennamen ondertekent en telkens andere namen. Dus dan krijg je in een vervolgmail ongeveer een zelfde antwoord maar wel onder een andere naam. Mij zou het niet verbazen als dit ook AI gegenereerde mails zijn en het dus totaal niet duidelijk is.
cc @david-v

Het probleem met chatrobots is dat ze na al die jaren nog steeds 99 van de 100 keer te dom zijn om zelfs maar te begrijpen wat je precies wil weten, laat staan dat ze een adequaat antwoord kunnen formuleren.

Of het een ai is of een echte medewerker vind ik minder belangrijk als het gaat om de vraag waarom ik wéér niet bij het spamfilter bij de hostingprovider kan.

Tip: typ gewoon ‘medewerker’, dat is vaak de snelste weg naar een antwoord.
Er is de laatste decennia ontzettend veel werk in gestoken om de AIs "iets" minder dom te laten overkomen. Het resultaat zie je nu als eerste bij chatgpt terwijl er door veel meer bedrijven hier aan gewerkt is. chatgpt komt nu vooral in het nieuws omdat iedereen het kan uitproberen. En eerlijk gezegd zijn de antwoorden wellicht niet (altijd) correct, de manier van terug antwoorden spreekt veel mensen aan, net zoals de teksten bij horoscopen ;). De antwoorden hebben vaak wel een veel betere relatie tot de vraag die je stelt waardoor die "gekke" antwoorden van de traditionele chatrobots bij websites ineens heel dom overkomen.

Wat gebeurd er als je een AI als chatgpt kan voeden met alle publieke gegevens van een bedrijf en daarnaast ook bij inloggen met digid ook inzage heeft in jouw persoonlijke gegevens? Dat is denk ik waar veel bedrijven zich nu over aan het buigen zijn en wellicht ook met producten op de markt komen. Het zijn spannende tijden voor de chatbots als je het aan mij vraagt.
Ja helaas is dat vaak ook wat ik tegenkom dat zelfs de meest simpele dingen soms door een robot niet begrepen worden, of dat je een ellenlang verhaal te zien krijgt wat totaal niets te maken heeft met de vraag.

Die laatste ga ik zeker eens uitproberen, goede tip !
We kunnen natuurlijk niet uitsluiten dat Apple inderdaad is 'bezweken' onder druk van de media aandacht. Toch is het niet ongebruikelijk dat een app die in eerste instantie wordt afgewezen, later zonder wijzigingen toch wordt goedgekeurd.
Apps worden niet elke keer door dezelfde persoon gereviewd. Na een afwijzing heb je als ontwikkelaar de mogelijkheid te reageren. In mijn ervaring wordt na een paar keer heen en weer pingelen het proces overgedragen aan een meer senior medewerker die je app opnieuw bekijkt. Ook kan het zo zijn dat je argumenten, in reacties op een afwijzing, voldoende steekhoudend zijn en je app toch wordt goedgekeurd.
Of het omgekeerde: dat er bij een compleet ongerelateerde wijziging opeens kritiek komt op iets wat al jaren in je app zit, bijvoorbeeld een icoontje wat volgens de reviewer gebruikt wordt voor het verkeerde doel o.i.d., dat soort kleine dingen. Wel vervelend als je een kritieke bugfix wil pushen en je opeens wordt tegengehouden zo ;(
Maar buiten dat blijf ik het gewoon beangstigend vinden dat je door gebruik van AI dadelijk geeneens meer weet of het nu een fysiek persoon is of een of andere robot.
Als de reactie van een fysieke persoon en een robot niet van elkaar te onderscheiden zijn dan is er effectief dus geen verschil en dus ook geen reden om meer/minder angst te hebben.
Het verschil zit hem vooral erin dat een fysiek persoon vanuit zijn/haar menselijke intuïtie en expertise schrijft. Een robot daarentegen werkt via een vast algoritme en database en kan daardoor niet zomaar even een menselijke oplossing bedenken. Dus vooral dat menselijke deel blijf ik heel belangrijk vinden en dit nooit door een robot vervangen kan en mag worden.
Dat (media-aandacht) komt wel vaker voor, de app wordt geweigerd door een gemiddelde reviewer, na media-aandacht wordt het geëscaleerd naar een meer senior reviewer. Gezien het volume aan reviews wordt veel van dit werk geoutsourced naar een lage-lonenland, maar ik geloof zo dat ze nog reviewers in de VS hebben die op het hoofdkantoor werken voor de high-profile apps en voor escalatie.
Ik kan helaas het specifieke plaatje niet meer vinden. Maar ik denk dat het volgende toch daadwerkelijk werkelijkheid gaat worden:

- Verzender A gebruikt AI om een langere tekst te genereren (bijvoorbeeld voor een "professionelere" e-mail)
- Ontvanger B gebruikt AI om de langere genereerde tekst te verkorten

Dus in dat opzicht denk ik "just cut out the middle man".
Het is een beetje bedrijfscultuur.. Waar ik nu werk is een duim of een "ok" tegenwoordig prima gelukkig.
Ik hoef geen mail van 5 zinnen die samengevat kan worden in "ok".

Bij andere bedrijven is dat natuurlijk wel weer standaard, dan is dit wel een uitkomst :)
Ik vind het ook onzin om een mail die kort kan, in meerdere zinnen op te schrijven. Toch merk ik dat het soms nodig is meer woorden te gebruiken om ervoor te zorgen dat een mail maar op één manier geïnterpreteerd kan worden. Zonder lichaamstaal en intonatie gaat het helaas vaak mis. Mensen interpreteren teksten dan op hun eigen manier, afhankelijk van hun eigen humeur, aannames en weet ik veel wat. Zie de soms gepikeerde reacties op elkaar hier op Tweakers, of de ronduit bizarre conversaties op marktplaats. Op de digitale werkvloer vermijd ik die misverstanden liever.
Grappig inzicht. Ik merk bij ons in de IT juist vaak; hoe meer woorden, hoe meer er fout kan gaan.
Het hangt er natuurlijk flink vanaf of het een interne of externe email is.

Ik ben redelijk sceptisch over de ChatGPT hype en de volstrekt ongeschikte toepassingen waar mensen verwachten het allemaal voor te kunnen gebruiken. Maar, uitgerekend voor het schrijven van een externe email lijkt het me best nuttig. Je moet eens mijn emailwisselingen met m'n advocaten zien. Dat gaat richting een A4-tje aan tekst compleet met kopjes in bold, bullet points etc. Hoewel, emails naar advocaten zijn mij te belangrijk om aan een chatbot over te laten maar je begrijpt mijn punt.
Ik ben redelijk sceptisch over de ChatGPT hype en de volstrekt ongeschikte toepassingen waar mensen verwachten het allemaal voor te kunnen gebruiken
Kan je een voorbeeld noemen van een totaal ongeschikte toepassing waar mensen het nu voor gebruiken?
Als alternatieve zoekmachine bijvoorbeeld. ChatGPT is slechts een chatbot met wat AI er achter, geen orakel. Het doel is om mensen de indruk te geven met een mens te chatten. Dat komt inclusief ronduit liegen, dingen vergeten, verkeerde conclusies trekken uit beschikbare gegevens en dingen verzinnen als hij het antwoord niet weet (nèt een mens 😃 ). Dat zijn allemaal dingen die het naar mijn idee ongeschikt maken als zoekmachine, het laatste wat je van een zoekmachine wil is een dienst die jou heel overtuigend onzin verkoopt. Van een zoekmachine heb je liever dat ie twijfelt en jou kan vertellen welk bronmateriaal hij heeft gebruikt.

Verder vind ik dit soort dingen erg dubieus: Microsoft uses ChatGPT AI to control flying drones and robot arms
Ik zie chatgpt niet als een zoekmachine maar als een "buddy" waar ik van alles en nog wat kan vragen. Van voorbeeld code die ik vervolgens weer naar mijn wensen en specificaties aanvraag, tot voorbeeld teksten die ik als basis kan gebruiken. En af en toe wat onzinnige vragen om te kijken wat voor antwoord ik krijg, wetende dat het een AI is. Zonder chatgpt zou ik via een zoek machine vrijwel dezelfde vragen stellen en kom ik uit op stackoverflow voor code voorbeelden (waar ik dan de code die ik denk nodig te hebben gebruik) of websites met voorbeeld teksten voor wat ik wil schrijven.

Als ik een zeer concreet antwoord wil, bijvoorbeeld de afstand tussen de aarde en de zon op en bepaalde datum en tijd dan is chatgpt op dit moment niet de bron die ik zou gebruiken. Daar moet je dan weer specialistiche berekeningen op los laten. Pas als je chatgpt voor dit soort concrete vragen kan gebruiken heb je er wat aan wat betrouwbaarheid betreft. Een beetje hetzelfde met de links di je van een zoekmachine krijgt voorgeschoteld. De ene link is dan meer betrouwbaar dan een link die begint met aardeplattheorie.nl om maar een voorbeeld te noemen. Je moet je bronnen altijd controleren.

Als chatgpt direct gekoppeld wordt aan een wiskundig model van NASA of ESA voor het berekenen van afstanden tussen hemellichamen en chatgpt geeft duidelijk aan dat dat de bron is voor de berekening, dan zie ik ook geen probleem. Je hebt antwoord op je vraag en je kan de bron raadplegen bij twijfel.

Het "genereren" van code is overigens niks nieuws, ook niet met behulp van AI en dat wordt al langer toegepast. Ik kan helaas het artikel niet lezen (paywall) maar ik kan me voorstellen dat bij dergelijke acties nog steeds een controle plaatsvindt. Net zoals het gebruiken van een voicecommand: "Bel huppeldepup"...en dan zie je 5 seconden op het scherm staan dat huppeldepup gebeld gaat worden, dat kun je voorkomen als de voicecommand verkeerd begrepen is. Hoe MS dit heeft toegepast voor drones en robot arms is voor mij onbekend.
Dit dus.

Waarom zou ik in dat eerste voorbeeld in godsnaam een langere onzin mail willen typen?

Tijd is niet gratis, zowel voor ontvanger als verzender.
Er is vast wel een AI te vinden die dat plaatje voor je kan genereren.
ChatGPT wordt steeds populairder. In mijn omgeving zie ik steeds meer mensen het gebruiken.
Ik heb het zelf ook geprobeerd, ik vind het wel nuttig. Soms komen er grappige verhalen uit.
Wel grappig dat Apple het goedgekeurd heeft, zonder enkele wijzigingen.

[Reactie gewijzigd door Hamoudi1995 op 24 juli 2024 06:43]

Wel grappig dat Apple het goedgekeurd heeft, zonder enkele wijzigingen.
Jouw definitie van grappig is anders dan die van mij. Ik huil van binnen.
[...]
Jouw definitie van grappig is anders dan die van mij. Ik huil van binnen.
Hoezo dat?
Door de willekeur van big tech en hun invloed op wat jij/wij te zien krijgen of kunnen gebruiken
chargpt vat alle zin en onzin samen van het internet, zin en onzin die wij zelf produceren. big tech maakt dat mogelijk maar het huilen zou moeten gaan over de psychische veranderingen waardoor we (bijna) allemaal exhebitionistische mensjes zijn geworden die letterlijk alles willen delen met iedereen. verslaafd aan likes. Ik kijk er vanaf de zijlijn verbaasd naar.
Weet je dat zeker? Je bent hier zelf je mening aan het delen op Tweakers :+
ik heb totaal geen illusies daarover, en leef in mijn bubbel, net als iedereen. Maar ik heb geen facebook account en heb letterlijk nog nooit op twitter, snapchat, insta en tiktok gekeken. Ik kijk met verbazing naar de drang om alles met iedereen blind te delen. Dus in die zin deel ik niks wat ik zomaar de wereld in stuur. maar ik kom graag op tweakers en gebruik whatsappp. dus ja dat wel
je mening delen als User_1234 is toch wel wat anders dan Jan Janssen, die met de kids op de foto, zijn kleine leventje probeert te glamouriseren voor de likes... kweenie
Op zich is de 'recursie' wel grappig idd. Maar toch is een mening delen niet hetzelfde als 'jezelf' delen. De hang naar 'erkenning' / herkenning heeft iedereen wel - maar meestal niet van onbekende mensen.

Daarnaast is het ook een business model geworden; veel likes/followers => influencer => verkoop van snake-oil of dankzij de sponsoring van het platform heeft men inkomsten.
Ik denk dat hij meer doelt op het feit dat Apple dit even mag/kan bepalen. Of alle Apple gebruikers ChatGPT in een app mogen gebruiken..
--

[Reactie gewijzigd door tw_gotcha op 24 juli 2024 06:43]

Dit is toch niet de eerste keer dat dit aangetoond is?
Ik begrijp eerlijk gezegd niet zo goed waarom de developer de app niet gewoon 16+ of 18+ heeft gemaakt in plaats van 4+. Hoeveel gebruikers zal een email app mislopen als 12-jarigen hem niet kunnen downloaden?
Waarschijnlijk meer kans op promotie (nu trending lijstjes e.d.) en dus meer bekendheid dus meer klikjes, etc…- adult meuk zit toch vaker achter ietwat meer gesloten muren…
Dat is geen vreemde theorie. Ik kan me prima voorstellen dat apps voor 18+ automatisch zijn uitgesloten van trendinglijstjes.
Een gokje maar misschien moet je in een sommige landen legitimeren om een app met leeftijd restricties te downloaden?
YouTube account wou ook al bewijs van mij dat ik een volwassen man ben.
Ongetwijfeld, maar hoeveel potentiële downloads door viftienjarigen loop je als developer mis voor een email app? Het is geen casual game of iets dergelijks.
Wel bijzonder natuurlijk dat je ineens compleet proza van je 4-jarige neefje in de email krijgt... :9
Haha, dadelijk gebruikt iedereen A.I. om een korte berichtjes om te zetten in wollige taal en vervolgens ook weer om die wollige taal weer samen te vatten in een bondig berichtje. Zo maakt A.I. zich echt onmisbaar. Ondertussen is het voor ons meer werk om simpele berichtjes uit te wisselen.
Ik kan hem niet vinden in de App Store of kijk ik verkeerd? Wel een hoop varianten op het origineel.
Ik kan hem niet vinden in de App Store of kijk ik verkeerd? Wel een hoop varianten op het origineel.
Het is niet een app voor ChatGPT maar een mail app met ChatGPT integratie.
Je kunt ook gewoon naar de site gaan.
App stores zijn weinig anders dan bijv. Video On Demand/streaming apps of winkel apps (bol.com e.d) - het blijft een catalogus met ‘producten’ en vanwege het nogal publiekelijk bereikbaar zijn van die dingen moet je het kwetsbare (vul zelf in bij welke doelgroep je die sticker wilt plaatsen) deel van je populatie beschermen…adult spullen (of daar nu wel of geen porn inzit) zitten achter pincodes en accounts wat weer een drempel is dus dat drukt de exposure nogal.

Ik ken het systeem van Apple niet maar aangezien dat in de VS zit is de groep potentieel gekwetsten (en mentaal uitgedaagden met een advocaat :) ) waarschijnlijk vrij stevig en iets minder liberaal als in andere landen - dus die filters staan daar vast iets strakker afgesteld en dat scheelt dus exposure en publiek voor je app. 18+ rating kan je app/site/product gewoon breken want - daar komt tie - massa is kassa :)

Edit: reactie op @Maurits van Baerle

[Reactie gewijzigd door IrBaboon79 op 24 juli 2024 06:43]

Op dit item kan niet meer gereageerd worden.