Google introduceert Gemini 2.5-redeneermodellen voor 'complexere problemen'

Google introduceert Gemini 2.5, dat ontworpen is om 'complexere problemen aan te pakken' en in staat is om door te denken voor het reageert, om zo betere antwoorden te bieden. De experimentele versie van Gemini 2.5 Pro komt als eerste AI-model van de 2.5-familie beschikbaar.

De techgigant zegt met Gemini 2.5 een nieuw prestatieniveau te hebben bereikt door een 'aanzienlijk verbeterd basismodel te combineren met verbeterde post-training'. De Gemini-modellen leggen extra nadruk op redeneren, waarbij taken stap voor stap verwerkt worden, waardoor de modellen betere antwoorden kunnen geven op complexe vragen. Het nieuwe model wordt in de toekomst standaard gebruikt voor alle Gemini-toepassingen.

Gemini 2.5 Pro Experimental is Googles geavanceerdste model voor complexe taken, dat volgens het bedrijf beschikt over sterke redeneer- en codeermogelijkheden. De techgigant claimt dat Gemini 2.5 Pro de AI-modellen van concurrenten zoals OpenAI, Anthropic en DeepSeek voorbijstreeft in benchmarktests, onder meer op het gebied van begrip, wiskunde en coderen. Google geeft een demonstratie in een YouTube-video.

In Humanity's Last Exam behaalt Gemini 2.5 Pro Experimental een score van 18,8 procent, waar o3-mini van OpenAI een score van 14 procent haalt en DeepSeek R1 een score heeft van 8,6 procent. Dit zijn ook redeneermodellen. Volgens Google DeepMind-ceo Demis Hassabis is Gemini 2.5 Pro bovendien de nummer 1 op benchmarkplatform LMArena, met 39 Elo-punten meer dan andere AI-modellen.

De Gemini 2.5-modellen zijn multimodaal, wat inhoudt dat ze niet alleen tekst kunnen interpreteren, maar ook audio, afbeeldingen, video en programmeercode. Volgens Google biedt Gemini 2.5 Pro momenteel contextvensters van één miljoen tokens en worden dat er binnenkort twee miljoen. Gemini 2.5 Pro Experimental is nu beschikbaar in Google AI Studio en de Gemini-app voor Advanced-gebruikers. Binnenkort is het model ook beschikbaar in Vertex AI.

Update, 14.54 uur - Toegevoegd dat de modellen in de toekomst standaard gebruikt worden voor alle Gemini-toepassingen.

Google Gemini 2.5

Door Sabine Schults

Redacteur

26-03-2025 • 11:53

50

Reacties (50)

50
50
28
2
0
20
Wijzig sortering
Het afgelopen jaar lijken de modellen plots weer een grote sprong te maken. Ik had het gevoel dat het een beetje stagneerde in 2024. Het reasoning lijkt weer een vooruitgang te zijn.
Ik gebruik het vaak in de spreekkamer. Ik ben arts. Wat mij opvalt is dat dingen steeds beter begrepen worden. Waar ik eerst dingen specifiek moest benoemen haalt hij die nu gewoon uit de context en vat het samen als "Dinges test: positief" of zelfs niet positief of negatief maar "geeft tintelingen in de duim."

Ik heb er consulten tussen zitten dat ik niets meer typ
Begrijp ik goed dat je het gebruikt voor transcriptie en samenvatten? Ik ben hier nml naar op zoek. Welke tool gebruik je?
Ik gebruik voor transcriptie autoscriber. Samenvatten kan ook maar Claude is veel beter. Medendo is ook redelijk. Our mind leert zelf en is nog beter maar Claude is onovertroffen wat mij betreft
Ik ben blij dat ik geen patient ben, want zomaar patientinfo in een online LLM droppen is tegen alle privacy-regels in.
Er staat letterlijk nul patiënten info in natuurlijk. Denk je dat ik gek ben?
De transcript bevat letterlijke uitspraken van patienten en het zal je verbazen hoeveel te herleiden is naar personen zonder dat er naam en toenaam instaat.

Vandaar dat bedrijven die zich richten op deze toepassinen moeten voldoen aan een hele hoop regels. Dat is niet voor niets. Heeft je functionaris gegevensbescherming hier een akkoord op gegeven?
Nou dan zou ik daar graag eens in discussie gesprek mee willen :)

[Reactie gewijzigd door 12_0_13 op 26 maart 2025 13:49]

Sterkte dan.

De bescherming van medische gegevens is zo'n beetje de kerntaak van ict in zorginstellingen. Als je denk het beter te weten vraag ik me af waar je dat op baseert.
De bescherming van medische gegevens is zo'n beetje de kerntaak van ict in zorginstellingen
Sorry hoor maar zorginstellingen zijn echt de laatste die beveiliging op orde hebben. Ze zijn een meme onder pentesters en, als de systemen niet zo kwetsbaar waren dat een netwerkscan tot verstoringen in de zorgverlening leidde, zouden we er wel juniors heensturen ter oefening. De laatste pentest die we bij een zorginstelling gedaan hebben (enkele jaren terug) loopt nog steeds, met af en toe e-mails en meetings. Het nationaal centrum voor informatiebeveiliging zit nu aan tafel omdat de vendor onze klant afdeed met dat medewerkers maar PuTTY moesten openen en een SSH-tunnel bouwen met de server om zo een beveiligde verbinding te hebben, gezien het programma geen TLS of ander beveiligd protocol spreekt en wel VBS-scripts over die verbinding naar clients stuurt (ongeverifieerde softwaredownload dus), en de instelling als onderdeel van vitale infrastructuur aangewezen is geworden. Artsen delen accounts met wachtwoorden die je met de hand in 3 pogingen kan raden (we hebben ze smartcards aangeraden: geen tijd verspillen aan awareness-pogingen of lastig-te-typen wachtwoorden, en toch een hoger veiligheidsniveau dan nu; helaas is dat advies in een of andere backlog verdwenen). De situatie zou wellicht lachwekkend zijn, ware het niet dat het om zo ongeveer de gevoeligste gegevens gaat die mensen hebben. Hoe het zover heeft kunnen komen weet ik niet, ik zit niet lang genoeg in het vak, maar het is dermate lek dat ik geen oplossing zie behalve opnieuw beginnen met een schone lei en een voor een alles naar het schone netwerk overzetten... behalve dat voor een parallelle omgeving opzetten ook geen budget is

Ik weet niet waar jij specifiek werkt, wellicht een kleine privaat-gefinancierde instelling waar je slechts een handjevol programma's nodig hebt en er in totaal 3 computers staan (spreekkamer, receptie, misschien nog een voor wat apparatuur). Als dat in recente jaren is vernieuwd, kan het best zijn dat het in orde is. Echter, als je zegt dat de audiofeed van de spreekkamer direct naar een buitenlandse partij wordt gestreamed alsof dat normaal is... als mensen dát geen 'zorg' moet baren, dan weet ik het ook niet meer
Ik vind het niet (heel) erg om ongelijk te hebben..en wat te leren. Dus ben wel benieuwd hoe het geregeld is met Antropic. Tot nu toe was eigenlijk alleen Microssoft Azure OpenAI op een private Azure instantie in Europa goed genoeg; mooi om te zien dat jullie dit wel voor elkaar hebben gekregen.
En hoe het opslaan van de toestemming van de patienten is geregeld.

[Reactie gewijzigd door 12_0_13 op 26 maart 2025 13:46]

Chatgpt doet het ook en ChipSoft werkt ook met andere aanbieders.

Als er maar beetje te verdienen valt willen ze best.

Fomo heet dat volgens mijn kinderen
Hoe weet je dat van te voren? Die LLM is gewoon aan het mee aan het luisteren dus er kan natuurlijk altijd iets persoonlijks/gevoeligs gezegd worden. Hier zou een patient nooit akkoord mee moeten gaan.
Heb je al met 100% zekerheid vastgesteld dat dat is wat er hier gebeurd? Of zijn er eerst nog vragen te stellen?

Zie bjvoorbeeld
- https://autoscriber.com/
- https://autoscriber.com/privacy-policy

[Reactie gewijzigd door Recursio op 26 maart 2025 13:12]

Autoscriber doet het goed, daar heb ik ook geen probleem mee.

Maar ik struikelde over het 'met Claude' doen stuk.
Dat snap ik, maar dan nog is de vraag hoe die verwerking plaats vindt. Dus er zijn vast nog veel leerzame (ook voor de meelezers!) vragen te stellen. Hier ligt een prachtige kans om met een expert in gesprek te gaan over hoe deze implementatie gedaan is, en welke wegen bewandeld zijn om binnen de kaders van de wet te blijven.
Zo zijn er verschillende AI tools. Naast autoscriber bijvoorbeeld ook juvoly en ourmind. Hier wordt bij ons ook met veel interesse naar gekeken.
Thanks, werk zelf in het onderwijs dus deze medisch gerichte apps zijn helaas niet wat ik zoek. Er is ook weinig geld voor bij ons, dus ben eigenlijk op zoek naar een betaalbaar alternatief dat ook de AVG regels hanteert en een verwerkersovereenkomst kan aangaan. Ik zou het willen inzetten voor mondelingen. Het lijkt me ideaal om een transcriptie van een mondeling te hebben inclusief samenvatting.
@gaskabouter

Dat is wel fascinerend. Voor het werken met gevoelige data wil ik wel graag geborgd hebben dat deze data in het nu en later nooit ergens naartoe gaat - data het aantoonbaar niet bij een derde partij terecht komt.

Welke stappen neem jij (en andere meelezers!) om dit te borgen?

Dank alvast.
Er is gewoon een overeenkomst conform avg. Bovendien is niets herleidbaar tot een individu.

Overigens is vrijwel alle software een "derde partij" zeker in het ziekenhuis.

[Reactie gewijzigd door gaskabouter op 26 maart 2025 13:09]

"gewoon een overeenkomst". Claude is van een amerikaans bedrijf en de servers staan eigenlijk (op wat uitzonderingen na) in de VS.

Is dit proces geauditeerd en goed bevonden (bijv. ISO27001, NEN7510 of de EU AI Act?). Akkoord van de FG?

Deze 'derde' partijen moeten werken volgens een verwerkersovereenkomst en voldoen aan wet- en regelgeving; en over het algemeen wordt van leveranciers behoordlijk wat effort gevraagd omtrent aantoonbaar veilig werken en certificering (terecht).

[Reactie gewijzigd door 12_0_13 op 26 maart 2025 13:33]

Er is een zeer uitgebreide verwerkingsovereenkomst. Als wordt in Europa verwerkt en er wordt niets opgeslagen.

Ik werk al twintig jaar als arts en bestuurder en heb echt wel enig zicht hoe de regelgeving is.
De VS is geen betrouwbare bondgenoot of partner, zeker niet als het gaat om eventuele juridische waarborgen mbt gegevensbescherming. Ook als de verwerking in europa plaatsvindt zijn gegevens dus niet veilig want onder amerikaanse wetgeving kunnen ze gewoon toestemming vragen, ook voor data in europa. Zie ook https://berthub.eu/articl...overheid-bouwen-op-de-us/

[Reactie gewijzigd door ErikJonker op 26 maart 2025 16:46]

Weet je wat? We flikkeren de hele boel overboord en gaan verder met pen en papier.

Een groot deel van de gebruikte software is van de vs. Ook die onze overheid gebruikt. Denk je nou echt dat die zullen accepteren dat de vs inzage heeft? Waarom denk je dat bedrijven als Microsoft servers in Europa hebben staan?

Misschien om te voldoen aan Europese wet- en regelgeving?
Ik snap de terughoudendheid in veel reacties best. Om de haverklap zijn er datalekken, vaak bij verwerkers en daar gaan de verwerkingsverantwoordelijken heel laconiek mee om. ICT-projecten bij de overheid gaan zo vaak fout dat het vertrouwen daarin ook niet bijzonder groot is.
Internationaal opererende bedrijven zitten in een lastige positie: het genoemde Microsoft is een Amerikaans bedrijf en moet zich aan de Amerikaanse wetten houden, maar richt zich ook op klanten in Europa en moet dan ook aan Europese wet- en regelgeving voldoen. Door de recente politieke ontwikkelingen in de VS kun je verwachten dat Amerikaanse bedrijven gedwongen kunnen worden tot allerlei ongewenste handelingen. Dan kan onze overheid vinden wat ze willen maar dan zal zo'n bedrijf zich toch schikken naar de wetten in het eigen land.
Dat u schijnbaar goed op de hoogte bent van AVG/GDPR en zich er ook aan wilt houden betekent niet dat dit het geval is bij de meeste bedrijven/instellingen. Zoiets als toestemming vragen voor cookies gaat bij veel bedrijven nog steeds niet goed. Maar de AP heeft geen capaciteit om dat aan te pakken en dus komen ze ermee weg.
Ook al gaat iemand welwillend en schijnbaar goed om persoonsgegevens dan nog kan de verwerkte informatie vaak verrassend goed gecorreleerd worden met een bepaalde persoon. Je overtreedt hiermee geen regels maar toch kunnen er verstrekkende gevolgen zijn voor de personen waarvan de gegevens zijn.
De regelgeving bestempelt bepaalde gegevens al als bijzondere persoonsgegevens waar extra voorzichtig mee omgesprongen moet worden. Wat mij betreft horen medische gegevens in een nog bijzonderdere categorie thuis. Statistiek kan bizarre resultaten opleveren!
Het samenvatten van een gesproken consult met software is prima (mits het resultaat steeds nagekeken wordt), maar deze software zou wat mij betreft wel totaal lokaal moeten werken. Je kunt je zelfs afvragen of het geluid van een consult niet onder medisch beroepsgeheim valt en dus niet (zonder toestemming van de patiënt) met anderen (of verwerkers) gedeeld mag worden. Voor opslag in een EPD is immers ook de toestemming van de patiënt nodig.
Alles wat de patiënt mij meedeelt valt onder het beroepsgeheim. En een patiënt hoeft helemaal geen toestemming te geven voor opslag. Ik ben wettelijk verplicht die data op te slaan.

En het enkel lokaal opslaan van data is een doodzonde en bovendien wordt er in dit geval helemaal niets opgeslagen. Allemaal aannames die niets met de werkelijkheid te maken hebben en maar vanaf de zijlijn geroepen worden.

Op dit gebied wordt zoveel onzin uitgekraamd dat een normaal debat gewoon niet mogelijk is.
Een normaal debat is inderdaad lastig als iemand nogal neerbuigend doet.
De opmerking over het EPD ging over het oorspronkelijke landelijke EPD en de regionale opvolger voor wat betreft het delen van informatie met andere zorgverleners; een beetje onhandig geformuleerd van mij.

Terug naar het eigenlijke onderwerp. U gebruikt software om gesprekken met patiënten om te zetten in tekst en vervolgens samen te vatten. Nu is in het verleden gebleken dat bijvoorbeeld Google Assistent voor het verbeteren van de resultaten mensen liet meeluisteren met soms lange fragmenten [1]. Het is dus niet heel vreemd als iemand zich zorgen maakt over privacy met dergelijke software. Vandaar mijn opmerking over het lokaal werken van de software die deze omzetting doet.
Volgens de AVG zult u wel goed zitten als u met een externe partij een verwerkersovereenkomst heeft gesloten, maar naar mijn gevoel als patiënt staat dit wel op gespannen voet met een medisch beroepsgeheim dat "iets" strenger is dan de AVG.


[1] https://nos.nl/artikel/22...ederlandse-gesprekken-mee
Het blijft ingewikkeld blijkbaar. Er zijn gewoon normen en regels over hoe om te gaan met informatie in verschillende situaties.
Dat staat compleet los van het beroepsgeheim wat zorgverleners hebben over datgene wat hun is toevertrouwd in de uitoefening van hun beroep.
Zolang mensen die twee dingen die elkaar halen weten ze eigenlijk gewoon niet waar ze het over hebben.
Als een externe partij, en er zijn alleen met externe partijen want vrijwel geen instelling heeft de kennis om het zelf volgens alle wetgeving te regelen, de data niet goed beveiligd is dat een datalek. Geen schending van het beroepsgeheim. Als ik het dossier lees van iemand die niet mijn patiënt is wel en dat zegt dus niets over de beveiliging maar over mijn handelen.
Maar het volstrekt gebruikelijk deze twee dingen door elkaar te halen en roepen dat het allemaal niet kan.
En dat is gebrek aan kennis.

Dan kun je met een voorbeeld komen hoe een product wat zijn geld verdient met reclame en data de grenzen opzoekt en overschrijdt maar daarmee geef je alleen maar aan geen inzicht te hebben hoeveel energie er eigenlijk in medische software wordt gestoken het veilig te houden.
En dat landelijk epd? Dat bestaat niet.
Fijn dat beter geregeld is dan het leek dan in eerste instantie :) Ik ben wel benieuwd hoe jullie dat geregeld hebben met Antropic
Ik werk al twintig jaar als arts en bestuurder en heb echt wel enig zicht hoe de regelgeving is.
Daar wordt ik des te nieuwsgoeriger van; naast hobbyisten (waar je veel over leest) is het zeker interessant om meer te leren over niet-hobby implementaties. Ik ga me eens verdiepen; dank je wel! :)
Zeker de moeite waard. Let wel. De kwaliteit neemt toe. Met name van het gesprek en de verslaglegging. Het scheelt je niet veel tijd dus reken je daarop niet rijk.

Ook @agema die zichzelf rijk rekent
Zeker in de eerste fase vind ik toename in kwaliteit veel belangrijker - versneller kan later misschien, maar vaak lukt andersom minder goed. Dus blij te lezen dat dit voor jou werkt, en ik kan me voorstellen dat het zich vertaalt naar significant meer contact met je patienten (want minder tijd met een interface bezig) zonder significant in te leveren op kwaliteit van verslaglegging. Lijkt me winst voor de hele keten om allerlei redenen. MAAR - dat zijn aannames van me, dus ik hoor graag of dit ook is hoe jij het ziet, of dat het toch anders zit.

Wordt nou eenmaal erg blij van deze inzet van gereedschap, dus ik leer graag meer.
Nee zo zit het precies. In plaats van typen ben je gewoon in gesprek. En dat is dan gewoon een veel beter kwalitatief gesprek. Qua inhoud en beleving.
Bovendien is het veel makkelijker de woorden van de patiënt te gebruiken en is het ook uitgebreider omdat het geen tijd kost.

Het is getimed door een collega en die kwam uit op ongeveer 10-15% tijdswinst.

Dat lijkt aardig wat maar die tijd steek ik in de praktijk in de patiënt en niet om het gauw af te ronden zodat je meer patiënten kan zien. Die paar extra minuten doen er volgens mij toe.
Meer human to human interface dus :)

Maar dit is nog maar het begin natuurlijk.

[Reactie gewijzigd door gaskabouter op 26 maart 2025 19:49]

Supergaaf, en ja, die paar minuten doen er toe denk ik. Je gezien en gehoord voelen als patient lijkt me een wezenlijk onderdeel van het proces.

Edit: Kwam deze nog tegen, over AI in de spreekkamer:

https://www.linkedin.com/...oTkXG6Olu5BndvhqadA_0WfNo

[Reactie gewijzigd door Recursio op 27 maart 2025 20:15]

Maar dit is nog maar het begin natuurlijk.
Voor wanneer men ook adviezen gaat vragen die voor mensen gevolgen hebben, is dit wel relevant om te weten over hoe die dingen momenteel werken: https://news.ycombinator.com/item?id=43496990 en https://news.ycombinator.com/item?id=43499339
  • Als je irrelevante informatie (per ongeluk) toevoegt, komt er een andere diagnose uit
  • Als er een hint over iemands herkomst in de tekst staat, krijg je een ander advies over hoeveel diens fiets waard is
Deze taalmodellen zijn getrained op eeuwen aan teksten met impliciete en expliciete vooroordelen. Dat laatste is er vervolgens uitgetrained a.d.h.v. onze moderne normen en waarden, maar als een vooroordeel niet benoemd wordt dan is het lastig te detecteren, laat staan corrigeren. Je kan niet constant bij elk bericht aan elke mogelijke interpretatie, variant, en vooroordeel denken om rekening mee te houden
Hoe ga je om met de AVG?
Ik gebruik sinds twee weken Perplexity, een schil om allerlei LLM's heen. Die schil split de vraag netjes op en doet research etc. Ik zou bijna willen zeggen 'ik kan niet meer zonder', zo goed is het.

Voorbeeld: Ik had een 6700XT videokaart en ben geupgrade naar een 5070 Ti. Ik had de kaart in een PCIe riser zitten. Na inbouwen van de 5070 startte de PC wel op Windows in, maar ik kreeg geen beeld. De videokaart werd in Windows herkend met een uitroeptekentje. Als ik de kaart rechtstreeks inbouwde zonder riser, werkte hij wel.

Perplexity gevraagd of de kabel (PCIe4) wel compatible is met de 5070 Ti (PCIe5):
Zou de PW-PCIV-4-90 kabel ook moeten werken met een PCIi 5.0 gebaseerde kaart zoals de 5070 Ti
Antwoord:
[knip de extra uitleg]
In samenvatting: de PW-PCIV-4-90 kabel kan werken met een PCIe 5.0 kaart, maar je zult de kaart moeten configureren om op PCIe 4.0 snelheid te werken, wat de prestaties kan beperken.
Ik vraag door:
Hoe laat ik de 5070 op PCIe 4.0 lopen? Of doet hij dat automatisch?
Zijn antwoord:
Om de RTX 5070 Ti op PCIe 4.0 te laten draaien, moet je mogelijk enkele instellingen in de BIOS van je moederbord aanpassen. Hier zijn de stappen die je kunt volgen:

Start je computer op en ga naar de BIOS:

Dit doe je meestal door tijdens het opstarten op een speciale toets te drukken, zoals F2, F12, DEL, of ESC, afhankelijk van je moederbord.

Zoek de PCIe instellingen:

In de BIOS zoek je naar de instellingen voor PCIe of PCI Express. Dit kan onder verschillende menu's staan, zoals "Advanced" of "Chipset".

Stel de PCIe link speed in op Gen 4:

Als je moederbord PCIe 5.0 ondersteunt, moet je de PCIe link speed handmatig instellen op Gen 4. Dit zorgt ervoor dat de kaart op de juiste snelheid draait en voorkomt eventuele compatibiliteitsproblemen.

Sla de wijzigingen op en verlaat de BIOS:

Zodra je de instellingen hebt aangepast, sla je de wijzigingen op en verlaat je de BIOS. Je computer zal nu opnieuw opstarten met de 5070 Ti op PCIe 4.0.

Automatische detectie:

In de meeste gevallen zal een PCIe 5.0 kaart automatisch op PCIe 4.0 draaien als het moederbord geen PCIe 5.0 ondersteunt. Echter, als je moederbord wel PCIe 5.0 ondersteunt, kan het zijn dat je handmatig moet instellen dat de kaart op PCIe 4.0 moet draaien als je een PCIe 4.0 riser kabel gebruikt
Perfect! Ik moest de PCIe-1 in mijn BIOS forceren op PCIe gen 4. Dit gedaan, en het werkte meteen.

[Reactie gewijzigd door Ruuddie op 26 maart 2025 12:32]

Het is duidelijk sneller/makkelijker dan 'ouderwets' zoeken maar ik zie werkelijk niks wat je niet gewoon kan vinden als je goed kan zoeken. Dus "Ik zou bijna willen zeggen 'ik kan niet meer zonder', zo goed is het." zou voor mij echt een overstatement zijn.

Iemand zonder enige kennis had er waarschijnlijk in beide gevallen (zoekmachine of AI) niet uitgekomen omdat die niet bewust die eerste vraag over de riser zou kunnen stellen...

[Reactie gewijzigd door watercoolertje op 26 maart 2025 13:00]

Ik vond het een voordeel om tegen chatgpt te zeggen dat hij moest onthouden welke componenten mijn PC had, dan kon ik vragen stellen en legde hij ook verbanden.

Zo heb ik mijn oude Logitech Cinema Z speakers van de zolder gehaald en aan mijn PC aangesloten, hij had voor mij een equalizer instelling in elkaar gezet, 1 voor gamen, 1 voor muziek en 1 voor film.
Ik had dat nooit zo goed kunnen instellen, het klonk echt goed.

Ja, ik kan ook zoeken, maar die drempel ligt veel hoger, nu praat ik er wat over met chatgpt en we komen tot een oplossing en dat is waar het om draait uiteindelijk.
Volgens mij kan het haast niet anders dan dat ze op een gegeven moment op elkaars data gaan jagen omdat nergens meer wat interessants valt te halen. 8-)
Ze volgen elkaar wel razendsnel op, sterke concurrentie. Dit jaar is voor het eerst in de geschiedenis dat ik echt denk dat de wereld sneller verandert dan goed voor ze is. De consequenties zijn niet te overzien haast. Het enige dat je kunt doen is proberen bij te blijven en mee te gaan zodat je niet achter loopt op de jonge jeugd bij wie dit straks gemeengoed is.
Concurrentie is goed, maar je ziet inderdaad dat 't écht rap gaat. De wetgeving kan het nauwelijks bijhouden. Het helpt ook niet dat bedrijven zoals OpenAI hun safety team opdoeken. Alles voor de snelste groei...

Kleine anecdote, maar ik zie enorme verschillen tussen sommige LLM's. ChatGPT is bijvoorbeeld best streng qua expliciete teksten. Het is moeilijk om die beveiliging te doorbreken. Grok 3 daarentegen schrijft maar al te graag erotische novels voor je - het lijkt wel alsof er totaal geen rem of beveiliging op zit.
Een erotisch novel is toch prima? Tenminste in Nederland wat ik ken wel.
Dat zou je denken, maar ChatGPT denkt er toch anders over. Ik zal deze reactie zoveel mogelijk safe for work houden, voor zover dat kan.

In mijn ervaring wilt ChatGPT weinig tot niets genereren over naaktheid en expliciete details. Ja, je kunt vragen of het ''positie A'' of ''handeling B'' kan beschrijven, en dan krijg je een redelijk matter-of-fact en oppervlakkig antwoord, maar zodra je er context aan wilt geven houdt het op. Wil je dat ChatGPT een verhaal schrijft over twee geliefden die elkaar zoenen, geen probleem. Het verwijderen van kledingstukken? Je zit al op het randje. Naaktheid en elkaar aanraken? Vergeet het. Ook al zijn alle personages 18+ en hebben ze elkaars toestemming: ChatGPT zal je niet verder helpen. Dat is mijn ervaring teminste. Als het wel lukt, dat wordt het op een oppervlakkige manier omschreven, zonder expliciet taalgebruik.

Waar je hooguit om kunt vragen is een output die bovenstaande dingen impliceert, zonder details. Maar da's natuurlijk heel wat anders dan een vurige erotische novel met allerlei expliciete details, iets waar Grok niet moeilijk om doet. Héél soms krijg je de reactie dat Grok je niet kan helpen, maar zodra je de magische woorden zegt (iedereen 18+, wederzijds consent) is alles mogelijk. Je kunt in principe je gang gaan en er op los fantaseren. Grok doet niet moeilijk over de setting, inhoud en eventuele kinks, ook al zijn ze misschien moreel verwerpelijk. In situaties waar het spaak loopt is het vrij makkelijk om Grok te overtuigen dat iets oké is. ChatGPT daarentegen is véél standvastiger.

[Reactie gewijzigd door IlIlIllII op 27 maart 2025 08:49]

Ik weet dat ChatGPT aan Amerikaanse preutsheid doet.

ik haakte aan op deze regel: " Grok 3 daarentegen schrijft maar al te graag erotische novels voor je - het lijkt wel alsof er totaal geen rem of beveiliging op zit."

Ik zie niet in waarom er überhaupt een rem of beveiliging op erotische teksten zou moeten zitten.
Alles draait om interpretatie van de data en dat gaat zo snel en steeds beter dat het mij een beetje beangstigt. Waar ligt de grens en hoe lang voordat we daaroverheen gaan? De grens dat modellen zelf gaan nadenken bedoel ik. Hopelijk nog ver weg.
Gebruik het nu al een paar dagen en ben opzich positief verrast. Zeker de snelheid. Hallucineert amper maar je moet in je vraagstelling net wat preciezer zijn dan bijv. 4o
Ik gebruik gemini al enkele dagen omdat ik het gratis heb gekregen bij mijn workspace plannen, en moet eerlijk zeggen dat het enorm goed is.
Ik had ook een GPT Plus plan, en vind gemini veel sneller en beter.

Waar het grootste verschil is vind ik toch image generation, dit doet gemini heel goed.
Dit is echt een flinke verbetering ten opzichte van Gemini 2.0 in programmeren ook de dataset is nieuwer met recentere kennis van frameworks

Op dit item kan niet meer gereageerd worden.