FT: Google knijpt Gemini-gebruik van Meta af

Google heeft Meta beperkingen opgelegd voor het gebruik van zijn Gemini-AI-modellen. Dat meldt de Financial Times op basis van drie anonieme ingewijden. Meta wilde volgens de krant meer rekenkracht gebruiken dan Google kon leveren.

Google legde de limieten al in maart aan Meta op, stellen de ingewijden. Toen liet Google aan het bedrijf weten dat het niet kon voldoen aan de AI-capaciteit die Meta wilde inkopen. In reactie spoort Meta zijn werknemers aan om efficiënter om te gaan met AI-tokens. Een aantal interne AI-projecten zijn als gevolg daarvan verstoord en vertraagd, schrijft de krant.

Meta is volgens een van de ingewijden niet het enige bedrijf dat getroffen is door de beperkingen van Google. Ook andere organisaties zijn gelimiteerd in hun AI-gebruik bij Google, maar in mindere mate. Het is niet bekend om welke bedrijven het gaat. De limieten treffen vooral Meta, vanwege zijn uitzonderlijk hoge vraag naar de AI-modellen van Google.

'Gemini presteerde beter'

De grote vraag van Meta is opvallend, aangezien het bedrijf zelf de Llama-modellen ontwikkelt en daaraan veel geld uitgeeft. Ingewijden van de Financial Times zeggen dat Meta toch voor Gemini koos omdat deze modellen beter presteerden dan zijn eigen Llama-modellen. Daarnaast is Meta volop bezig om meer datacenters te bouwen voor zijn eigen vraag naar capaciteit.

Meta gebruikt Gemini onder meer om een aantal veiligheidsprocessen te automatiseren. Het gaat bijvoorbeeld om processen die scams tegengaan of schadelijke content offline halen. Ook zet het bedrijf Gemini in voor de klantenservice en de interne workflow.

Maar sinds kort geeft Meta vaker voorrang aan zijn nieuwe Muse Spark-model, dat het in april introduceerde. Spark is het eerste AI-model in de Muse-serie van Meta en is volgens het bedrijf klein en snel. Spark is bovendien in staat om meerdere AI-subagents aan te sturen om prompts sneller en beter uit te voeren. Dat model ligt volgens de ingewijden meer in lijn met Gemini en maakt het bedrijf minder afhankelijk van externe modellen voor bepaalde applicaties.

Gemini icon. Bron: Google

Door Eveline Meijer

Nieuwsredacteur

29-06-2026 • 10:29

23

Submitter: dtn.370

Reacties (23)

Sorteer op:

Weergave:

Is het niet handiger als het zo belangrijk voor Meta is, dat ze dan zoals Apple mee ontwikkelen en daarbij de modellen op hun eigen servers draaien zodat ze zelf hun capaciteit kunnen opschalen waar nodig?
Als je je als bedrijf pas op efficiëntie gaat richten als zich problemen voor doen dan is het bedrijfsmodel nogal opportunistisch. Bijvoorbeeld omdat men genoeg geld heeft en verantwoordelijkheid wil afschuiven. Meta zoekt liever de grenzen op dan dat ze zich verantwoordelijk naar de maatschappij gedragen. Het is eerder beter als er strenge regels komen om dit soort gedrag te beperken dan te verwachten dat het beter is dat Meta gaat samenwerken of zelfs iets gaat doen.
Als ICT zich op efficiency had gericht, dan hadden we nog gewoon met een Pentium IV kunnen blijven werken.
Ook intel heeft bij ontwikkeling rekening moeten houden met belemmerende factoren. Meta verstookt omdat ze geld te veel hebben en zich weinig van anderen aan trekken totdat die belemmeringen opleggen. Dat is een groot verschil.
Zo efficient was een Pentium IV volgens mij helemaal niet. Anyway, LLM's zijn in basis al verschrikkelijk inefficient, maar het maakt echt wel onzettend veel uit hoe jij bijvoorbeeld met je agent werkt. Dat zit hem echt in die homp die zich tussen stoel en monitor bevindt.

Dat merk ik hier al als ik lokaal met AI bezig ben, duidelijk zijn richting de AI, je context window efficient gebruiken, AI niet volplempen met minder relevante zaken, kan al snel een enorme berg tokens schelen om hetzelfde resultaat te bereiken. Dus zo gek is het niet dat Meta vraagt aan mensen zelf wat meer na te denken en slimmer met tokens om te gaan. Kan met dergelijke hoeveelheden echt een ontzettende hoop geld schelen.
Zo efficient was een Pentium IV volgens mij helemaal niet.
Nee, dat was ook niet wat er bedoeld werd, we draaide op fracties van processorkracht al GUI's die de huidige omgevingen bijna evenaren, berekeningen die nu in sommige (modernere) code net zo lang duren en videobewerking.

Niemand is bezig om écht code te optimaliseren. Goed is goed genoeg en als het werkt zijn we al behoorlijk blij.

AI is misschien al wel heel erg geoptimaliseerd, of er is nog heel veel te winnen, ik weet het niet, maar als ik zo om me heen kijk denk ik dat er nog hele slagen te maken zijn, zeker in bestaande codebase.
De GUI was destijds veel sneller dan nu.... Ik weet echt niet waar Microsoft altijd me bezig is.
Wat ik vermoed is dat op dit moment nog niemand, buiten de *echte* hyperscalers en de AI-labs (Microsoft, Amazon, Google, Anthropic, OpenAI) nog echt de massale capaciteit heeft om AI-workloads daadwerkelijk groots te schalen: Dus GPU's ipv. CPU's en massale hoeveelheden RAM.

Het meeste is in de opbouwende fase en komt online als een Megawatt hier, een Megawatt daar. Dat zet nu nog geen zoden aan de dijk. Facebook heeft domweg zelf die compute waarschijnlijk ook gewoon *niet*.

Anthropic heeft bvb. nu een deal met Amazon voor 5 Gigawatt aan compute: https://www.anthropic.com/news/anthropic-amazon-compute.

Vergelijk dat met een datacenter als dat van Musk's xAI in Memphis. Gloednieuw, volgepropt met NVIDIA chips. Die levert 'slechts' zo'n 0,3-0,4 Gigawatt aan compute op.

We zitten dus echt in een "compute" crunch (ook omdat het voor zover we weten onder de kostprijs wordt weggeven) en online krijgen van meer AI compute zal nog enkele jaren (en nog vele miljarden) duren.
Google legde de limieten al in maart aan Meta op, stellen de ingewijden. Toen liet Google aan het bedrijf weten dat het niet kon voldoen aan de AI-capaciteit die Meta wilde inkopen.
Google had toch laatst een contract met SpaceX afgesloten om capaciteit bij ze in te kopen?
Dat was Anthropic. Google hoeft niks. Ze hebben hun eigen hardware en hij hele stack en pipeline zijn fully gefocused op hun eigen verticaal geïntegreerd systeem en eigen chips. Dus ze hebben niks aan die Nvidia spulletjes.
Ik hoop ergens toch snel dat we efficientere AI modellen kunnen bouwen. Zeker voor specifieke toepassingen (zoals code reviews, message reviews, ...) zou een kleiner model toch ook moeten werken ?
Kan ook prima... maar we zitten in een wedstrijd wie het beste / grootste model kan maken.
Niemand die dit gaat winnen door te roepen.. Ons model is lekker licht en klein en doet het prima.

Dit wordt pas een verkoop punt zodra het de gebruikers geld kost.
maar nu krijg je dat Pietje alles in Claude gooit want code is lekker goed en snel, hij merkt de kosten niet zozeer.
Recentelijk presentatie van Google bijgewoond; zit veel in de pijplijn als gaat om flow en agents voor (enterprise)workspace omgeving
Google, ik wil je een tip geven: vertrouw meta helemaal niet. Ik denk dat Meta je rekenkracht wil misbruiken.

[Reactie gewijzigd door Dark Angel 58 op 29 juni 2026 11:10]

Eat your own dog food Meta...
1 van de grootste server/datacenter boeren op deze planeet heeft niet voldoende capaciteit om haar klanten van een deftige hoeveelheid LLM capaciteit te voorzien?

Ondertussen wordt de bubbel verder opgeblazen door er meer geld in te pompen. Terwijl de capaciteit niet eens beschikbaar is om die LLM's fatsoenlijk te benutten. Ondertussen worden we wel doodgegooit met de LLM marketings nieuwsartikelen in een poging de bubbel verder te laten opblazen

Die geheugenprijzen gaan nooit meer naar beneden komen ;(

Hoe dan ook, we worden allemaal *knip* door deze bubbel en we zullen hoe dan ook de prijs betalen. Die biljoenen moeten terugverdient worden.
Admin-edit:- knip -
Onfatsoenlijk stuk tekst verwijderd.

[Reactie gewijzigd door Dirk op 29 juni 2026 19:33]

Maar nu een tekort is misschien nog niet heel slecht, door het tekort mogen er dus minder tokens gebruikt worden, en wordt er meer nagedacht over efficiëntie. De hoeveelheid CPU/RAM er nodig is voor AI is absurd, en zeer kostbaar, dus efficiëntie en optimalisatie van models/taken/tokens t.o.v. CPU/RAM/stroom verbruik is ook veel waard.

Niet dat het snel voor lagere prijzen voor ons als consumenten zal zorgen, en ik ben er bang voor, maar hopelijk komt er wel snel een einde aan de exponentiële groei van AI hardware/stroom kosten met een paar jaar.
en wordt er meer nagedacht over efficiëntie.
Ja maar...
De hoeveelheid CPU/RAM er nodig is voor AI is absurd, en zeer kostbaar, dus efficiëntie en optimalisatie van models/taken/tokens t.o.v. CPU/RAM/stroom verbruik is ook veel waard.
Dan wil men meer en meer, want als de efficiëntie beter wordt, smijt men er nog meer rekenkracht tegen aan omdat "het kan".

Bij wijze van (volgende is een voorbeeld), "deze berekening kost nu 500 watt", men maakt het efficiënter en dan "kost deze berekening 250 watt".

Maar... ik "kan nu 2!! berekeningen maken als ik 500 watt gebruik", en als ik "1000 watt tegen aan smijt, heb ik er zelfs 4!!".

Never ending story, betere efficiëntie is absoluut een goed iets, maar de probleem van AI is niet alleen het verbruik, maar de bedrijven en mensen erachter die steeds meer en meer willen (qua berekeningen, investeringen, geld ect) kostte wat het kost (inclusief milieu, maar ook mensen zelf als dat een optie is).

Het gaat zo door tot iets (of iemand = bedrijf) het stopt, de AI bubbel die knapt zou het meest effectief zijn natuurlijk, zeker op langere termijn.

De klap in het gezicht komt er hoe dan ook, of die bubbel knapt, of omdat het geld, milieu, investeringen ect gewoon op zijn.

[Reactie gewijzigd door Mizgala28 op 29 juni 2026 11:52]

Nouja als die efficienttslag ook voor lokale modellen gebeurd zou dat mooi zijn. Ik zie in de toekomst toch wel meer lokale llms als deze goed genoeg zijn, zonder tokens limits etc
Exact. Dit heeft natuurlijk alles te maken met het feit dat de rek uit de mens is. Je hoort de "boomers" wel eens zeggen dat de huidige jongere generaties echt niet zouden overleven in de jaren 50. Maar diezelfde boomers zouden compleet imploderen als ze als jongere verplaatst werden naar de huidige maatschappij. Er is zoveel meer druk, snelheid, verwwachting, etc. Het is niet voor niks dat werknemers in Silicon Valley massaal aan de microdosing zijn gegaan om maar langer en sneller te kunnen werken. En eens houdt het op, maar "de economie" wil door.

Om te kunnen reageren moet je ingelogd zijn