Google heeft een versie van Gemini 2.5 Flash beschikbaar gemaakt. Die nieuwe versie van het model is volgens Google voornamelijk efficiënter en goedkoper in gebruik, onder andere omdat het mogelijk is om de redeneercapaciteiten aan en uit te zetten.
Google zegt dat het Gemini 2.5 Flash beschikbaar maakt als previewversie. Gemini is dan beschikbaar via zowel de Gemini-app als via de api in Google AI Studio en Vertex AI, zodat ontwikkelaars het model kunnen inbouwen in hun software. Het Flash-model is een opvolger van Gemini 2.0 Flash dat in december van vorig jaar uitkwam.
Gemini 2.5 Flash heeft volgens Google 'een grote upgrade van zijn redeneermodellen' gekregen In sommige benchmarks, met name die rondom wiskundige en wetenschappelijke vraagstukken zoals de AIME-competitie, maakt versie 2.5 volgens Google grote sprongen. In benchmarks rondom bijvoorbeeld het analyseren van afbeeldingen is de verbetering tegenover versie 2.0 iets minder groot.
Het model heeft daarnaast volgens Google een goede prijs-outputverhouding. Die ligt in de basis wel iets hoger dan voorganger Gemini 2.0 Flash, maar Google zegt dat zowel de input- als outputprijs per miljoen tokens nog steeds lager ligt dan bij veel alternatieve llm's. Dat betekent dat gebruikers minder snel aan een limiet zitten als ze meer tokens verbruiken en dat ontwikkelaars goedkoper uit zijn. Bovendien kan het redeneermodel, dat veel kost per token, handmatig worden in- en uitgeschakeld zodat ontwikkelaars hun kosten kunnen drukken.