Google heeft Gemini 1.5 aangekondigd, de volgende versie van zijn grote taalmodel. Gemini Pro 1.5 kan maximaal een input aan van een miljoen tokens, vier keer zoveel als GPT-4 van concurrent OpenAI. Daarmee kunnen gebruikers veel complexere opdrachten geven.
Gemini 1.5 Pro is volgens Google in staat om in een prompt video’s van 1 uur, codebestanden van 30.000 regels code, of teksten van meer dan 700.000 woorden in één keer te verwerken. Google werkt ook aan een versie die tien miljoen tokens in een keer kan verwerken. Dat kan via Vertex AI: de standaardversie van Gemini 1.5 Pro heeft 128.000 tokens als limiet.
Gemini 1.5 Pro moet verder ongeveer het niveau halen van Gemini 1.0 Ultra, het uitgebreidste model van de vorige generatie. Die kondigde Google in december aan. Een andere nieuwigheid is het gebruik van Mixture-of-Experts-architectuur. Dat bestaat uit meerdere kleinere modellen die ieder 'expert' zijn op een eigen gebied. Afhankelijk van de prompt activeert het taalmodel een of meer van dergelijke experts om de prompt te beantwoorden. Daardoor is het bij veel prompts zuiniger om de prompt te verwerken dan als voor elke prompt het hele taalmodel aan het werk moet.
Gemini 1.5 Pro is vanaf donderdag beschikbaar voor sommige zakelijke klanten. Een release voor alle zakelijke klanten en voor consumenten volgt later, maar Google zegt niet wanneer. De Gemini-software voor telefoons blijft voorlopig draaien op Gemini 1.0, ook de betaalde versie die Gemini Advanced heet.