Google heeft op zijn Compute Engine-platform de zogeheten Autoscaling-functionaliteit geactiveerd. Dit mechanisme kan op basis van diverse parameters, zoals het aantal requests, virtuele machines snel in- en uitschakelen. Volgens Google kan dit kostenbesparingen opleveren.
De Compute Engine Autoscaler detecteert de vraag naar bijvoorbeeld een website aan de hand van diverse parameters. Zo kan het kijken naar de cpu-belasting van een groep beschikbare instances, virtuele machines binnen het Compute Engine-platform. Tevens kan de Autoscaler het aantal queries per seconde opvragen van http-loadbalancers. Deze informatie laat de Autoscaler bij grote drukte extra instances activeren, terwijl in daluren juist het aantal actieve instances dynamisch kan worden verminderd.
Volgens Google kiest Autoscaler ook op basis van andere parameters het optimale aantal instances. Zo wordt er ook gekeken vanaf welke locatie internetgebruikers informatie opvragen. Dit mechanisme zou een plotse piek in verkeer beter kunnen opvangen. Google claimt dat de Autoscaler in staat is om vanuit een scenario met vrijwel geen enkele http-request voldoende instances te activeren om te voldoen aan een piekvraag van 1,5 miljoen queries per seconde.
De Autoscaler biedt de Compute Engine-gebruiker volgens de internetgigant niet alleen de mogelijkheid om drukke en rustige periodes beter te ondervangen, ook zou het kunnen zorgen voor aanzienlijke kostenbesparingen. De mogelijke besparingen zijn deels afhankelijk van de instellingen die de gebruiker kiest in zijn beheerconsole.
De nieuwe functionaliteit wordt door Google voorlopig onder een bètalabel aan klanten aangeboden. Hierdoor valt het gebruik van de Autoscaler niet onder eventuele sla's die zijn afgesloten. Ook kan Google wijzigingen in de Autoscaler-api aanbrengen die mogelijk niet compatibel zijn met de huidige implementatie.