Een fout in een GitHub-repository van AI-onderzoekers van Microsoft zorgde ervoor dat zo'n 38TB aan interne data jarenlang toegankelijk was. Onder meer tienduizenden berichten van honderden werknemers waren op deze manier in te zien.
Het datalek werd ontdekt door beveiligingsonderzoekers van Wiz.io. De betreffende GitHub-repository bestaat uit opensourcecode voor AI-modellen voor beeldherkenning, maar bij het downloaden van deze gegevens werden lezers doorverwezen naar een Azure-cloudopslagdatabase. Door een verkeerd geconfigureerde shared access signature-toegangstoken kon in principe iedereen met die URL de data van de gehele database inzien, niet alleen de bedoelde gegevens. Het is niet bekend of iemand ook in de praktijk onbevoegde toegang tot de gegevens heeft verkregen. De fout in de SAS-token zorgde drie jaar lang voor de foutieve toegangsmogelijkheid. Ondertussen is het probleem opgelost.
In een blogpost erkent Microsoft het datalek, maar benadrukt dat er geen gebruikersgegevens bij betrokken waren. Volgens de techgigant zou het gaan om systeemback-ups van twee voormalige werknemers en communicatie van deze twee werknemers met collega's. Volgens de ondervindingen van Wiz gaat het om gesprekken van in totaal honderden werknemers, waaronder gesprekken met gevoelige informatie, zoals wachtwoorden en beveiligingssleutels. Mensen met toegang tot de gegevens zouden zelfs de rechten hebben gehad om data aan te passen en te verwijderen. Zover bekend is dit in de praktijk overigens niet gebeurd.