GitHub gaat data van ontwikkelaars die GitHub Copilot gebruiken inzetten voor het trainen en verbeteren van zijn AI‑modellen. Dit omvat input, output, code en meer. Het ontwikkelplatform van Microsoft schakelt dit op 24 april in, maar biedt gebruikers wel de mogelijkheid om zich af te melden.
Gebruikers die eerder in GitHub de opt-out inschakelden voor datavergaring ter verbetering van het product, hoeven nu geen actie te ondernemen. GitHub meldt aan gebruikers dat die instelling behouden blijft en dat data van die gebruikers niet wordt gebruikt voor AI-training. Tenzij ze zelf kiezen om wel mee te doen.
Andere gebruikers worden vanaf 24 april automatisch opgenomen. Hun zogeheten interacties met GitHub Copilot 'kunnen worden gebruikt' voor AI-training en -verbetering. Dit omvat data die zij invoeren in de AI-dienst, output die zij ervan krijgen, codesnippets die zij op het ontwikkelplatform maken, plus bijbehorende contextuele data.
Niet alle gebruikers
Microsoft biedt wel enkele uitzonderingen. De datavergaring geldt voor gebruikers met een gratis account op GitHub Copilot en voor betalende gebruikers met een Pro- of Pro+-account. Gebruikers met een Copilot Business- en Copilot Enterprise-abonnement zijn uitgezonderd, meldt het bedrijf. Volgens de faq van GitHub over deze AI-beleidswijziging zijn studenten en docenten ook uitgezonderd.
In de e-mail aan gebruikers stelt GitHub dat deze nieuwe aanpak in lijn is met 'gevestigde industriestandaarden'. Het gebruik van klantdata moet de AI‑modellen van Microsoft ontwikkelaars beter en contextbewuster laten helpen bij het schrijven van softwarecode. Het bedrijf testte dit eerder al met interactiedata en zag daardoor 'veelbetekenende verbeteringen'. Dit betrof onder meer een hoger acceptatiepercentage van door GitHub Copilot aangeleverde code in meerdere talen door ontwikkelaars.