Twitter begint op 5 maart met zijn nieuwe beleid rondom deepfakes. Vanaf die datum kunnen 'synthetische en gemanipuleerde media' worden voorzien van een label en eventueel verwijderd.
Twitter zegt dat het berichten met 'bedrieglijk of misleidend aangepaste of gefabriceerde content' gaat markeren. Het label 'manipulated media' met een uitroepteken wordt bijvoorbeeld toegevoegd aan een aangepaste video in iemands tijdlijn. Er kan dan ook worden doorgeklikt om meer contextinformatie over de video te raadplegen, waarbij via externe bronnen wordt getracht aan te tonen dat de video niet echt is. Ook kan er een waarschuwing in beeld komen als een gebruiker een dergelijke video wil delen en kan de zichtbaarheid van de bewuste video verlaagd worden op het platform. In de meeste gevallen worden al deze handelingen toegepast bij de Twitter-berichten die van een label worden voorzien.
Om vast te stellen of een video of foto is gemanipuleerd, wordt niet alleen gekeken naar audiovisuele aanwijzingen, maar ook naar de manier waarop de media worden gedeeld. Daarbij gaat het onder meer om een eventuele bijbehorende tekstuele uitleg, bijvoorbeeld als de uploader stelt dat het zou gaan om een afbeelding die de realiteit weergeeft. Verder wordt er op metadata, informatie op het profiel van de Twitter-gebruiker en eventuele links in het bericht gelet.
Als er een gerede kans bestaat dat bepaalde content een negatieve impact heeft op de publieke veiligheid of ernstige schade kan veroorzaken, worden de media waarschijnlijk verwijderd. Het gaat dan om bedreigingen voor de publieke veiligheid of aan het adres van een specifieke groepering of persoon. Daarnaast is het risico op massaal geweld of onrust in de samenleving een factor, net als pogingen om iemands vrijheid van meningsuiting onder druk te zetten, bijvoorbeeld pogingen om stemmers tijdens verkiezingen te onderdrukken of intimidatie in het algemeen.