Onderzoekers zijn erin geslaagd om commando's naar bijvoorbeeld een slimme speaker te sturen door laserlicht op de microfoon te richten, waarna de stemassistent het als geluid en dus een instructie kan opvatten. Dit is mogelijk door een eigenschap van laserlicht en mems-microfoons.
Beveiligingsonderzoeker Takeshi Sugarawa van The University of Electro-Communications uit Tokio en hoogleraar Kevin Fu van de Universiteit van Michigan tonen aan dat ze met laserlicht als het ware kunnen praten tegen elke computer die of elk apparaat dat stemcommando's kan ontvangen. Daarbij gaat het bijvoorbeeld om Google Home-, Amazon Echo- en Facebook Portal-speakers. De 'lichtcommando's' kunnen in theorie vanaf grote afstand worden gericht op deze apparaten, om bijvoorbeeld garages te openen, onlineaankopen te doen, schakelaars om te zetten of via de stemassistent andere ongewenste handelingen uit te voeren. Dit werkt bij Siri, Alexa en Google Assistant.
Deze 'hack' werkt ook als het laserlicht door een ruit gaat. Zolang de laserstraal op de microfoons van bijvoorbeeld slimme speakers, tablets of smartphones wordt gericht, reageren de microfoons onder bepaalde omstandigheden op het licht alsof het geluid is. Het laserlicht wordt dan door de microfoon omgezet in een elektrisch signaal. Dit blijkt op te treden als de intensiteit van het licht wordt aangepast op basis van een specifieke frequentie. Door een elektrisch signaal in de intensiteit van de laserstraal te moduleren, kunnen de microfoons gefopt worden. Dit werkt in theorie bij alle apparaten met mems-microfoons, stellen de onderzoekers. De microfoons werken op licht dat direct op ze wordt gericht.
De onderzoekers hebben hun vondst op zestien verschillende soorten apparaten getest, waarbij onder meer een 60mW-laser werd gebruikt. Bijna alle geteste slimme speakers reageerden op de laserstralen vanaf een afstand van meer dan 50 meter. Bij smartphones werden de signalen pas geregistreerd op kortere afstanden: bij de iPhone XR was dit op tien meter en de Samsung Galaxy S9 en Google Pixel 2 op vijf meter. Bij het gebruik van een 5mW-laser bleken de Google Home en de Echo Plus van de eerste generatie zelfs op een afstand van meer dan 110 meter te reageren. Doordat ramen geen obstakel zijn, is het mogelijk de stemassistenten handelingen te laten uitvoeren door de laser te activeren vanuit een ander gebouw.
Er is geen dure, speciale apparatuur nodig om dit uit te voeren en soms is het zelfs niet nodig om de laserbundel heel precies te richten. Het laserlicht kan zichtbaar zijn, maar de onderzoekers stellen dat het ook mogelijk is om onzichtbaar infraroodlicht in te zetten. Dit hebben ze al geprobeerd op korte afstand en het bleek te werken. Normaal gesproken geven stemassistenten een hoorbare reactie na het geven van een commando, maar volgens de wetenschappers kan een kwaadwillende met deze methode in principe ook een initieel commando geven om het volume omlaag te brengen of bijvoorbeeld de fluistermodus van de Echo-speaker te activeren.
De wetenschappers hebben aangetoond dat het werkt, maar ze hebben zelf geen verklaring voor hoe dit precies kan. Een natuurkundige verklaring hebben ze momenteel niet. Paul Horowitz, een emeritus hoogleraar van de Amerikaanse Harvard-universiteit, zegt tegen Wired dat er twee mechanismen aan ten grondslag kunnen liggen. Allereerst kan het laserlicht de temperatuur doen stijgen, waardoor de lucht uitzet en een drukverschil ontstaat, net als een geluid dat ook doet. Daarnaast kunnen de componenten van de apparaten een rol spelen als ze niet volledig ondoorzichtig zijn. Het laserlicht zou dan voorbij de microfoon kunnen komen en direct op de elektronische chip kunnen vallen, waar trillingen wellicht worden omgezet in een elektrisch signaal. Dit is volgens Horowitz hetzelfde fotovoltaïsche effect dat optreedt in diodes in zonnecellen en aan het uiteinde van glasvezelkabels, waar licht in elektriciteit wordt omgezet.
Het onderzoek is gepubliceerd onder de titel Light Commands: Laser-Based Audio Injection
Attacks on Voice-Controllable Systems.