De Assist-functie van Home Assistant ondersteunt nu text-to-speech en speech-to-text. Daarmee heeft de smarthomesoftware een spraakassistent gekregen. De functie werkt met het Cloud-abonnement of met lokale spraakmodellen.
Het Home Assistant Cloud-abonnement bevat nu text-to-speechdiensten die overweg kunnen met ruim honderddertig talen en de Assist-functie ondersteunen. Home Assistant kondigde Assist in januari dit jaar aan; toen was het nog een chatfunctie om gebruikers smarthomecommando's te laten geven. Gebruikers kunnen dankzij de stemintegratie Home Assistant bijvoorbeeld vragen lampen aan of uit te zetten, of een bepaalde kleur te kiezen. De spraakassistent kan ook vragen beantwoorden, zoals de vraag welke lampen aan staan.
:strip_exif()/i/2005742090.png?f=imagemedium)
De spraakassistent is niet beperkt tot één taal of accent; gebruikers kunnen verschillende spraakassistenten tegelijk laten draaien, om bijvoorbeeld zowel Engelse als Nederlandse commando's te kunnen geven. De spraakassistent kan ook ChatGPT-integratie krijgen. Om het debuggen makkelijker te maken, kunnen gebruikers de laatste tien interacties per spraakassistent terugzien.
Voor gebruikers die liever lokale spraakassistenten gebruiken, introduceert Home Assistant text-to-speech- en speech-to-textmodellen. Piper is een zelfgemaakt text-to-speechmodel dat machinelearning gebruikt en op een Raspberry Pi 4 per seconde verwerkingstijd, twee seconden aan audio kan maken. Op een ongespecificeerde Intel Core i5 zou dit zeventien seconden audio per verwerkingsseconde zijn. Piper ondersteunt veertig talen, waaronder Nederlands en Engels, en is gebaseerd op openbare audiodatasets.
Voor het lokale speech-to-textdeel gebruikt Home Assistant het door OpenAI ontwikkelde Whisper-model. Dit model zou met 200MB geheugen op een Raspberry Pi 4, zeven seconden nodig hebben om een stemcommando te begrijpen. Op een Core i5 zou dit minder dan één seconde duren. Op krachtigere processors zijn daarnaast grotere en nauwkeurige Whisper-versies mogelijk.
Whisper en Piper werken samen door het door Home Assistant gemaakte Wyoming-protocol. ESPHome krijgt ook ondersteuning voor het maken van spraakassistenten. Tot slot krijgt Home Assistant voice-over-IP-ondersteuning, waarmee de spraakassistent overweg kan met voip-telefoontoestellen. Zo kunnen gebruikers 'bellen' met de spraakassistent en hoeft de microfoon dus niet continu aan te staan. Home Assistant gaf eerder aan dit jaar te willen focussen op spraak- en tekstassistenten.