Google heeft de code van zijn platform voor het begrip van natuurlijke taal vrijgegeven onder de naam SyntaxNet. Het framework is te gebruiken om taal te analyseren en systemen via machine learning enig begrip te geven waar teksten over gaan.
De opensourcerelease bevat alle code die ontwikkelaars nodig hebben om nieuwe modellen te trainen. Daarnaast is Parsey McParseface onderdeel van de publicatie. Deze parser is al door Google met zijn zelflerende TensorFlow-software getraind en gebruikers kunnen deze inzetten om Engelstalige teksten te analyseren. Volgens Google is Parsey McParseface op dit moment het meest accurate model ter wereld. Google geeft zijn parser vrij zodat onderzoekers en ontwikkelaars deze kunnen gebruiken voor onder andere vertalingen. Google hoopt uiteindelijk tot nieuwe methoden te komen voor kennisverwerving door systemen en begrip van alle talen.
Google is een van de organisaties die flinke stappen hebben gemaakt bij de ontwikkeling van taalbegrip door systemen. Die ontwikkeling is al tientallen jaren gaande, maar is in de afgelopen jaren in een stroomversnelling gekomen door vorderingen op het gebied van machine learning.
Een van de moeilijkheden bij het ontleden is dat de betekenis van menselijke uitdrukkingen vaak ambigu is. Voor mensen vormt dit geen probleem, maar voor computers neemt het aantal combinaties van mogelijke structuren explosief toe. "De meerderheid van deze structuren is onwaarschijnlijk, maar ze zijn niettemin mogelijk en moeten op de een of andere manier uitgesloten worden door de parser", schrijft Google. Het bedrijf zet hier neurale netwerken voor in, waarbij zinnen van links naar rechts worden geanalyseerd. Elke keer geeft SyntaxNet scores aan beslissingen, gebaseerd op waarschijnlijkheid. In plaats van simpelweg de beslissing met de hoogste score te nemen, blijven delen van hypothesen bij elke stap in overweging, totdat er meerdere alternatieve hypothesen hoger op de ranglijst staan.
Begrip van natuurlijke taal speelt onder andere een centrale rol bij persoonlijke assistenten zoals Google Now, Microsofts Cortana, Apples Siri en Amazons Echo. Daarnaast worden de technieken voor taalbegrip ingezet voor chatbots, waar veel ontwikkelaars aan werken en die kunnen inspelen op chatconversaties door relevante diensten aan te bieden op basis van gesprekken.