Het team van vijf OpenAI-bots die zijn getraind voor het spelen van de game Dota 2, hebben ook hun tweede wedstrijd tegen professionele spelers verloren. Er volgt nog een derde wedstrijd waarin de kunstmatige intelligentie de kans krijgt om revanche te nemen.
De bots van OpenAI Five moesten het in een wedstrijd van 45 minuten afleggen tegen een aantal voormalige Chinese professionele Dota 2-spelers. De kunstmatige intelligentie kwam goed uit de startblokken: ze kwamen wat het aantal kills betreft op een ruime voorsprong van 9-4 en hadden op dat moment meer torens neergehaald.
De Chinese tegenstanders wisten echter meer goud te verzamelen en haalden een paar torens neer toen de bots bezig waren het monster Roshan neer te halen. Na 23 minuten was de stand gelijk op het vlak van het aantal kills en het aantal kapotgemaakte torens. De voorsprong in goud bleek beslissend; het team van professionals wist de wedstrijd daardoor naar zich toe te trekken.
Net zoals in de verloren wedstrijd tegen paiN Gaming was er een duidelijk patroon. De bots bleken weer zeer accuraat in de gevechten, erg goed in het snel reageren op gebeurtenissen die zich voordoen en konden heel goed situaties herkennen waarin ze sterker waren. Maar ze bleken wederom minder goed in staat om situaties te creëren waarin ze de overhand hebben; op tactisch en strategisch vlak leggen ze het nog af tegen professionele spelers.
De programmeurs van OpenAI Five hebben na de verloren wedstrijd tegen paiN Gaming geprobeerd om het beloningssysteem van de bots aan te passen, zo meldt een programmeur tegen The Register. De bots zijn gebouwd om beloningen na te jagen en de grootste beloning is het winnen van de game. Er zijn ook kleinere, tussentijdse beloningen zoals het vellen van een tegenstander of het verkrijgen van goudstukken. De OpenAI-programmeurs hadden de waarde van de kleinere beloningen ietwat teruggeschroefd in de hoop dat de bots zich meer zouden richten op het winnen van de wedstrijd, maar dat bleek nog onvoldoende het geval.
Bij deze twee wedstrijden tegen professionals is een belangrijke beperking verwijderd. Bij eerdere testwedstrijden had elke bot een eigen onkwetsbare koerier voor het brengen van items, maar dat leidde tot een ietwat onrealistische speelstijl waarbij de bots constant veel druk konden zetten, aangezien ze via de koerier steeds regenererende items kregen. Bij normale wedstrijden is er per team slechts een enkele kwetsbare koerier beschikbaar. Dat is nu ook toegepast bij de twee wedstrijden tegen de professionals. De programmeurs denken niet dat deze wijziging heeft bijgedragen aan de nederlagen; ze stellen dat er nog meer training en bugfixes nodig zijn en dat de laatste delen van de gescripte logica uit het model moeten. Er volgt nog een derde wedstrijd tegen professionals.