Waarom stinkt AI naar bepaalde videogames? Onderzoekers maakten een keer mevrouw Pac-Man om erachter te komen

ArcadeImages / Alamy Stock Photo

Waarom stinkt AI naar bepaalde videogames? Onderzoekers maakten een keer mevrouw Pac-Man om erachter te komen

Door Matthew HutsonAug. 17, 2018, 13:30 uur

STOCKHOLM— Kunstmatige intelligentie (AI) kan een kick geven in games zoals Pong en Space Invaders, maar het komt los als een gewone n00b bij het spelen van mevrouw Pac-Man (foto). Nu, door AI zes klassieke arcade-spellen te laten spelen, zijn onderzoekers dichter bij het uitzoeken waarom denkmachines uitblinken in sommige spellen en naar andere stinken, meldden ze vorige maand op de Internationale Conferentie over Machine Learning hier.

Het team ontwikkelde een nieuw systeem om te visualiseren hoe Atari-playing AI's werken. Ze kozen Atari omdat de games relatief eenvoudig zijn en een frequente focus zijn voor onderzoekers die algoritmen voor 'versterkend leren' ontwikkelen, AI's die gedrag leren door vallen en opstaan. Een AI 'ziet' het scherm (als een invoer van enen en nullen) en reageert aanvankelijk willekeurig met opdrachten voor 'links', 'rechts', 'vuur', enzovoort, langzaam zijn strategie vormgevend terwijl het punten ontvangt voor bepaalde acties. In Space Invaders beweegt de AI een schip heen en weer over de onderkant van een scherm terwijl hij neergaande aliens schiet en zijn projectielen ontwijkt.

Na duizenden oefenwedstrijden kan een AI het beste menselijke optreden bij Space Invaders . Om de strategie te begrijpen, vervaagde het team kleine delen van het scherm, waardoor het schip of buitenaardse wezens of projectielen of schilden of lege ruimte werden verdoezeld. Als het vervagen van een sectie een AI heeft weggegooid, moet de AI veel aandacht hebben besteed aan dat deel van het scherm. Het systeem maakt vervolgens 'saliency maps', video's waarbij de meest kritieke schermgebieden worden gemarkeerd met gekleurde vlekken, zodat een waarnemer kan zien waar de game-AI zich op focust.

De onderzoekers wisten dat een AI die Space Invaders speelde zijn geweer op inkomende aliens leek te richten, maar ze wisten niet of het geweervuur ​​op clusters van aliens spoot of op individuele doelen mikte. Uit de saliency-kaarten bleek dat de AI specifieke aliens volgt, meldde het team van de Oregon State University in Corvallis. (Bekijk de rode vlek linksboven in de video hieronder.)

Je geeft misschien niet om de strategieën van een AI bij Atari-games, maar het systeem kan ooit worden gebruikt om te benadrukken hoe andere algoritmen de wereld zien en daarop reageren. Waarop richt een autonome auto zich wanneer hij van rijstrook verandert? Hoe zoekt een thuiszorgrobot naar een pillenfles?

De saliency-kaarten helpen ook bij het opsporen van fouten. In één voorbeeld kun je zien dat een AI die mevrouw Pac-Man speelt - waarin een geel personage pellets in een doolhof moet eten terwijl ze geesten vermijden - faalt omdat het geen aandacht aan de geesten besteedt. Als een auto of robot zijn werk niet goed doet, wil je weten wat hij mist, zodat je hem beter kunt trainen. Een robot leren vrezen voor spoken is een ander probleem.