Deze kunstmatige intelligentie leert robots te lopen door aangepaste hindernisbanen te maken

Deze kunstmatige intelligentie leert robots te lopen door aangepaste hindernisbanen te maken

Door Matthew HutsonJan. 22, 2019, 08:00

Voordat je hindernissen rent, moet je leren kruipen en voordat je William Shakespeare leest, moet je het alfabet kennen. Elke opvoeder kent het belang van een stapsgewijs lesplan voor het beheersen van een taak. Nu hebben onderzoekers van Uber AI Labs een algoritme ontworpen dat een eigen curriculum bedenkt om gesimuleerde robots te leren moeilijk terrein te doorkruisen, zonder plat te vallen op hun gezichtsloze lichamen. Het algoritme kan op een dag zelfs autonome voertuigen helpen reageren in noodsituaties.

Het nieuwe programma, genaamd Paired Open-Ended Trailblazer (POET) komt eerst met een reeks unieke terreinen, elk bewoond door een computergestuurd karakter. Met slechts twee benen en een laserachtige afstandsmeter moet het personage zichzelf leren lopen. Na een periode van oefenen verandert de kunstmatige intelligentie de uitdaging soms waardoor het gemakkelijker en soms moeilijker wordt. Het kan loopgraven breder maken, stronken groter of de grond ongelijker. Af en toe wordt er een andere wandelaar ingeruild om te zien of de vaardigheden die op het ene terrein zijn aangeleerd, op het andere helpen. Dit muteren en uitwisselen van hindernisbanen creëert een onvoorspelbare reeks stapstenen op weg naar behendigheid.

Met behulp van POET konden de robotwandelaars uiteindelijk moeilijk terrein afleggen dat niet kon worden geleerd zonder de eerdere cursussen, melden de onderzoekers in een artikel dat deze maand op arXiv is geplaatst. Wat meer is, POET werkte beter dan een programma dat eenvoudig de moeilijkheidsgraad van het terrein in de loop van de tijd verhoogde, zonder veel indirecte paden te proberen. POET s leerroutes die steeds opnieuw werden beloond. In één voorbeeld liep een bot gehurkt totdat hij een wereld met stompen tegenkwam en moest leren rechtop te lopen; later keerde het terug naar een plattere wereld en bleef rechtop lopen, waardoor de koers sneller dan voorheen werd voltooid.

De onderzoekers zeggen dat POET op een dag echte robots zou kunnen helpen bij het oplossen van veel complexe taken, of zelfs autonome auto's zou leren omgaan met noodsituaties die programmeurs niet hadden overwogen in het lesplan te zetten. Op een open manier zou POET zelfs geheel nieuwe problemen kunnen creëren en oplossen, op het gebied van eiwitsynthese tot poëzie.