Így tanítják járni a robotokat (videó)

Címkék#ETH Zürich #robot megerősítő tanulása #ANYmail #NVIDIA

Virtuális akadálypályákkal segítenek a valódi robotoknak járni tanulni lépcsőkön, homokon, meredek terepen.

Forrás: ANYmal

Még egy szimulációban is meredek négyezer kutyaszerű robotot látni masírozni. De meglehet, így tudnak a gépek új trükköket elsajátítani.

A virtuális robothadsereget a svájci ETH Zürich és az Nvidia chipgyártó kutatói fejlesztették ki. A mászkáló robotokat arra használták, hogy betanítsanak egy algoritmust, amelyet aztán egy valódi robot lábainak irányítására használtak.

A szimulációban az ANYmal gépeinek lejtőket, lépcsőket és meredek emelkedőket kell lebírniuk egy virtuális tájban. Minden egyes alkalommal, amikor a robot megtanult navigálni egy helyzetben, a kutatók még nehezebbet állítanak elé.

Így ösztönzik az irányító algoritmusát, hogy kifinomultabb legyen.

A videón mintha hangyák serege vonaglana-kapaszkodna egy nagy területen. Az edzés során a robotok elég könnyen elsajátították a lépcsőn fel- és lesétálást; az összetettebb akadályok leküzdése viszont hosszabb időt vett igénybe. A lejtők különösen nehéznek bizonyultak, bár

néhány virtuális robot azt „találta ki”, hogy lecsúszik rajtuk.

A szimulált terepen kapott algoritmust átvitték az ANYmal valódi változatára, egy négylábú, nagyobb kutya méretű, fején érzékelőkkel és levehető robotkarral rendelkező robotra,

az a megszerzett tudásával képes volt igazi lépcsőkön és háztömbökön navigálni, csak nagyobb sebességnél adódtak problémái.

Hasonló „robot-oktatás” segíthetne a gépeknek mindenféle hasznos dolgot megtanulni, a csomagok szortírozásától kezdve a ruhák varrásán át a termények betakarításáig. A projekt azt is mutatja, hogy a szimuláció és az egyedi számítógépes chipek alkalmazása mennyire fontos az alkalmazott mesterséges intelligencia jövőbeli fejlődése szempontjából.

A mesterséges intelligenciát jól lehet alkalmazni a robotok betanítására olyan valós feladatok esetében, amelyeket nem lehet könnyen szoftverbe írni, vagy amelyek megoldása valamilyen alkalmazkodást igényel. A kényelmetlen, csúszós vagy ismeretlen tárgyak megragadásának képessége például nem írható kódsorokba.

A négyezer szimulált robotot úgynevezett megerősítő tanulással képezték ki, ami egy

olyan mesterséges intelligencia-módszer, amelyet az állatok pozitív és negatív visszajelzéseken keresztüli tanulásának kutatásai ihlettek.

Egy algoritmus például folyamatosan értékelte, hogy miként mozgatják a lábukat, az hogyan befolyásolja a járóképességüket, és ennek megfelelően módosította a vezérlő algoritmusokat.

A szimulációk nem a számítógépekben és szerverekben használt általános célú chipeken, hanem az Nvidia speciális AI-chipjein futottak. Ennek eredményeként a robotokat a szokásos idő töredéke alatt tudták betanítani.

A megerősítéses tanulás már évtizedek óta létezik. Még 2015-ben a megerősítő tanulást arra használták, hogy egy számítógép embereket tudjon legyőzni a Go társasjátékban. A közelmúltban a technikát gyakorlati felhasználásra is alkalmazták, többek között a chiptervezés olyan aspektusainak automatizálására, amelyek tapasztalatot és ítélőképességet igényelnek. Csak az volt a gond, hogy az ilyen tanuláshoz rengeteg időre és adatra van szükség.

Az Open AI nevű vállalatnak például több mint 14 napjába telt, mire egy robotkéz számos CPU együttes használatával megtanult egy Rubik-kockát tekergetni. De az, hogy a robot minden egyes újratanítására két hetet kell várni, elriaszthatja a vállalatokat a robotoktól.

Ezt a folyamatot gyorsíthatják fel a szimulációs tanulással, amikor a robotnak nem kell közvetlenül, saját magának tanulnia, hanem egyszerűen „beleteszik”, telepítik az adott tudás algoritmusát.