Kineski humanoidni robot izvodi breakdance, radi salto unazad i čučnjeve
OmniXtreme framework omogućava humanoidnim robotima izvođenje niza atletskih pokreta, uključujući salto unazad, Thomasove pokrete i udarce nogama u borilačkim vještinama.
S ovim frameworkom, humanoidi mogu izvršavati više složenih pokreta s visokom stopom uspjeha. On omogućava jednom algoritmu kontrolu više pokreta, značajno poboljšavajući efikasnost treniranja robota s naprednim fizičkim vještinama.
Izvodio je pet uzastopnih Webster salta, duge break dance rutine, naizmjenične čučnjeve, kolut naprijed, leptir udarce i još mnogo toga. Iako su to uglavnom bili plesni pokreti, humanoid je također izvodio sklekove i višestruke kombinacije napada.
Postizanje visoko koordinisanih i dinamičnih pokreta glavni je izazov u robotskoj industriji. Učenje s potkrepljenjem obično se koristi za učenje robota kako izvoditi složene radnje, međutim, kako se broj složenih pokreta povećava, kontrola postaje teža.
OmniXtreme framework je razvijen kako bi se riješio ovaj izazov. Za razliku od tradicionalnih metoda učenja s potkrepljenjem koje se oslanjaju na jednu strategiju od nule, OmniXtreme prihvaća dvostepeni okvir učenja kao strategiju opće namjene.
Uz ovu strategiju humanoidi mogu "izvršavati različite ekstremne pokrete, uključujući uzastopna salta unatrag, ekstremno balansiranje pa čak i breakdance s brzim promjenama oslonca", otkrio je Huang.
Sistem je postigao uspješnost veću od 90 posto u više visokodinamičkih zadataka.
Prva faza je prettreniranje (pre-training), u kojoj se trenira jedinstvena osnovna strategija pomoću metode DAgger-based Flow Matching, kako bi se objedinjeni model naučio različitim obrascima kretanja prikupljenim od više stručnih sistema za praćenje pokreta.
Druga faza je posttreniranje (post-training), a u ovoj fazi osnovna strategija se zamrzava, dok se dodatna (rezidualna) strategija optimizira pod strogim ograničenjima motora, uz opsežnu randomizaciju okruženja i regulaciju sigurnosti potrošnje energije, kako bi se premostio jaz između simulacije i stvarnog svijeta.
Istraživači su proveli i "ablation" studiju, metodu kojom se testira koji dijelovi modela zapravo imaju najveći utjecaj.
U eksperimentima su analizirani različiti elementi sistema, poput regulacije sigurnosti potrošnje energije modeliranja karakteristika motora
Pritom su upoređivani pokazatelji kao što su uspješnost izvođenja dinamičnih pokreta, stabilnost robota, sigurnost i energetsko opterećenje zglobova.
Cijeli pristup pokušava riješiti problem balansiranja između preciznosti pokreta i skalabilnosti sistema. Istraživači vjeruju da bi ova metoda mogla pomoći budućim generacijama humanoidnih robota, jer omogućava općenitije kretanje robota i postavlja temelje za treniranje robota za još složenije vještine.