
ΠΠΎΠΌΠ°Π½Π΄Π° ΡΡΡΠ΄Π΅Π½ΡΠΎΠ² University of British Columbia (Hudson Nock ΠΈ ΠΊΠΎΠ»Π»Π΅Π³ΠΈ) ΡΠΎΠ·Π΄Π°Π»Π° AI-ΡΠΎΠ±ΠΎΡΠ° Π΄Π»Ρ Π°ΡΡΠΎΡ ΠΎΠΊΠΊΠ΅Ρ Π·Π° 2 Π³ΠΎΠ΄Π° ΡΠ°Π±ΠΎΡΡ Π½Π°Π΄ capstone project. Π£Π½ΠΈΠΊΠ°Π»ΡΠ½ΠΎΡΡΡ Π² ΡΠΎΠΌ, ΡΡΠΎ AI ΠΎΠ±ΡΡΠ°Π»ΡΡ ΠΏΠΎΠ»Π½ΠΎΡΡΡΡ Π² ΡΠΈΠΌΡΠ»ΡΡΠΈΠΈ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠΌ reinforcement learning (Soft Actor-Critic) ΠΈ Π±ΡΠ» ΠΏΠ΅ΡΠ΅Π½Π΅ΡΡΠ½ Π½Π° ΡΠΈΠ·ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΡΠΎΠ» Π±Π΅Π· Π΄ΠΎΠΎΠ±ΡΡΠ΅Π½ΠΈΡ (zero-shot transfer). Π ΠΎΠ±ΠΎΡ ΠΏΠΎΠ±Π΅ΠΆΠ΄Π°Π΅Ρ Π»ΡΠ΄Π΅ΠΉ, Ρ ΠΎΡΡ Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ ΡΡΠ΅Π½ΠΈΡΠΎΠ²Π°Π»ΡΡ Π½Π° ΡΠ΅Π°Π»ΡΠ½ΠΎΠΌ ΡΡΠΎΠ»Π΅. ΠΠΎΠΌΠ°Π½Π΄Π° ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π»Π° domain randomization β ΡΠΈΠΌΡΠ»ΠΈΡΠΎΠ²Π°Π»Π° Π½Π΅ΡΠΎΠ²Π½ΠΎΡΡΠΈ ΡΡΠΎΠ»Π°, Π·Π°Π΄Π΅ΡΠΆΠΊΠΈ ΠΊΠ°ΠΌΠ΅ΡΡ, Π²ΠΈΠ±ΡΠ°ΡΠΈΠΈ, ΡΡΠΎΠ±Ρ AI ΡΡΠΈΠ»ΡΡ ΠΎΠΆΠΈΠ΄Π°ΡΡ Π½Π΅ΠΎΠΆΠΈΠ΄Π°Π½Π½ΠΎΠ³ΠΎ. overhead-ΠΊΠ°ΠΌΠ΅ΡΠ° 120 fps Ρ retroreflective ΡΠ°ΠΉΠ±ΠΎΠΉ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠΈΠ²Π°Π΅Ρ ΡΠΎΡΠ½ΠΎΠ΅ ΠΎΡΡΠ»Π΅ΠΆΠΈΠ²Π°Π½ΠΈΠ΅.
ΠΠ»Ρ ΠΈΠ½Π΄ΡΡΡΡΠΈΠΈ ΡΡΠΎ ΠΏΡΠΎΡΡΠ² Π² sim-to-real transfer: ΡΠΎΠ±ΠΎΡΡ ΠΌΠΎΠ³ΡΡ ΠΎΠ±ΡΡΠ°ΡΡΡΡ ΡΠ»ΠΎΠΆΠ½ΡΠΌ Π΄ΠΈΠ½Π°ΠΌΠΈΡΠ΅ΡΠΊΠΈΠΌ Π·Π°Π΄Π°ΡΠ°ΠΌ Π±Π΅Π· ΠΈΠ·Π½ΠΎΡΠ° ΠΆΠ΅Π»Π΅Π·Π° ΠΈ ΡΡΡΡΡ ΡΠ°ΡΠΎΠ² ΡΠ΅Π°Π»ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. Π’ΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½ΡΠ΅ ΠΏΠΎΠ΄Ρ ΠΎΠ΄Ρ (Unity, Unreal) Π·Π°ΠΌΠ΅Π½ΠΈΠ»ΠΈ Π½Π° soft actor-critic Π΄Π»Ρ ΡΡΠΊΠΎΡΠ΅Π½ΠΈΡ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ. ΠΡΠ»ΠΈ AI ΠΎΡΠ²ΠΎΠΈΠ» Π°ΡΡΠΎΡ ΠΎΠΊΠΊΠ΅ΠΉ β ΡΠ»Π΅Π΄ΡΡΡΠΈΠΉ ΡΠ°Π³ Π°Π²ΡΠΎΠ½ΠΎΠΌΠ½ΡΠ΅ Π΄ΡΠΎΠ½Ρ, Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ ΠΈ ΠΌΠ°Π½ΠΈΠΏΡΠ»ΡΡΠΎΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΡΠ°ΡΡΡ Π² ΡΠΈΠΌΡΠ»ΡΡΠΈΠΈ, Π° ΡΠ°Π±ΠΎΡΠ°ΡΡ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΡΡΠΈ Π±Π΅Π· ΡΠΎΠ½ΠΊΠΎΠΉ Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ.
π± ΠΠ΅ΠΉΡΠΎΠ½ΡΡ: ΠΡΠΎΠ³ΡΠ΅ΡΡ, ΠΊΠΎΡΠΎΡΡΠΉ Π½Π°ΠΌ Π½ΡΠΆΠ΅Π½ Π΄Π»Ρ Π°Π²ΡΠΎΠ½ΠΎΠΌΠ½ΡΡ ΡΠΈΡΡΠ΅ΠΌ. ΠΠ΄ΡΠΌ open-source ΠΊΠΎΠ΄!
