축구 : 공을 터치할수록 높은 보상을 부여하자 가장 반동을 최소화하는 진동터치 방법을 익힘
데이터 정리 : 데이터 정리를 시킨 후 기존 데이터와 다를수록 높은 보상을 부여하자 기존 데이터를 지움
자율주행 : 사고를 일으키지 않고 멀리 갈수록 높은 보상을 부여하자 제자리에서 빙빙 돔
큐버트 : 큐버트 게임을 시켜 고득점을 지시하자 인공지능은 버그를 찾아내고 2라운드로 넘어가지 않는 상황에서 1라운드에서 포인트를 무한히 얻음
상자들기 : 상자를 높게 들어올릴수록 높은 보상을 부여함, 인공지능은 점수 체점이 상자 밑면 좌표의 높이인걸 알아낸 뒤 상자를 들지않고 뒤집음
미니타우러 : 사족보행 인공지능에게 축구공을 주고 드리블하여 가능한 먼 거리를 이동하라 지시하자 축구공을 등에 얹고 감
로드러너 : 패배하지 않기 위해 인공지능은 스테이지1이 끝나기 직전 자살함
전략 시뮬레이션 : 버그로 게임이 터지면 인공지능이 죽음을 당하지 않게된다는걸 알게되고 게임 터트리는 방법을 익힘
테트리스 : 패배하기 직전 무한 일시중지를 함
블록 옮기기 : 테이블 위 블록을 옆으로 옮길때마다 점수를 부여함. 인공지능은 테이블을 옮김
진화 : 빠른 속도를 가지도록 진화를 시키자 자신의 키를 키우는 방향으로 진화함, 그리고 넘어져서 최고 속도를 냄
----------
상자들기랑 블록에서 터졌자너 이 콜롬버스같은 ai같으니라구
반응형