인간 수준의 경쟁력 있는 로봇 탁구 달성

1 day ago 3

  1. DeepMind 팀은 계층적 정책 구조와 실시간 적응 기술을 활용해 로봇 탁구 에이전트가 아마추어 인간 수준의 경기력을 달성했다고 발표했다.
  2. 이 로봇은 제로샷 시뮬레이션-현실 전이(sim-to-real), 실전 적응, 실제 인간 상대와의 경기 테스트를 통해 검증되었다.
  3. 그 결과, 초보자에겐 100%, 중급자에겐 55%의 승률을 보이며 확실한 중급 인간 수준의 경기력을 입증하였다.

1. 연구 배경과 기여

  • 탁구는 전략성과 고속 운동 제어가 동시에 요구되는 복잡한 스포츠로, 로봇에게 인간 수준의 도전 과제를 제공함.

  • 기존 연구는 단순한 랠리 수행에 머물렀고, 실제 인간과의 경쟁적 경기 플레이는 본 연구가 최초.

  • 본 연구의 기여는 다음과 같음:

    • 계층적 정책 구조(HLC + LLC)
    • 제로샷 sim-to-real 전이 기법
    • 실시간 상대 적응 시스템
    • 29명의 실제 인간 플레이어를 통한 사용자 평가 실험

2. 시스템 구성 및 학습 방법

  • **하위 제어기(LLC)**는 특정 기술(포핸드, 백핸드, 서브 등)에 특화된 정책과 능력 설명자(skill descriptor)를 가짐.
  • **상위 제어기(HLC)**는 경기 상황, 상대 통계, 각 LLC의 특성을 고려해 적절한 기술을 선택함.
  • 훈련 과정은 초기 인간 데이터 → 시뮬레이션 → 실전 적용 → 반복 학습 순으로 진행되며, 이로 인해 자동 커리큘럼 학습 구조가 형성됨.

3. 성능 평가 및 한계 분석

  • 총 29명의 다양한 실력의 인간 플레이어와 경기:

    • 초보자: 100% 승
    • 중급자: 55% 승
    • 상급자 이상: 전패
      → 종합 승률: 45% (경기 기준), 46% (세트 기준)
  • 질적 평가에서 참가자들은 “재미있고 몰입감 있다”고 평가했고, 평균 5분 중 4분 이상을 자발적으로 플레이함.

  • 단점:

    • 언더스핀 처리 미숙
    • 낮은 공 대응 어려움
      → 이는 탁구대와의 충돌 회피 및 스핀 추정의 어려움 때문으로 향후 개선 과제

Read Entire Article