대규모 언어 모델(LLM)을 이용해 로봇 학습 속도를 올리는 기술이 미국 대학들과 소프트웨어 업체 공동 연구팀에 의해 개발됐다. 로봇의 학습 속도가 비약적으로 빨라지는 것은 물론, 어려운 동작도 보다 쉽게 구현해 관심을 모았다.
엔비디아와 미국 펜실베이니아대학교, 텍사스대학교 오스틴 등이 참여한 연구팀은 6일 각 공식 채널에 실험 보고서를 내고 로봇 학습 기술 닥터 유레카(Dr Eureka)를 소개했다.
닥터 유레카는 로봇에 새로운 기술을 가르칠 때 우선 시뮬레이션 환경에서 트레이닝하고 그 후 현실 환경에 적용하는 기존 모델과 다르다. 로봇 훈련 시 시뮬레이션 환경과 현실의 괴리 탓에 벌어지는 오류 및 교육 속도 저하를 해결하기 위해 연구팀은 LLM을 적용했다.
연구팀 관계자는 "닥터 유레카 기술의 토대는 엔비디아가 개발한 인공지능(AI) 에이전트 유레카"라며 "유레카는 로봇을 훈련하기 위한 보상 알고리즘을 자율적으로 만드는데, 여기에 LLM까지 추가하면서 로봇을 위한 최적의 보상 함수를 빠르게 만들 수 있다"고 전했다.
이 관계자는 "닥터 유레카를 이용해 로봇 개에 사족보행 기술을 훈련시키는 실험에서 인간이 설계한 기존 시스템보다 전진 속도는 34% 빨라졌고 다양한 지형의 이동 거리는 20% 늘었다"며 "로봇 손으로 큐브를 회전하는 작업의 경우 닥터 유레카로 훈련하자 무려 300% 효율적이었다"고 말했다.
연구팀은 닥터 유레카가 로봇의 기능을 극한까지 끌어내는 고난도 동작도 쉽고 빠르게 가르친다고 강조했다. 실제로 닥터 유레카에 훈련받은 사족보행 로봇 개는 기존 기술로 트레이닝한 로봇 개보다 훨씬 짧은 시간에 안정적으로 짐볼 위에서 균형을 잡았다.
정이안 기자 anglee@sputnik.kr