딥마인드 AI 고퍼 독해력, 고교생 수준까지 향상

인류가 개발한 인공지능(AI)의 언어 독해력이 고등학생 수준까지 올라온 것으로 나타났다.

구글 모회사 알파벳의 AI 부문 딥마인드는 최근 공식 홈페이지를 통해 차세대 언어 AI 고퍼(Gopher)의 놀랄 만한 독해 능력을 공개했다.

AI 고퍼는 온라인에 탑재된 방대한 양의 텍스트 데이터를 이용해 학습을 거듭했다. 회사가 고퍼에 적용한 초거대 언어 모델은 무려 2800억 파라미터를 자랑한다. 덕분에 고퍼는 기본적인 언어 독해력은 물론 사실 확인(팩트 체크) 능력, 유해한 언어의 특정 및 필터링 등 언어 관련 퍼포먼스가 대폭 향상됐다.

제조상 실수로 호기심을 갖게 된 가사로봇을 다룬 영화의 한 장면. AI의 발달로 사람처럼 생각하는 로봇이 실제 탄생할지도 모른다. <사진=영화 '바이센테니얼 맨' 스틸>

고퍼의 언어 독해력은 고등학생과 어깨를 나란히할 정도로 평가됐다. 생물학을 주제로 대화를 시도한 결과 세포생물학의 기본적 사실부터 단세포 생물의 전문적 명칭, 원핵생물과 진핵생물의 차이와 예시를 술술 대답했다. 축적된 데이터를 단순히 나열하는 데 그치지 않고 정답이 없는 분야, 일테면 현재 연구 중인 카테고리에 대해서는 논란의 여지 등을 언급하는 등 진보된 능력을 보여줬다.

단점도 드러났다. 사람처럼 일부 주제에 대해 편견을 드러내거나 학습 부족으로 오답을 말하면서도 자신만만했다. 대화 자체는 전보다 한층 고도화됐지만 파라미터를 단순히 복잡하게 하고 거대화하는 것만으로는 한계를 드러냈다.

딥마인드는 "사회에 뿌리 내린 생각이나 편견을 그대로 반영하는 등 논리적인 추론이 아직 서툰 편"이라며 "잘못된 정보를 아무렇지 않게 전하는 등 현재 학습 방법으로는 해결할 수 없는 과제가 확인됐다"고 인정했다.

초거대 다중 언어 이해도(MMLU, Massive Multipatask Language Understanding)에 대한 인간 전문가와 AI들의 벤치마크 그래프. 고퍼는 인간다움, 사회과학, 의학, 상식에서 다른 언어 AI GPT-3와 UnifiedQA를 제쳤으나 과학기술과 수학 분야에서는 상대적으로 성능이 떨어졌다. <사진=딥마인드>

이어 "AI가 저지르는 이런 종류의 오류는 반드시 수정이 필요하다"며 "잘못된 정보를 그대로 이용자에게 전하고 믿게 해버릴 위험성이 있기 때문"이라고 덧붙였다.

딥마인드는 향후 언어 AI의 성능 향상을 도모하면서 이번에 부각된 단점을 집중 보완할 계획이다. 현재 딥마인드는 인간의 뇌 신경세포 구조를 본뜬 뉴럴 네트워크(neural network)도 개발하고 있다.

정이안 기자 anglee@sputnik.kr

⇨스푸트니크 네이버포스트 바로가기
⇨스푸트니크 유튜브 채널 바로가기