뇌의 NMDA 수용체 특징 도입한 트랜스포머 모델의 기억 통합 능력 향상

인간의 기억 통합 메커니즘을 모방해 인공지능의 학습 능력을 향상할 수 있다는 연구 결과가 나왔다.

이창준(왼쪽 상단부터 시계방향으로) 단장, 차미영 CI, 권재 박사후연구원, 김동겸 박사후연구원.[IBS 제공]
이창준(왼쪽 상단부터 시계방향으로) 단장, 차미영 CI, 권재 박사후연구원, 김동겸 박사후연구원.[IBS 제공]

기초과학연구원 인지 및 사회성 연구단 이창준 단장과 수리 및 계산 과학 연구단 차미영 CI(Chief Investigator·KAIST 전산학부 교수) 공동 연구팀은 인공지능(AI) 모델이 뇌의 기억 통합 메커니즘과 유사하게 작동한다는 것을 밝히고, 뇌의 해마에서 일어나는 기억 통합의 생물학적 특징을 적용해 인공지능의 효율성을 크게 높일 수 있음을 확인했다.

인공지능의 발전은 2017년 구글에서 개발한 트랜스포머 모델에서 시작됐다. 문장 속 단어와 같은 시계열 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 이 모델은 챗GPT 같은 대규모 언어처리 모델(LLM)의 토대가 됐다.

우리 뇌 변연계에 있는 해마에서는 단기 기억이 장기 기억으로 전환된다. 이러한 기억 통합 과정에서 신경세포에 있는 NMDA 수용체가 중요한 역할을 한다. NMDA 수용체는 뇌의 학습, 기억, 공간 인식과 관련된 신경세포 연결 부위인 시냅스후막에 위치한 수용체다. 

NMDA 수용체는 평소에는 닫혀있다가 글루탐산과 결합할 때만 이온이 지나가는 통로가 되어 신경 연결의 강도를 조절하고 기억 형성에 관여한다. 연구팀은 이처럼 특정 조건에만 통로가 되는 NMDA 수용체의 특징을 모사한 활성화 함수를 개발해 트랜스포머 모델에 적용했다. 

또 해당 모델의 기억 통합 메커니즘을 확인하기 위해 에이전트가 2차원 격자 위에서 경로 탐색을 하도록 작업을 설계했다. 에이전트는 자신의 환경을 인식해 목표를 달성하기 위해 독립적으로 결정하고 행동하도록 프로그래밍된 학습자를 말한다. 

무작위로 움직이는 에이전트에게 다음 장소로 이동할 때 그 곳에 놓인 물체가 무엇인지 맞히게 한다.

트랜스포머 모델에서 뇌 NMDA 수용체의 비선형성 활용(a) 시냅스 후 신경세포의 이온 채널 활동을 나타내는 도식.(b) 트랜스포머 모델 내에서 계산 과정을 나타낸 흐름도.   / IBS
트랜스포머 모델에서 뇌 NMDA 수용체의 비선형성 활용(a) 시냅스 후 신경세포의 이온 채널 활동을 나타내는 도식.(b) 트랜스포머 모델 내에서 계산 과정을 나타낸 흐름도.   / IBS

에이전트가 해당 회차 실험 중 방문한 곳의 물체를 맞히면 단기 기억을, 해당 실험에서 방문하지 않았지만 이전 실험에서 탐색했던 물체를 맞힌다면 장기 기억을 사용한 것이다. 연구팀은 이를 통해 단기 기억이 장기 기억으로 전환되는 메커니즘을 확인했다.

그 결과  NMDA 수용체 특징을 모방한 인공지능 모델은 위치를 인지하는 기능을 형성했고, 기존 모델 대비 기억 통합 능력이 크게 향상됐다. 

이는 트랜스포머 모델에 NMDA 수용체의 비선형성을 도입함으로써 우리 뇌와 유사하게 장기 기억과 공간 표상을 강화할 수 있다는 것을 시사한다.

이창준 단장은 “이번 연구는 인공지능의 성능 향상뿐 아니라 인간의 뇌와 인공지능 간 연결성에 대한 이해를 확장했다는 점에서 중요한 의미가 있다”라며, “뇌의 작동 원리를 더 깊게 이해하는 것을 바탕으로 더 발전된 인공지능 시스템을 개발할 수 있을 것”이라고 전했다.

차미영 CI는 “이번에 개발한 인공지능 모델을 통해 향후 인간과 유사한 방식으로 정보를 처리하고 기억하는 저비용 고성능 인공지능 시스템이 나올 것을 기대해본다”고 말했다.

이번 연구결과는 오는 12월 미국에서 열리는 AI 학술대회 ‘신경정보처리시스템학회(NeurIPS)’에 채택됐다.

저작권자 © 코리아헬스로그 무단전재 및 재배포 금지