서울대학교 마틴 스타이네거 연구팀과 괴팅겐 막스 플랑크 연구소는 검색 시간을 몇 달에서 몇 초로 단축시킨 단백질 검색 시스템 '폴드시크{Foldseek)'를 개발했다고 밝혔다.

오픈 소스 사이트에 무료 공개된 폴드시크 / GitHub
오픈 소스 사이트에 무료 공개된 폴드시크 / GitHub

단백질의 구조를 밝히는 것은 신약 개발이나 생물학 연구에서 필수적이며 원하는 구조의 단백질을 만드는 방법이 활발하게 연구되고 있다.

하지만 기존의 방법으로는 2억 개 이상의 단백질 구조를 포함하는 방대한 데이터베이스 전체를 탐색하는 데는 몇 달이 걸린다.

이런 계산 속도문제를 해결하기 위해 서울대학교 마틴 스타이네거 연구팀과 괴팅겐 막스 플랑크 연구소는 새로운 단백질 구조 검색 도구를 개발했다.

연구팀은 단백질이 아미노산 사슬이 접혀서 안정화된 3차원 구조를 이루게 되는데 착안해 그 3차원 구조를 하나의 서열로 표현해내는 방법을 개발했다.

이어 단백질의 3차원 구조 속에서 각 아미노산이 주변 아미노산과 가지는 위치 관계들을 스무개의 특정한 패턴을 기준으로 나눈 뒤 각 집합에 구조 알파벳을 부여했다.

그런 다음, 단백질의 아미노산 서열을 구조 알파벳의 서열로 변환하여 단백질의 구조를 담은 서열을 얻어냈다.

연구팀은 이렇게 얻은 구조를 담은 서열을 초고속 서열 검색 도구로 비교하여 3D 구조를 직접 비교하는 것보다 훨씬 빠른 속도를 달성했다.

연구팀은 "Foldseek의 빠른 속도와 우수한 민감도는 메타 유전체학, 분자 의학 및 환경 유전체학과 같은 분야에 영향을 미칠 것으로 보이며, 연구 목적에 맞게 조정 가능한 사용자 정의 워크플로우를 만들 수 있어 향후 구조 기반 단백질 분석에 있어 중요한 도구가 될 것으로 기대된다"고 전했다.

이번 연구결과는 국제학술지 'Nature Biotechnology'에 게재됐다.

저작권자 © 코리아헬스로그 무단전재 및 재배포 금지