“바이오뱅크 구축, 희귀질환 진단‧치료 가능성 열 것”

[인터뷰] 고려대 의과대학 의과학과 최정민 교수 “연구비 지원 등 제도적 뒷받침도 필요”

2024-07-20     양현수 기자

대다수의 희귀질환은 유전자 변이에 기인한다. 왜 아픈지, 병명이 무엇인지도 모르고 적절한 치료를 하기도 어려운 희귀질환 환자들에게 유전자 분석, 유전체학 연구는 한줄기 희망이다.

정밀 의학의 핵심인 유전체학 연구는 질병 생물학을 이해하고 혁신적인 치료법을 개발하는 데 필수적이다. 또 유전체학 연구는 차세대 염기서열 분석(Next-Generation Sequencing, NGS) 및 기타 최첨단 유전체학 기술을 사용해 대규모 희귀질환 데이터 분석을 수행함으로써 유전적 변이를 밝혀내고 유전 질환에 대한 이해를 높이는 데 기여한다.

고려대 의과대학 의과학과 최정민 교수 (사진제공: 일루미나)

청년의사는 유전체학 연구와 차세대 염기서열 분석(NGS)이 희귀질환을 이해하고 치료하는 데 미치는 영향을 중심으로, 집단 유전체학 연구의 현재와 유전체학 기술의 미래에 대해 알아보고자 고려대 의과대학 의과학과 최정민 교수를 만났다.

최 교수는 연세대 화학과를 졸업, 메릴랜드대 세포생물학 및 분자유전학과에서 박사 과정을 밟고, 예일대 의과대학 유전학과에서 연구원 생활을 한 유전체학 전문가다.

- 희귀질환 환자가 진단받기까지의 일반적인 진단 여정과 희귀질환 진단에 사용되는 기술을 설명해 달라.

희귀질환은 매우 드문 질환이기 때문에 의사가 이를 접할 기회가 거의 없다. 환자가 본인의 증상이 무엇인지 모르고 작은 규모의 병원에 방문했을 때, 의사도 처음 보는 질환이라 근처의 대학병원으로 보내진다. 대학병원에서도 진단이 어려운 경우에는 서울대병원 같은 대형 의료 기관으로 향하게 된다. 희귀질환은 증상이 어린 나이부터 나타나는 경우가 많아 서울대 어린이병원 희귀질환 센터로 많은 환자들이 모인다. 여기서 진단을 받기도 하지만, 진단을 받지 못하는 경우도 있다. 왜 아픈지조차 모르는 상태가 길게는 10년까지 지속되기도 하는데, 이런 긴 여정은 시간과 비용을 상당히 소모해 환자의 삶의 질을 저하할 뿐만 아니라 환자의 가족과 사회에게도 큰 부담으로 작용한다.

희귀질환의 진단에는 유전자 분석 기술이 많이 사용된다. 사람의 유전체 염기서열 하나하나를 읽어내는 차세대 염기서열 분석(NGS) 기술을 통해 유전변이를 탐색해, 희귀질환 환자에게만 관찰되는 유전자 변이를 찾아내 분자 수준에서 진단한다. 하지만 이 기술로도 30~40%의 환자만이 진단을 받을 수 있으며, 나머지 환자들은 여전히 진단을 받지 못하는 한계가 있다. 이를 보완할 수 있는 추가적인 진단 방법이나 연구가 필요하다.

- 많은 희귀질환이 유전자 변이에 기인하는 만큼 조기 진단이 중요하다. 한국에서는 조기 진단이 어떻게 이뤄지고 있는지, 특히 신생아를 중심으로 설명해 달라.

우리나라에서는 신생아를 대상으로 약 50여 종의 대사 질환에 대한 선별 검사가 이뤄지고 있다. 이 과정에서 필요한 경우 유전자 검사도 함께 진행한다. 이 검사는 특정 유전자가 손상될 경우 발생할 수 있는 유전 질환과 관련된 200여개의 유전자를 대상으로 한다. 또 염색체 모양을 보고 이상 여부를 판단하는 검사도 많이 이뤄진다. 예를 들어, 여성의 경우 X 염색체가 두 개 있어야 하는데 세 개가 있는지, 남성의 경우 Y 염색체가 정상적으로 있는지를 확인하는 경우가 있다. 하지만 이런 검사들이 모든 희귀질환을 포괄하지는 못하기 때문에 선별검사의 확대 및 개선이 단계적으로 이뤄져야 하고 정밀 의료, 데이터 기반 연구 등 다각적인 접근이 필요하다.

- 희귀질환 치료에 있어 ‘진단 방랑’은 여전히 주요 장애물로 남아 있다. 임상 현장에서의 경험과 연구를 바탕으로 ‘진단 방랑’ 문제를 해소하기 위해 어떤 노력이 이뤄지고 있는지, 국내 ‘진단 방랑’ 개선에 어떤 한계가 있는지 설명해 달라.

희귀질환 진단은 매우 어려운 문제다. 희귀질환은 매우 드물기 때문에 일반 의사들이 접하지 못한 경우가 많아 진단이 쉽지 않다. 학교에서도 배우지 않고, 환자를 접했을 때 직접적으로 희귀질환을 처음 보는 경우가 잦아 오진의 위험도 크다. 이러한 문제를 개선하기 위해서는 희귀질환 환자의 사례를 많이 모아야 한다. 환자 코호트를 구축해 두면 선례가 있는 만큼 진단이 쉬워질 수 있다.

또 전문 인력의 양성도 중요하다. 한국에서 희귀질환을 연구하는 의사들은 많지 않다. 국내에서는 암이나 치매와 같은 질환은 많은 관심을 받는 반면, 희귀질환은 상대적으로 연구 인력이 적다. 어떤 사람들은 국민의 세금을 희귀질환 연구에 써야 하는지 의문을 제기하기도 한다. 이러한 인식을 바꿔야 희귀질환의 진단율을 높일 수 있다.

희귀질환은 우리나라같이 작은 나라에서 연구하는 데 한계가 있다. 이를 해결하기 위해 국제 협력이 필요하다. 해외 희귀질환 환자들의 정보를 공유 받고, 한국의 정보를 공유하며 협력하면 진단율을 높이고 환자들의 진단 방랑 기간을 줄일 수 있을 것이다. 국제 미진단 희귀질환 네트워크(UDNI)는 진단되지 않은 희귀질환을 대상으로 진단 및 치료를 위한 연구를 지원하고 기존 연구 기관들을 활용해 네트워크를 구축하고 있다. 올해 9월에는 우리나라에서 국제 학회가 열린다. 이러한 네트워크를 통해 희귀한 환자 사례 정보를 공유하며 희귀질환에 대한 이해도를 높이기 위한 노력이 진행 중이다.

수가 문제나 의료비 문제도 있다. 희귀질환은 수가 문제로 인해 ‘진단 방랑’을 개선하는 데 한계가 있다. 희귀질환 치료제는 높은 약제 가격에도 불구하고 질환이 희귀하기 때문에 의료보험 적용이 어렵다. 암이나 치매 같은 질환에 비해 희귀질환 연구에 할당되는 금액도 적어 연구자가 연구를 진행하는 데 동기 부여를 잃기 쉽다. 국가 차원에서 연구비 지원을 개선할 필요가 있다.

- 최근 일루미나의 집단 유전체학 서밋에서 ‘대규모 한국 희귀질환 데이터 분석을 통한 통찰력’을 주제로 발표를 진행한 바 있다. 해당 연구에 대해 설명해달라. 해당 국내 연구 결과는 국제 희귀질환 데이터 세트와 어떻게 비교될 수 있을까.

‘국가통합 바이오 빅데이터 사업’이 올해부터 본격적으로 시작됐다. 100만명 한국인을 대상으로 '전장 유전체 분석'(Whole Genome Sequencing, WGS)을 진행하는 것이다. 이는 한 사람의 염기서열을 전부 분석하는 대규모 사업이다. 본 사업에 앞서 약 2만5,000명을 대상으로 시범 사업이 진행됐다. 시범 사업에서 분석된 유전체 중 1만 5천 명은 희귀질환 환자였다.

시범 사업의 목적은 본 사업을 실제로 수행할 수 있는 능력을 확인하고 본 사업에서 생길 수 있는 문제점을 미리 파악해, 본 사업이 수월하게 수행될 수 있도록 준비하는 것이다. 희귀질환 환자들의 데이터를 분석해 어떤 유전자의 돌연변이들이 발생하는지, 이러한 돌연변이들이 특정 희귀질환과 어떻게 연관되는지 연구했다. 이 연구를 통해 기존에 진단되지 않았던 환자들을 유전체 분석으로 새롭게 진단할 수 있는 가능성을 확인했다. 시범 사업에서 나타난 한계점을 개선해 본 사업에서는 더 나은 결과를 기대하고 있다.

또 연구 결과를 국제 희귀질환 데이터 세트와 비교해 기존의 연구되지 않았던 비부호화 DNA 영역에서 확인된 희귀 돌연변이가 한국인 특이적인지 인종에 상관없이 관찰되는지를 비교했다. 예를 들면 코딩 영역 이외에서 관찰된 짧은 연쇄 반복(Short Tandem Repeat) 변이가 희귀 뇌질환을 일으키는 병인 기전이 인종 특이적인지, 인종에 상관없이 동일한지를 확인할 수 있는 계기가 됐다. 해당 연구 결과는 논문으로 발표됐으며, 한국 희귀질환 환자들의 데이터를 다른 인종의 유전체 데이터와 비교 분석해, 한국인 특이적인 유전적 특성을 파악하고 더 나아가 희귀질환에 대한 이해를 높이는 것에 기여하고 있다.

- 임상 환경에서 DNA 시퀀싱 및 어레이 기반 기술이 지속적으로 도입 및 적용되고 있다. 차세대 염기서열 분석(NGS) 및 기타 최첨단 유전체 기술이 대규모 데이터 분석을 통해 희귀질환을 이해하는 데 어떻게 기여했는지, 그리고 해당 기술의 어떤 특징이 이러한 발전을 촉진했는지 설명해달라.

기존 연구 방법 대비 차세대 염기서열 분석(NGS) 기술은 희귀질환 연구에 큰 도움이 된다. 희귀질환의 70~80%는 유전자 문제로 발생한다. 따라서 유전자 분석이 매우 중요하며, 특히 돌연변이를 찾는 것이 핵심이다. NGS 기술은 돌연변이를 정확하게 찾을 수 있는 장점이 있어 많이 활용된다. 또 대량으로 신속한 분석이 가능한 점도 희귀질환 연구에 매우 적합하다. 희귀질환은 2,000명 중 1명꼴로 발병한다. 이는 건강한 사람에게는 발견되지 않는 매우 희귀한 돌연변이를 찾아야 한다는 뜻이기도 하다. 이러한 희귀한 돌연변이를 찾기 위해서는 대규모 코호트의 분석이 필요한데, NGS 기술은 많은 수의 샘플에서 데이터를 저비용, 고효율로 생산하는 데 매우 유리하다.

- 올해부터 본격화되는 ‘국가 통합 바이오 빅데이터 구축 사업’은 100만 명 규모의 유전체 정보 등 국민들의 통합 바이오 빅데이터를 구축하는 것을 목표로 하고 있다. 이 데이터베이스 구축이 중요한 이유는 무엇인가.

미국, 중국, 영국, 일본 등 타 국가에서는 이미 대규모 유전체 데이터 뱅크를 구축했다. 한국과 유사하리라고 예상되는 동양인 대상 일본과 중국의 데이터를 사용할 수도 있지만, 역시 한국인의 고유한 유전적 특성을 파악하기 위해서는 한국 자체의 데이터 뱅크가 필요하고 이는 한국인에게 특화된 정밀 의료 발전의 토대가 될 것이다.

지금 한국의 국가 통합 바이오 빅데이터 사업을 통해 만들어내는 유전체 데이터는 전장 유전체 분석을 통해 진행된다. 이는 기존의 단백질 부호화 영역(exome, 엑솜)만을 분석하는 유전체 분석에서 진보된 형태다. 엑솜은 전체 유전체의 약 2%에 불과하며 나머지 98%는 단백질을 만들지 않는 부분으로, 아직 잘 이해되지 못하고 있는 영역이다. 이 98%에 대한 이해를 높이기 위해 대규모 데이터 세트를 만드는 것이 중요하다. 이를 통해서 돌연변이의 빈도를 정확하게 파악해 각 변이의 기능적인 중요성을 추론할 수 있다.

대규모 데이터 세트를 통해 특정 돌연변이가 흔한 지 또는 드문 지를 파악할 수 있으며, 이 정보는 돌연변이의 기능을 이해하는 데 중요한 역할을 한다. 특정 돌연변이가 많은 사람에게 존재한다면 그 돌연변이는 유해하지 않을 가능성이 높다. 반면 매우 드문 돌연변이는 생존에 불리한 기능을 할 가능성이 있다. 이러한 분석을 통해 그동안 잘 이해하지 못했던 비부호화 영역의 돌연변이의 기능을 파악할 수 있으며, 이를 바탕으로 질환을 이해하고 분자 차원에서의 진단을 할 수 있다. 국가 규모의 대규모 유전체 데이터 세트는 희귀질환 치료제 개발의 실마리를 제공하고, 환자의 삶의 질을 향상하는 데 큰 도움이 될 것으로 예상한다.

- ‘바이오뱅크’, ‘바이오 빅데이터’의 구축과 활용에 있어 가장 큰 장벽은 무엇인가.

국가 통합 바이오 빅데이터 사업은 100만 명의 유전체 데이터를 구축하는 것을 목표로 하고 있지만, 유전체 분석은 비용이 높아 전체 인구를 분석하는 것은 현실적으로 어려움이 있다. 현재 계획은 30~40만 명 정도 규모의 유전체 데이터를 만들고, 나머지는 다른 데이터를 기반으로 바이오뱅크를 구축하는 것이다.

분석 데이터의 크기도 중요하지만, 이 데이터를 효율적으로 잘 분석하는 것이 더 중요하다. 대규모 데이터를 분석하려면 높은 컴퓨팅 리소스가 필요한데 한국은 아직 이러한 대규모 데이터를 처리할 인프라가 부족하다. 시범 사업에서 1만 5천 명의 고품질 데이터의 생산이 이뤄졌지만 이를 분석하는 것에는 기술적인 어려움이 있었다. 높은 컴퓨팅 리소스와 함께, 클라우드 컴퓨팅 서비스(AWS, 카카오 클라우드 등)를 활용하는 것이 필요하지만, 사용한 만큼 비용이 발생하는 점과 보안 문제가 아직 검증되지 않았다는 점 등으로 인해 국가 차원에서 즉각적인 활용의 장벽이 있어 해결이 필요하다.

또 개인정보 보호법이 너무 강한 점이 데이터 분석과 공동 연구도 어렵게 만든다. 희귀질환 연구에서는 데이터의 규모가 중요하기 때문에 다른 데이터 세트와 비교 분석하는 공동 연구가 필수적이다. 하지만, 개인정보 보호법 때문에 고품질 유전체 데이터를 폐쇄적인 망 안에서만 사용이 가능해 외부와의 데이터 공유가 어렵다. 외국 같은 경우는 이미 데이터 세트를 전부 클라우드 컴퓨팅 서비스에 올려두는 경우가 많아 공동 연구가 쉬운 반면, 우리나라의 경우 시대의 발전과 역행하는 연구 문화가 만들어져 있다. 그래서 정부 관계자와 함께 여러 학회에서 이러한 정책에 대해 설명도 듣고 연구자 입장에서 개선이 필요한 점들을 계속 피력하고 있다.

대규모 전장 유전체 분석 데이터를 능숙하게 분석할 수 있는 전문 인력도 부족하다. 국가 차원에서 전문 인력을 양성하기 위한 노력이 필요하다고 생각한다. 연구자에게 제공되는 임상 정보도 많이 제한돼 있다는 점도 아쉽다. 환자의 증상에 대해 자세하게 알 수 있다면 다양한 질병 및 증상에 대한 깊이 있는 연구를 하는 데에 도움이 될 것이다.

- ‘바이오뱅크’, ‘바이오 빅데이터’의 구축이 희귀질환 진단에 어떤 영향을 미칠 것으로 예상하는가.

대규모 데이터를 만드는 것은 암이나 복합 질환을 포함한 모든 질환 연구에 큰 도움이 될 것이다. 특히 희귀질환 환자들에게 더 큰 도움이 될 텐데, 이는 빅데이터 분석을 통해 희귀한 유전변이를 정확하게 찾을 수 있기 때문이다. 앞으로 국제 협력을 통해 해결되지 않은 여러 문제를 극복하는 데에도 큰 도움이 될 것으로 기대된다. 지금까지 희귀질환 분석은 단백질이 만들어지는 유전자 부분(약 2%)에서 돌연변이를 찾아 설명하려는 노력이 많았다. 그러나 새로운 대규모 국가 바이오 빅데이터 사업에서는 전장 유전체 분석을 진행해 그동안 보지 못했던 약 98%의 영역을 분석하게 된다. 이를 통해 기존에 진단되지 않았던 약 60%의 희귀질환을 진단할 수 있는 가능성이 커질 것이다.

양질의 대규모 유전체 데이터를 분석하고 풍부한 임상 정보를 결합하여 인공지능 기반의 질병 예측 모델을 개발한다면, 질병의 조기 발견이나 예방 전략을 수립하는 정밀 의학의 실현이 가능해지고 신약 약물 표적을 발굴이 더 수월해질 것으로 판단된다.

- 앞으로 진행할 연구는 무엇인가. 앞으로 희귀질환 진단 및 치료의 방향성이 어떻게 변화할 것으로 예상하는가.

하고 싶은 연구는 상대적으로 간단하다. 현재 진행되는 단백질 부호화 영역 (protein coding region) 연구에서는 유전자에서 단백질을 만드는 부분에 문제가 생겼을 때 어떤 유전자의 기능이 망가지고, 결국 어떤 희귀질환이 생기는지에 대한 흐름은 어느 정도 많이 이해할 수 있다. 그동안 보지 않았던 98%의 비부호화 영역(non-coding region)에서 희귀한 돌연변이를 찾는 작업을 진행하고 있다. 더 중요한 것은 이런 유전자의 돌연변이들이 어떤 결과를 초래하는지, 인간의 건강에 해가 되는지 아니면 크게 문제가 되지 않는지 해석하는 것이다. 아직까지는 이런 이해가 많지 않기 때문에 보수적으로, 진화적인 측면에서 접근하고 있다. 진화적으로 보존이 많이 되어 있는 부분은 중요하기 때문에 여기에 돌연변이가 생기면 인간 건강에 문제가 초래될 것이라고 예상할 수 있다.

또 최근에는 인공지능을 이용해 대규모 데이터 세트에서 희귀한 돌연변이를 분석하고 해석하려고 노력하고 있다. 지금까지는 전장 유전체 기반으로 관찰된 돌연변이를 위주로 희귀질환을 연구해 왔지만, 이런 접근에는 한계가 있다. 돌연변이뿐만 아니라 RNA(전사체), 단백체, 대사체 등을 다양한 종류 데이터 세트를 모아 통합적으로 분석하는 다중 오믹스 접근 방식을 통해 질환의 발병 기전을 더 정확하게 이해하려고 한다. 여기서 국제 협력도 중요하다. 올해 9월 서울대병원에서 국제 미진단 희귀질환 네트워크(UDNI) 학회가 열리는데, 이를 통해 그동안 진단되지 않았던 환자의 증상 및 임상적 특징을 공유하고, 국제적인 협력을 통해 희귀질환의 기전을 더 잘 이해할 수 있는 계기가 될 것으로 예상한다.

앞으로 희귀질환 진단 및 치료에서 NGS가 많이 사용될 것 같다. 예전에는 전장 유전체 분석 비용이 매우 비쌌지만, 지금은 가격이 많이 내려갔다. 미래에는 모든 사람들이 자신의 유전체를 분석하고 이를 병원에서 활용하는 시대가 올 것이다. 신생아의 경우 퇴원 시 전장 유전체 분석을 통해 질환 발생 가능성을 예측하고 예방 조치를 취할 수 있을 것이다. 이는 현재의 질환 발병 및 진단 후 치료하는 방식에서 벗어나, 사전 예측과 예방을 중심으로 하는 패러다임 전환을 의미한다. 또 환자 맞춤형 치료가 중요해질 것이다. 동일한 희귀질환이라도 환자가 가진 유전 변이가 다를 수 있기 때문에, 개별 환자에 맞춘 치료제를 제안하는 것이 필요하다. 이를 통해 더 효과적인 치료가 가능해질 것이다.