공통데이터 모델 활용한 분산연구망 '오딧세이', 개인정보 이슈 넘고 데이터 장벽 파괴
박래웅 교수 "기관이 데이터 권한 갖고 수백만명 데이터를 경제성 평가 등에 활용"

# 한국 모 대학병원의 A교수는 환자들을 진료하면서 B라는 약이 허가 주의사항이나 임상시험에선 없던 부작용이 종종 발견되는 걸 확인하고 “혹시 B약이 임상시험 과정에선 드러나지 않았던 부작용이 있는 게 아닐까”라는 생각을 하게 됐다. A교수는 이러한 의문을 직접 확인해보고자 연구를 설계한 뒤, 이를 전세계 의료기관의 전자 의무기록을 공통모델로 익명화-표준화해서 분석결과를 연구에 활용하는 비영리 국제연구네트워크 ‘오딧세이’(Observation Health Data Sciences and informatics, OHDSI)에 올렸다. 이후 A교수의 연구에 관심을 보인 유럽, 일본, 미국 등의 연구자들이 해당 연구에 참여하겠다는 의사를 밝히고, 자신의 의료기관에서 보유한 B약 관련 환자 데이터를 A교수의 연구설계대로 대입하고 그 결과를 A교수에게 보내줬다. 이렇게 각국 의료기관에서 보내 온 환자 데이터가 수백만명 분량이었다. A교수는 이를 통합 분석해 관련 학술지에 발표키로 했다.

이처럼 전세계 보건의료 분야 연구자들이 실제 환자 진료 기록을 보다 손쉽게 확보해 연구에 활용할 수 있는 길이 열렸다.

오딧세이가 이를 가능케 한 것이다. 오딧세이는 보건의료 빅데이터 관련 국제적으로 가장 많이 사용되는 오몹(OMOP) 공통데이터모델을 활용해 ‘분산연구망’을 갖췄다. 현재 국내 30여개 대학병원을 포함한 전세계 200개 이상의 기관이 오딧세이에 참여하고 있는데, 이로 인해 공통데이터 모델로 변환된 임상 데이터가 20억명분이 넘는다. 이를 통해 과거 보다 빠르게 신뢰도 높은 임상 데이터를 대규모로 확보할 수 있다.

지난 13일 곤지암리조트에서 열린 2019 오딧세이 코리아 국제 심포지엄(OHDSI Korea International Symposium) 기자간담회에선 오딧세이 의장이자, 미국 콜롬비아대학교(Columbia University) 교수인 조지 립섹(George Hripcsak, M.D.) 박사, 에라스무스 대학교(Erasmus University) 교수 피터 리인백(Peter R. Rijnbeek, Ph.D.), 분산형 바이오헬스 빅데이터 박래웅 단장(아주대병원 의료정보학과 교수)이 참석해 오딧세이의 미국, 유럽에서의 활용과 현황 등에 대해 소개했다.

오딧세이가 특히 주목되는 점은 빅데이터 활용 시 해결해야 할 문제로 지적됐던 높은 신뢰도와 개인정보 보호 문제를 극복했다는 점이다. 다양한 의료기관의 임상 데이터를 활용한 후향적 분석 연구 등은 각 의료기관의 전자의무기록 표기가 다른 문제 등으로 편향적일 수 있단 우려를 낳았다. 하지만 오딧세이는 각각의 기록들을 공통데이터로 변환시켜 ‘편향성’에 대한 우려를 크게 낮췄다. 각각의 의료기관이 자신들의 방식대로 전자의무기록을 작성해도, 오딧세이는 이를 공통데이터로 자동 변환시키기 때문에 연구자들이 별도의 작업을 해야 하는 번거로움이 없다.

실제로 립섹 박사는 공통데이터모델을 이용해 기존 고혈압 약제들의 효과에 대해 연구를 진행했는데, 이 연구는 신뢰도를 높게 평가받으며 국제적 학술지인 란셋(Lancet)에 게재됐다.

진료 기록 활용시 우려가 큰 ‘환자 개인정보 보안’ 문제도 해결했다. 오딧세이 ‘연구망’에선 환자들의 진료 데이터가 오가지 않는다. 앞선 예시와 같이 특정 연구에 참여코자 할 경우, 연구자가 해당 연구의 설계대로 자신이 속한 의료기관의 환자 데이터를 대입해 결과를 도출하고 이 자료만 공유한다.

박래웅 단장은 “병원들마다 전자의무기록을 도입했지만, 각각 데이터 구조 등이 다르다. 때문에 지금까진 여러 기관의 데이터를 합쳐 연구를 진행코자 할 때 분석이 불가능했다. 그런 문제를 해결하기 위해 공통데이터가 필요한 것”이라며 “국내에선 63개 병원이 참여해 데이터 표준화를 합의했다. 논란이 된 개인정보 이슈 또한 데이터가 (의료기관) 밖으로 나가지 않아 우려의 소지가 적다”고 말했다.

유럽 오딧세이 리더인 리인백 교수도 “오딧세이의 시스템 상 개인 정보 레벨에 접근할 수 없다. 연구자는 (환자) 데이터를 아예 볼 수 없다. 사람이 아닌, 툴(tool)이 작용하는 것”이라며 “기존의 고혈압 약 중 어떤 제제들이 실제 환자들에게 더 효과적인지를 알아보고자 (오딧세이 네트워크를 이용해) 연구를 진행했는데, 이 과정에서 500만명 환자 데이터를 분석했다. 하지만 연구자는 이들 환자의 개인정보를 확인할 수 없었다”고 강조했다.

리인백 교수는 유럽연합 정부 프로젝트이자 공통데이터모델 데이터 네트워크 구축사업인 에덴 프로젝트(EHDEN Project)를 주도하고 있는 인물이다. 에덴 프로젝트는 2018년에 시작해 2024년까지 진행되는 사업이며 총 12개국 22개 기관들이 참여하고 있다.

(왼쪽부터)분산형 바이오헬스 빅데이터 박래웅 단장(아주대병원 의료정보학과 교수), 미국 콜롬비아대학교 조지 립섹 교수, 에라스무스 대학교 피터 리인백 교수.

데이터 장벽 무너지자 정부, 산업계도 군침

오딧세이의 장점은 수백만명 이상의 환자 데이터를 개인정보 유출 우려 없이 보다 빠르고 자유롭게 연구에 활용할 수 있다는 점이다. 하지만 다국가 다기관의 환자 데이터를 통합 분석하는 과정에서 각국의 보험급여 시스템 등과 같은 차이점을 어떻게 분석 또는 해석할지에 대한 의문도 생긴다.

이에 대해 박래웅 단장은 “오딧세이에선 각기 다른 언어, 용어, 코드 등을 표준화했는데, 그 수가 700만여개에 달한다”며 “이를 바탕으로 분석 방식도 통일화했다. 그럼에도 결과 등의 차이가 발생한다면, 보건체계, 유전적 체계의 차이가 아닐까 싶다”고 말했다.

립섹 교수는 “나라별로 결과가 다르게 도출된다면 연구가 신뢰를 얻기 어려울 것”이라며 “연구의 디자인이 중요하겠지만, 오딧세이는 일관되고 신뢰도 높은 결과를 얻을 수 있다. 여기에 다른 결과에 대한 분석도 가능하다. 왜 다른지, 왜 같은지를 알 수 있기 때문에 보다 신뢰할 수 있는 것”이라고 피력했다.

수십억명의 환자 데이터를 활용할 수 있다는 점은 연구자들의 관심거리만도 아니다. 급상승하는 의료비에 재정 압박을 느끼고 있는 각국 정부와 임상시험이나 신약 개발 비용을 줄이고자 하는 산업계 역시 관심이 클 수밖에 없다.

이에 대해 립섹 교수는 “데이터 관련 기관, 정부, 제약사 등이 (오딧세이에) 많은 펀딩을 하고 있다. 오딧세이 자체가 오픈소스이기 때문에 툴을 개방해서 같이 (연구를) 할 수 있는 여지가 많다”고 전했다. 하지만 그는 “펀딩을 하더라도 데이터에 접근할 수 있는 권한은 없다"며 "연구자들과 같이 오픈소스나 툴을 제공할 뿐”이라고 재차 강조했다.

박래웅 단장은 “오딧세이는 기본적으로 각 기관이 데이터 사용 권한을 갖는다. 전혀 새로운 시스템이 아닌, 기존 법과 시스템 하에서 데이터를 표준화하는 것”이라며 “연구자가 데이터를 볼 수 없을 정도로 데이터 보완이 강력함에도 경제성 평가 등이 가능하다. 학계는 물론 정부, 산업계 등에서 필요한 경제성 평가 등의 연구가 보다 활발해질 수 있는 계기가 마련된 것”이라고 설명했다.

저작권자 © 청년의사 무단전재 및 재배포 금지