심평원, ‘HIRA 빅데이터 미래포럼’ 열고 국제협력연구 성과 공개
32개 국서 등록한 협력연구 412건…코로나 탈출구 찾는데 한 몫
해외 연구진 “빅데이터, 공공보건 위해 사용된 훌륭한 사례” 칭찬
데이터 표준화·연구영역 확대 등 넘어야 할 산도 많아

신종 코로나바이러스 감염증(코로나19) 팬데믹이 전 세계를 휩쓸고 있다. 백신도 치료제도 없는 막다른 길에서 전 세계가 말 그대로 ‘한 번도 경험해보지 못한 감염병’으로 인한 충격을 경험하고 있다. 탈출구를 찾기 위해 세계 곳곳의 연구자들이 소매를 걷었지만 ‘임상 데이터’ 부족으로 뾰족한 답을 얻지 못했다.

하지만 지난 3월 건강보험심사평가원이 코로나19 유행에 국제사회가 공동대응 하고자 전 세계 연구자들에게 의료 빅데이터를 최초로 개방, ‘코로나19 국제협력연구’가 시작되면서 분위기가 달라졌다.

코로나19 연구에 속도가 붙기 시작하면서 우리나라 연구자들 사이에서는 영향력 있는 논문이 나오는 건 ‘시간싸움’이라는 말이 나올 정도였다.

심평원이 전 국민 의료데이터를 개방하고 국제협력연구를 시작할 수 있었던 배경에는 단일보험체제인 우리나라 건강보험제도적 특성과 더불어 국민건강보험법에 의해 의료기관이 청구한 진료내역을 신속하게 심사하고 데이터로 구축할 수 있는 기반이 마련돼 있었기 때문이다.

이에 심평원은 지난 16일 ‘코로나19 국제협력연구’ 성과를 공유하고 향후 발전방안을 논의하기 위해 ‘HIRA 빅데이터 미래포럼’을 개최했다. 국내외 전문가들이 참여한 이번 포럼은 유튜브를 통해 생중계됐다.

특히 코로나19 국제협력연구 성과를 공유하기 위해 빅데이터 미래포럼에 참여한 해외 연구자들은 빅데이터가 공공보건을 위해 어떻게 사용될 수 있는지 보여준 훌륭한 사례라고 호평했다.

전 세계 32개국서 등록한 코로나19 협력연구 412건

심평원은 지난 3월 27일 전 세계 연구자들과 공동대응을 위해 익명화된 국내 코로나19 환자의 데이터를 공개했다. 심평원은 실제 코로나19 환자의 임상데이터를 코호트 데이터로 구축 후 외부 반출 없이 근거를 공유하는 방식으로 프로젝트를 진행했다.

심평원 노연숙 빅데이터연구부장은 “심평원이 수집한 진료비 청구 데이터는 전국민 의료이용내역이 시계열적으로 수집돼 있고 행위별 수가 기반으로 개인단위 세부정보가 포함돼 있어 매우 가치 있는 자료라고 볼 수 있다”고 말했다.

심평원 노연숙 빅데이터연구부장
심평원 노연숙 빅데이터연구부장

코로나19 환자의 임상 데이터 부족으로 연구에 어려움을 호소하던 전 세계 연구자들의 관심이 높아졌고 이는 연구 성과로 이어졌다.

심평원에 따르면 지난 3월 27일부터 8월 31일까지 코로나19 국제협력연구에 가입한 연구자 수는 총 58개국 1,587명(국내 527명, 국외 1,060명)이며, 국제협력연구를 위해 등록된 프로젝트는 총 32개국 412건(국내 181건·국외 231건)에 달했다.

프로젝트 412건 중 실제 129건의 프로젝트가 진행됐고, 한국과 미국, 영국, 캐나다, 이탈리아 등 코로나19 확진자가 많이 발생한 국가들의 참여가 두드러졌다. 프로젝트를 분야별로 살펴보면 약제 관련 논문이 32건, 질환 특성 및 요인이 26건, 기타 8건 등이었다.

연구에 사용된 데이터셋은 지난 5월 15일 기준으로 추출한 코로나19 (확진자의) 의료이용 데이터와 이들의 지난 3년간 의료이용 데이터가 포함됐다. 이 2개의 데이터셋은 각각 일반정보, 진료내역, 상병정보, 원외처방정보 등 4개의 테이블로 구성됐다.

노연숙 빅데이터연구부장은 이 같은 성과에 대해 “정부와 건강보험에서 코로나19 치료비 전액을 지불하고 있어 환자의 의료접근성이 높았고, 의료기관도 신속하게 진료비를 청구해 데이터 표준화된 방식으로 수집된 정보를 시의적절하게 제공할 수 있었다”고 말했다.

노 부장은 “연구가 현재도 진행 중이고 시간이 갈수록 성과가 나오고 있어 이런 측면에서 연구 참여자들에게 감사하고 (심평원이) 고생했던 보람도 느끼고 있다”고도 했다.

의료 빅데이터가 세계 공공보건을 위해 앞으로 어떻게 활용될 수 있을지를 보여준 좋은 성과라는 평가도 이어졌다. 또 향후 다양한 질병에 대한 연구에 활용할 수 있도록 빅데이터 공개 범위 확장에 대한 의견도 나왔다.

얀센 데이터연구소 Patrick Ryan 부소장은 “심평원에서 보여준 리더십과 데이터에서 나온 대단한 가치는 공공보건을 위해 앞으로 빅데이터가 어떻게 사용될 수 있을지를 (이번 협력연구모델을 통해) 보여준다”라고 말했다.

그는 “(심평원의 빅데이터 공개) 이를 통한 협력정신을 심혈관 질환이나 암 연구, 류머티즘 연구 등으로 확장하면 어떨까 하는 생각도 든다”며 “이를 통해 보건의 질을 올리고 전세계 의학관련 산업을 발전시킬 수도 있을 것”이라고 했다.

‘데이터 표준화’ 넘어야 할 산

심평원의 코로나19 국제협력연구는 전례 없는 글로벌 위기를 극복하기 위해 시도된 새로운 연구방법이지만 유의미한 결과를 도출해 내기 위해서는 아직 해결해야 할 과제가 남아 있다. 데이터 표준화 작업이 그 첫 번째다.

심평원 노연숙 부장은 “다양한 국가에서 1,500여명이 넘는 연구자가 등록하고 420여개 이상의 연구 프로젝트가 신청됐지만 분석코드를 산출해 연구실행까지 도달한 연구는 129개에 그쳤다”며 “이는 관심에 비해 데이터 난이도나 접근성 문제로 어려움이 있었다는 것을 의미한다”고 말했다.

노 부장은 “국제협력연구가 심평원 데이터를 갖고 원활하게 이뤄지기 위해서는 데이터 표준화가 중요한 현안”이라고 했다.

또 “이번 프로젝트가 가능했던 이유는 원시 데이터를 공개하지 않고 코호트 데이터셋을 구축, 근거가 될 수 있는 결과값만 공유했기 때문”이라며 “하지만 연구자가 데이터를 직접 탐구하고 세밀한 분석코드 작성에는 어려움이 있었다고 본다. 향후에는 코호트 데이터 기초 통계와 비식별화 처리한 큰 사이즈 샘플데이터, 통계 패키지별 기초 분석 가이드라인 제시가 필요할 것으로 보인다”고도 했다.

아주대 허윤정 교수도 “감염병 영역 외에도 다양한 형태의 가치를 창출하기 위해서는 데이터 표준화 관련한 노력이 필요하다”며 “현재 정부가 추진하는 다양한 표준화 이슈들이 좀 더 체계적으로 제도화 되는 게 필요하다”고 말했다.

허 교수는 “빅데이터 관련한 다양한 숙제가 존재하는데 심평원 데이터만으론 다양한 가치를 창출하기 어렵다. 공공기관이나 의료기관이 갖고 있는 데이터와 연계함으로써 다양한 형태의 빅데이터 활용 방안이 구축돼야 하는데 법적·제도적 기반이 취약하다"며 "정보보호 관련 이슈도 제기되고 있는 만큼 이를 제도적으로 해결할 필요가 있다”고 했다.

저작권자 © 청년의사 무단전재 및 재배포 금지