공단, 자격·진료·건강검진·요양기관 DB 등 표본코호트DB 제공


[청년의사 신문 양금덕]

환자들의 병·의원 이용내역과 건강검진 결과를 연계해 10여년간의 건강 추이를 분석할 수 있는 환자중심 코호트자료가 최초로 공개된다.

국민건강보험공단은 지난 24일 본부 지하강당에서 ‘표본코호트DB 일반제공을 위한 자료설명 워크숍’을 갖고 DB 매뉴얼 설명부터 자료연결 시연, 연구사례 등을 소개했다.

이번에 공개되는 표본코호트DB는 2002년부터 2010년까지 9년간의 국민건강정보 DB를 기반으로 하고 있으며, 약 100만명의 사회경제적 자격변수, 의료이용현황, 요양기관 현황 등이 담겨있다.

건강보험심사평가원에서 제공하고 있는 국가 환자표본자료(HIRA-NPS)는 입원환자 70만명, 외래 50만명에 대한 표본 구성이나 추출방법 등은 우수하지만, 환자들의 자격정보나 건강검진과 연계된 정보가 없다는 한계가 있었다.

하지만 공단의 표본코호트DB는 환자중심 코호트 자료로 모집단(100만명)의 대표성을 갖추고 9년간의 자료를 확보해 시간에 따른 자료 분석도 가능하다.

공단 빅데이터운영실 박숙희 부장은 “표본코호트DB는 전 국민을 기반으로 했기 때문에 대표성을 가졌으며 만성질환 등 장기간 관찰이 필요한 연구가 가능하다”면서 “거주 환경이나 소득수준, 장애여부, 사망일자 등 사회적 변수가 포함하는 포괄성을 갖고 있어 다양한 상관관계 분석이 가능하다. 또 행위별 수가제의 청구자료인 만큼 세부 의료이용 내역도 확인할 수 있다”고 설명했다.

자료는 자격DB, 진료DB, 건강검진DB, 요양기관DB로 구성돼 있는데 이중 진료 DB는 명세서, 진료내역, 상병내역, 처방전교부 상세내역도 포함돼 있다. 이들 정보는 서로 연계도 할 수 있어 한 환자의 자격DB 정보로 병의원 진료정보와 건강정보까지 연도별로 파악할 수 있다.

예를 들어, 한 환자의 암호화된 자격 DB의 개인일련번호 ‘PERSON_ID'를 진료명세서에 입력하면 청구일련번호를 파악할 수 있고, 11개의 진료내역, 2개의 상병내역, 5개의 처방전 교부내역까지 알 수 있다.

즉, 한 환자가 의과와 보건기관을 이용한 내역과 어떠한 상병으로 치료를 받았는지, 처방약의 목록은 무엇인지, 사망시에는 사망연도까지 알 수 있는 것이다.


학술 목적시 50% 감면, 3년간 정보이용

이번 DB는 학술용으로 우선 제공되며, 26일부터 한달간 신청접수를 받아 심의위원회 심의를 거쳐 연구과제가 결정될 예정이다.

이용수수료는 9년 치 데이터를 기본으로 할 때 학술용은 50% 감면돼 대략 110만원 정도이며, 학위 논문용은 80% 적용돼 약 50만원 수준이다.

연구과제에 따라 제공된 데이터는 3년간 이용이 가능하며 이용기간 연장시 일부 수수료를 부담하면 3년 더 이용할 수 있다.

공단은 DB를 이용한 연구의 활용현황 등 성과관리를 하게 된다. 심의위원회를 통해 연구과제를 선정할 때 일종의 일련번호를 부여해 논문게재 등 결과관리, 연구주제 및 활용정보 공유 등을 한다는 것이다.

박숙희 부장은 “표준 코호트DB를 공개할 때 가장 중요한 것이 보완인 만큼 사전에 개인정보를 암호화 해 학술위주로 제공하게 된다”면서 “연구과제 공고시 세부 지원방법과 내역이 공개될 것이며 연구 과제의 중복 등을 피하기 위해 심의위원회의 전문 심의를 통해 과제를 선정하는 작업이 이뤄진다”고 설명했다.

이어 박 부장은 “향후 1~2년간 자료 활용 결과를 토대로 민간과 제약사 등으로도 활용범위를 넓힐 수 있도록 할 계획”이라고 전했다.


“주기적인 재평가, 검진DB의 한계 개선돼야”

공단의 DB를 이용해 연구를 해본 전문가들은 대규모 빅데이터를 활용할 수 있게 돼 활발한 연구가 이뤄질 수 있다는 점은 환영하면서도 연구에 있어 신중함을 주문했다.

이날 연세의대 김현창 교수는 공단의 건강검진과 요양기관 자료를 이용한 ‘혈중 바이오마커 변화에 따른 뇌혈관질환 발생위험도’ 연구 결과를 공개했다.

기존에는 뇌졸중 환자 정보를 이용해 콜레스테롤 수치변화 등을 역 추적해 왔지만 검진DB를 이용하면 혈중 바이오마커의 변화 추이를 파악해 심뇌혈관질환 발생 위험도를 미리 예측할 수 있도록 할 수 있다는 것이다.

실제 연구를 해 본 결과, 단순 뇌혈관질환으로 인한 요양기관 이용현황에 검진DB를 반영, 과거력을 배제하는 등 연구 목적에 부합하는 연구대상을 선정해 케이스컨트롤 분석이 가능했다. 또 바이오마커 변화에 따른 예방적 중재 시점을 결정할 수 있다는 결과도 도출했다.

건강검진자료가 포함된 DB를 이용하면 건강한 사람의 상태를 지속적으로 확인할 수 있다는 것이다. 하지만 그는 자료의 한계점도 지적했다.

이 자료들은 의료기관 이용 정보를 기본적으로 하고 이중 건강검진을 받은 환자의 정보가 추가된 개념이므로, 검진DB가 전체 환자의 검진DB라고 해석할 수 없다는 것이다.

때문에 김 교수는 “별도의 검진 DB를 구축하는 등 DB영역을 넓혀 특정연구를 할 수 있도록 해야 한다”고 조언했다.

고려의대 의학통계학교실 이준영 교수도 “공공데이터를 이용한 고부가 가치 창출이 이뤄질 수 있을 것으로 기대되지만 표본코호트DB의 유지와 관리를 위해서는 주기적인 평가가 필요하다”고 말했다.

이어 그는 “연구자들의 다양한 요구가 최대한 반영되도록 특수목적DB 등을 개발해야 한다”고 조언했다.

이에 대해 공단은 연구 활용도 제고를 위해 DB 영역을 넓혀나가겠다는 입장을 밝혔다. 이미 건강검진 수검자의 자료확보를 위한 별도의 DB구축을 위한 작업을 추진하고 있다면서 올해 말에는 시범사업에 들어갈 수 있도록 할 예정이라고 전했다.

저작권자 © 청년의사 무단전재 및 재배포 금지