UNIST-고신대복음병원 연구진, 한국인 코호트 활용해 개발

한국인에 특화된 제2형 당뇨 발병 예측 모델이 나왔다. 기존 예측 모델보다 정확도도 높아졌다.

울산과학기술원(UNIST) 산업공학과 이정혜 교수팀과 고신대복음병원 가정의학과 강지훈 교수팀은 대규모 한국인 코호트를 기반으로 제2형 당뇨 발병 예측 성능을 높인 기계학습 모델을 개발했다고 5일 밝혔다.

연구진은 한국인에 특화된 다유전자 위험 점수(Genome-wide Polygenic Risk Score, gPRS)를 개발해 인구통계학적 정보와 임상 정보, 대사체 정보를 함께 활용했다.

기존 당뇨 발병 위험 예측 모델은 주로 서양인 집단을 대상으로 했으며 동양인 대상이어도 임상 정보 위주여서 한국인의 유전적, 환경적 요인까지 반영되진 않았다.

한국인에 특화된 제2형 당뇨 발병 예측을 위한 기계 학습 모델 개발 개요(제공: UNIST).
한국인에 특화된 제2형 당뇨 발병 예측을 위한 기계 학습 모델 개발 개요(제공: UNIST).

이에 연구진은 질병관리청 국립보건원이 한국인유전역학조사사업(KoGES)을 통해 지난 2001년부터 수집한 대규모 코호트를 기반으로 제2형 당뇨 발병 예측 모델을 개발했다.

새로운 예측 모델은 인구통계학적 정보만 활용한 모델보다 11%p 예측 성능이 높았다. 인구통계학적 정보와 임상 정보까지 활용한 모델에 비해서도 4%p 정도 향상된 예측 성능을 보였다.

제1저자인 UNIST 산업공학과 한석주 박사과정 연구원은 “제2형 당뇨 발병에 관한 유전 정보는 ‘다유전자 위험 점수’를 한국인 유전자 특성에 맞게 새로 계산해 예측 모델에 활용했다”며 “환경 정보는 ‘대사체’로 반영해 유전 정보가 설명하지 못하는 정보를 상호보완했다”고 설명했다.

공동 제1저자인 UNIST 산업공학과 김수현 박사과정 연구원은 “한국인 대상 코호트에서 인구통계학적 정보와 임상 정보를 얻고, 여기에 새로 개발한 다유전자 위험 점수, 대사체 정보 등을 더할수록 모델의 예측 정확도가 높아졌다”고 했다.

이 교수는 “서양인 코호트 중심으로 진행되던 연구를 한국인 코호트로 바꾸어 접근한 것에 큰 의미가 있다”며 “아시아 집단의 코호트 데이터를 이용하는 다양한 후속 연구에도 활용될 수 있을 것”이라고 말했다.

이번 연구 결과를 담은 논문 ‘Prediction of Type 2 Diabetes using Genome-wide Polygenic Risk Score and Metabolic Profiles: A Machine Learning Analysis of Population-based 10-year Prospective Cohort Study’는 의학 분야 국제학술지 란셋(The Lancet) 자매지인 ‘이바이오메디슨(eBioMedicine)’에 게재됐다.

저작권자 © 청년의사 무단전재 및 재배포 금지