KAIST 이재길 교수팀, 빅데이터·AI 활용해 정확도 35% 향상

코로나19 해외유입 확진자 수 예측 방법의 모식도(제공: KAIST)
코로나19 해외유입 확진자 수 예측 방법의 모식도(제공: KAIST)

신종 코로나바이러스 감염증(코로나19) 2차 대유행이 우려되는 가운데 국내 연구진이 해외 유입 확진자 수를 예측하는 기술을 개발했다.

한국과학기술원(KAIST)은 산업및시스템공학과 이재길 교수 연구팀이 코로나19 해외 유입 확진자 수를 예측하는 빅데이터·인공지능(AI) 기술을 개발했다고 19일 밝혔다. 이 기술은 기존 예측 모델보다 정확도를 최대 35% 향상시켰다.

이 기술은 국가별 확진자와 사망자 수, 코로나19 관련 키워드 검색빈도, 한국행 일일 항공편 수, 한국 로밍 고객 입국자 수 등 빅데이터에 AI 기술을 적용해 향후 2주간 해외에서 국내로 유입되는 확잔자 수를 예측한다.

연구진은 국가별 코로나19 위험도를 산출할 때 기본적으로 보고된 확진자와 사망자 수를 활용했다. 하지만 진단검사 수에 따라 달라질 수 있기에 코로나19 관련 키워드 검색 빈도를 입력 데이터로 같이 활용해 국가별 코로나19 위험도를 실시간으로 산출했다.

기밀정보인 실시간 입국자 수는 한국 도착 항공편수와 로밍 고객 입국자 수로 유추했다. 로밍 고객 입국자 수 데이터는 KT로부터 제공받았지만 KT 고객만 포함된다는 한계가 있어 일일 항공편수를 함께 고려했다는 게 연구진의 설명이다.

또한 국가 간 지리적 연관성이 코로나19 전파에 미치는 영향을 반영하기 위해 국가-대륙으로 구성되는 지리적 계층구조에 따라 해외 유입 확진자 수를 예측할 수 있도록 AI 모델을 설계했다. 이 AI 모델이 ‘Hi-COVIDNet’이다.

연구진이 한 달 반에 걸친 훈련 데이터만으로 생성된 Hi-COVIDNet으로 향후 2주 동안 해외 유입 확진자 수를 예측한 결과, 기존 시계열 데이터 기반 예측 기계학습이나 딥러닝 기반 모델보다 최대 35% 더 정확도가 높았다.

연구팀은 이번 연구결과를 최고권위 국제 학술대회 ‘ACM KDD 2020’의 ‘AI for COVID-19’ 세션에서 오는 24일 발표한다. 이번 연구결과가 담긴 논문(Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea)에는 KAIST 지식서비스공학대학원에 재학 중인 김민석 박사과정 학생이 제1 저자로, 강준혁, 김도영, 송환준, 민향숙, 남영은, 박동민 학생이 제2~7 저자로 각각 참여했다.

이번 연구는 KAIST 글로벌전략연구소의 코로나19 AI 태스크포스팀의 지원을 받았고, KT와 과학기술정보통신부의 ‘코로나19 확산예측 연구 얼라이언스’를 통해 로밍 데이터 세트를 지원받아 이뤄졌다.

KAIST 산업및시스템공학과 이재길 교수 연구팀(제공:KAIST)
KAIST 산업및시스템공학과 이재길 교수 연구팀(제공:KAIST)

키워드

#카이스트
저작권자 © 청년의사 무단전재 및 재배포 금지