서울아산병원 연구결과, AI 평균 진단정확도 81.8%…내시경 전문의와 불과 3% 차이

국내 연구진이 용종이 양성인지, 악성인지 등을 대장내시경 영상에서 바로 판별할 수 있는 인공지능을 개발했다.

판독정확도는 내시경 경력 5년 이상인 전문의와 거의 일치했다. 향후 이 인공지능 모델을 임상에 활용한다면 대장내시경 전문의의 경험과 지식을 보완해 불필요한 조직검사는 줄고 대장용종과 조기대장암 진단확률은 높아질 전망이다.

서울아산병원 소화기내과 변정식 교수(좌), 융합의학과 김남국 교수.

서울아산병원 소화기내과 변정식·융합의학과 김남국 교수팀은 대장내시경 영상을 분석해 용종의 병리진단을 예측하는 인공지능을 개발한 뒤 실제 영상 판독을 맡긴 결과, 평균 진단정확도가 81.8%로 내시경 전문의의 84.8%와 거의 비슷했다고 밝혔다.

연구팀은 대장용종 624개가 각각 촬영된 영상 1만2,480개를 인공지능 모델에 학습시켰다. 이후 새로운 대장용종 545개가 촬영된 영상으로 두 차례의 판독 테스트(1차: 182개, 2차: 363개)를 진행해 인공지능의 유효성을 검증했다.

테스트 영상에 포함된 대장용종의 병리진단은 ▲거치상 용종 ▲선종성 용종 ▲점막하층까지 깊게 침범한 암 등으로 다양했는데, 첫 테스트 결과 인공지능은 전체 용종의 81.3%에서 병리진단을 정확히 분류해냈다. 거치상 용종은 82.1%, 선종성 용종은 84.1%의 확률로 판별했고 점막하층까지 깊게 침범한 암도 58.8%의 확률로 진단했다.

선종성 용종은 5~10년 후 대장암으로 진행하기 때문에 내시경으로 절제하는 게 원칙이지만, 작은 거치상 용종 일부는 내시경 절제술 없이 그냥 둬도 된다.

인공지능이 거치상 용종을 정확하게 진단해냈다는 것은 불필요하게 용종절제술을 하게 될 가능성을 낮췄다는 점을 의미한다.

점막층이나 얕은 점막하층까지 침범한 조기대장암은 내시경 절제술로 치료가 가능한 반면, 깊은 점막하층까지 침범한 조기대장암은 수술로 제거해야 한다.

인공지능은 초기대장암의 침범 깊이도 정확히 감별함으로써 의료진의 치료계획 수립에 도움을 줄 것으로 기대된다.

두 번째 테스트에서도 진단정확도는 82.4%로 첫 테스트와 비슷한 결과를 보였다. 두 차례의 테스트 결과를 종합해볼 때 인공지능의 평균 진단정확도는 81.8%로 내시경전문의의 84.8%와 큰 차이를 보이지 않았다.

또한 내시경 시행경험이 6개월 이하인 수련의가 인공지능을 영상판독에 활용한 경우 평균 진단정확도가 83.4%(1차 테스트 82.7%, 2차 테스트 84.2%)로 나타났다.

이는 수련의 단독으로 대장용종 병리진단을 추정할 때의 평균 진단정확도가 67.8%(1차 테스트 63.8%, 2차 테스트 71.8%)였던 것과 비교하면 상당히 향상된 수치다.

대장용종의 병리진단을 정확히 예측해야 용종을 내시경으로 절제할지, 수술로 제거할지, 아니면 내시경 절제 없이 그냥 둘지 등의 치료법을 결정할 수 있는데, 인공지능은 경험이 충분치 않은 내시경 수련의에게 이러한 판단을 보조하는 효과가 큰 것으로 나타났다.

변정식 교수는 “이번 연구는 인공지능을 대장내시경 결과분석에 활용할 수 있다는 가능성을 제시한 것”이라며 “인공지능을 대장내시경 판독에 적용해 진단정확성을 높이면, 불필요한 조직검사를 줄이고 환자에게 용종의 병리진단에 맞춘 최적치료를 제공할 수 있을 것으로 기대한다”고 말했다.

김남국 교수는 “소화기내시경분야에서 인공지능 알고리즘을 개발해 적용한 것을 시작으로, 앞으로 인공지능을 다양한 내시경분야에 확대적용하고 기술을 고도화해 임상의사를 실질적으로 도울 수 있도록 하겠다”고 밝혔다.

한편 이번 연구결과는 세계적인 자연과학전문지 네이처(Nature)의 자매지인 ‘사이언티픽 리포트(Scientific Reports)’ 최근호에 게재됐다.

저작권자 © 청년의사 무단전재 및 재배포 금지