김치원 서울와이즈요양병원장

FBI 칼럼은 FaceBook Influencer 약자로 페이스북에서 좋은 컨텐츠를 생산하는 페북 '영향력자' 분들의 이야기를 함께 나누고자 하는 코너입니다. FBI 요원들의 날카로고 재미있는 포스팅, 청년의사 홈페이지에서도 함께 하세요!

[청년의사 신문 청년의사] 구글의 인공지능 알파고가 이세돌 9단을 연달아 이기면서 의료계를 비롯한 다양한 곳에서 향후 인공지능의 적용 가능성에 대한 논의가 많습니다.

의료와 관련해서는 IBM의 인공지능인 왓슨이 수년전부터 의료에 활용하기 위한 노력을 기울여 왔기 때문에 이에 대한 보도가 많이 나오고 있습니다.

충격적인 내용 중 하나가 IBM 왓슨의 암진단 정확도가 90% 이상이며 특히 자궁경부암을 100% 진단했다는 내용입니다.


인공지능의 능력과 발전 가능성에 대해서는 많은 분들께서 좋은 글을 써주셨기 때문에 저는 이런 보도가 얼마나 정확한 지에 대해서 살펴보려고 합니다.

위의 보도에서 다룬 왓슨의 암 진단 능력은 2014년 미국 임상 종양 학회 (ASCO)에서 초록으로 발표된 내용입니다.

'Next steps for IBM Watson Oncology: Scalability to additional malignancies'라는 제목의 초록인데 이 초록의 핵심은 아래의 그림에 나오는 내용입니다.

대장암 98%, 방광암 91%, 자궁경부암 100%로 나오니 위의 기사 내용이 틀림없어 보입니다. 그런데 초록 내용을 보면 좀 다른 이야기를 하고 있습니다.

우선, 이 연구에서 다룬 정확도는 진단 정확도가 아니라 적절한 치료 방법을 제시한 비율입니다.

그리고 '정확도'의 기준은 미국 유수의 암센터인 Memorial Sloan Kettering Cancer Center의 의료진이 합의한 치료 방법입니다.

즉, 왓슨이 최고 암전문가의 치료 방침 제시 능력에 얼마나 정확하게 따라 갔는 지를 보여준다고 할 수 있습니다.

어찌 되었건 매우 정확한 것 아니냐는 생각을 하실 수도 있는데 더 중요한 사실은 따로 있습니다.

아래 그림을 보시면 First run, Middle run, Latest run으로 구분되어 있습니다.

이는 동일한 환자 사례를 놓고 반복해서 테스트 한 것을 의미합니다. 위의 보도에서는 Latest run 결과만을 소개하였는데 학생이 시험을 치면서 동일한 문제를 가지고 세번 시험을 치고 나서 마지막 시험 성적을 가지고 그 학생의 능력을 평가하는 것과 비슷합니다.

물론 반복해서 학습시키는 경우 정확도가 올라가기는 하지만 실제 임상에서 의미가 있으려면 다양한 학습을 시킨다음 완전히 새로운 환자에게 적용해서 높은 정확도를 보여줄 수 있어야 하는데 이 초록에 나오는 내용만으로는 그 정도 수준에 도달했는 지를 알 수 없습니다.

왓슨이나 알파고와 같은 인공지능이 예상보다 빠른 속도로 발전하고 있기 때문에 의료에 큰 영향을 미칠 것임에는 틀림없습니다.

하지만 정확하지 않은 뉴스 보도를 통해서 근거 없는 기대 혹은 불안만 가졌다가 그게 아닌 것을 알고 기술 자체를 회의하게 되는 상황은 없어야 할 것입니다.

청년의사 페이스북 페이지를 좋아요 하시면,
FBI칼럼 / 카드뉴스 외 다양한 소식을 바로바로 받으실 수 있습니다.
청년의사 페이스북 좋아요~! ▶

저작권자 © 청년의사 무단전재 및 재배포 금지