딥노이드는 인하대병원 영상의학과 이로운 교수팀과 공동으로 진행한 ‘딥노이드의 M4CXR과 OpenAI의 ChatGPT간 흉부 X-ray 해석 성능 비교에 관한 연구’가 SCI급 국제공인학술지 ‘Journal of Clinical Medicine’에 게재됐다고 27일 밝혔다.
딥노이드의 M4CXR은 흉부 X-ray 영상을 분석해 판독문 초안을 생성하는 거대 언어 모델(LLM)로 설계된 클라우드 기반의 의료 AI 솔루션이다. 연구를 통해 M4CXR은 흉부 X-ray 진단 시 실제 의료현장에서 임상의의 역량을 강화하는 보조 도구로 적합함을 입증했다.
연구는 의료 AI 관련 전문가인 인하대병원 영상의학과 이로운 교수의 주도로 진행됐다. M4CXR과 Chat GPT의 판독 결과를 ▲정확도 ▲위양성 ▲위치 오류 ▲개수 오류 ▲환각 등 다섯 개 지표로 평가했을 때, M4CXR은 모든 평가 항목에서 ChatGPT보다 일관되게 우수한 성능을 보였다. 특히 위치 정확성(76-77.5%)에서 ChatGPT(36-36.5%)를 크게 앞섰다. 진단 정확성 측면에서도 M4CXR(60-62%)은 ChatGPT(42-45%)보다 우수했다.
연구 결과 M4CXR은 전문 의료 환경에서 활용하기에 적합했으며, 범용 AI인 ChatGPT에 비해 우수한 성능을 나타냈다
이로운 교수는 "이번 연구를 통해 의료 영역에서 M4CXR의 진단 보조 도구로의 잠재력을 확인할 수 있었다”며, “향후 실제 전문의와의 판독 비교 연구를 통해 M4CXR의 임상적 유효성을 더욱 강화하고, 이를 바탕으로 진단의 정확도와 효율성을 한층 높여나갈 계획"이라고 전했다.
