미국의사면허시험 무난히 통과한 챗GPT
챗GPT 작성 논문 늘면서 표절·위조 논란도
WAME “챗GPT, 저자될 수 없다” 권고사항 발표

미국 인공지능 개발업체인 ‘오픈에이아이(Open AI)’가 지난해 12월 1일 출시한 인공지능 모델인 ‘챗GPT(ChatGPT)’가 의료 분야에도 활용되기 시작했다(ⓒ청년의사).
미국 인공지능 개발업체인 ‘오픈에이아이(Open AI)’가 지난해 12월 1일 출시한 인공지능 모델인 ‘챗GPT(ChatGPT)’가 의료 분야에도 활용되기 시작했다(ⓒ청년의사).

세계적으로 돌풍을 일으키고 있는 인공지능(AI) ‘챗GPT(ChatGPT)’가 의학계에도 파장을 일으키고 있다. 챗GPT가 미국 의사면허시험인 ‘USMLE(United States Medical Licensing Examination)’를 통과했다는 연구결과까지 나왔다.

챗GPT로 작성한 논문이 학술지에 제출되는 사례도 늘고 있다. 그러면서 인간이 작성한 논문과 구별하기 힘들어 윤리적인 문제도 생기고 있다. 표절과 연구 결과 위조 위험도 제기되는 상황이다.

이 때문에 의학교육과 논문 작성 기준 등을 바꾸는 움직임이 일고 있다. 오는 7월 미국 하와이에서 열리는 대규모 인공지능 컨퍼런스 ‘The 40th International Conference on Machine Learning(ICML 2023)’는 챗GPT 등 챗봇으로 작성된 논문을 제출하지 못하도록 했다.

챗GPT는 미국 인공지능 개발업체인 ‘오픈에이아이(Open AI)’가 지난해 12월 1일 출시한 인공지능 모델로, 언어에 특화됐다. 일상 대화뿐 아니라 논문 작성과 번역 등 다양한 분야에서 뛰어난 능력을 보여주고 있다.

USMLE 통과한 챗GPT…“임상 워크플로우 개선에도 활용”

의료 분야도 예외는 아니었다. 미국 실리콘벨리 스타트업인 ‘앤서블 헬스(Ansible Health)’ 연구진은 챗GPT로 USMLE를 실시한 결과, 50% 이상 정확도를 보여주며 통과했다는 연구결과를 지난 1월 21일 의학논문 사전공개 사이트 ‘메드아카이브(medRxiv)’에 발표했다.

연구진은 챗GPT가 의대생 2학년을 대상으로 하는 스텝1, 4학년 대상 스텝2, 레지던트 1년차 대상 스텝3 문제를 풀게 했다. 연구에는 USMLE 웹사이트에 공개된 샘플 문제 376문항 중 챗GPT가 인식할 수 있는 텍스트 기반 305문항이 사용됐다.

그 결과, 챗GPT는 모든 시험에서 50~60% 이상 정확도를 보였다. 이 정도 수준이면 무난히 USMLE를 통과할 수 있다는 게 연구진의 설명이다.

연구진은 “챗GPT는 특별한 훈련이나 보강 없이 높은 수준의 정확성과 통찰력을 보여줬다. 이같은 결과는 의학교육이나 임상 의사 결정 지원 가능성을 시사한다”고 말했다.

이같은 연구결과에 의사들은 서류 작성 업무 부담을 줄여줄 수 있다는 기대감을 보이기도 했다.

이에 대해 디지털헬스케어파트너스(DHP) 최윤섭 대표는 “앤서블 헬스는 챗GPT가 USMLE 문제까지 잘 풀 수 있는 것으로 드러나자 임상 워크플로우 개선 일환으로 챗GPT를 사용하기 시작했다고 한다”며 “보험사에 보내는 편지를 쓰거나 영상의학과 판독문 작성 등 반복적인 글 쓰기 작업, 환자와의 커뮤니케이션, 더 나아가서는 브레인스토밍에도 활용한다”고 전했다.

최 대표는 “결과적으로 문서 작업이나 환자 케어에 들어가는 시간을 33% 절감할 수 있었다고 한다”고도 했다.

WAME “챗GPT는 저자가 될 수 없다” 권고사항 발표

이 뿐만이 아니다. 챗GPT 등장이 의학논문 작성에도 영향을 미치면서 세계의학편집자협회(World Association of Medical Editors, WAME)는 별도 가이드라인까지 마련했다.

WAME는 지난 1월 20일 학술 출판물 관련 챗GPT와 챗본에 대한 네 가지 권장사항을 발표했다. ▲챗봇은 저자가 될 수 없다 ▲챗봇을 사용한 저자는 그 내역을 투명하게 공개하고 사용방법에 대한 정보를 제공해야 한다 ▲논문에서 챗봇이 수행한 작업과 챗봇이 생성한 자료를 포함한 모든 출처에 대한 책임은 저자에게 있다 ▲편집자에게는 인공지능에 의해 생성되거나 변경된 콘텐츠를 감지하는데 도움 되는 적절한 도구가 필요하며 이런 도구는 지불 능력에 관계없이 사용할 수 있어야 한다는 게 WAME 권장사항이다.

WAME는 “학술지에서 챗GPT 같은 챗봇이 공동저자로 표시되는 논문을 출판하기 시작했다. 챗GPT는 최근 출시된 챗봇으로 기존 정보를 새로운 방식으로 정리할 수 있다는 의미에서 이전에 존재하지 않았던 완전히 새로운 것을 만들 수 있다”며 “결과적으로 대학은 가르치는 방법을 개편해야 한다”고 했다.

WAME는 “챗봇은 훈련된 기존 텍스트 라이브러리를 사용하기 때문에 출처를 밝히지 않고 그대로 사용할 위험이 있다”며 챗GPT를 이용해 얻은 텍스트에 출처가 올바르게 표시된 비율이 6%에 불과하다는 연구결과를 제시하기도 했다.

WAME는 “놀랍게도 챗GPT는 의도적으로 거짓말을 할 수도 있다. 챗GPT는 거짓말을 지각하지 못하지만 프로그래밍을 통해 사실을 날조할 수 있다”며 “챗봇 결과물이 학술지에 게재되는 경우 표절을 방지하기 위해 인간 저자와 편집자는 인간에게 요구되는 것과 동일한 수준으로 출처를 올바로 표시하도록 해야 한다”고 말했다.

WAME는 이어 “챗GPT는 연구자에게 유용한 도구일 수 있지만 허위 또는 표절 콘텐츠일 위험도 있기에 학술지에 위협이 된다. 피어 리뷰(peer review)로는 챗GPT로 생성한 콘텐츠를 감지하지 못할 수 있다”고도 했다.

관련기사

저작권자 © 청년의사 무단전재 및 재배포 금지