메뉴바로가기본문바로가기.

동아사이언스

챗GPT는 의료에 득일까 독일까…"의료행위 보조시 종종 실수"

통합검색

챗GPT는 의료에 득일까 독일까…"의료행위 보조시 종종 실수"

2023.04.03 17:50
의학계 "작은 오류도 환자 안전 크게 저해할 수 있어, 초기 검증 중요"
게티이미지뱅크 제공
게티이미지뱅크 제공

챗GPT를 비롯한 대화형 인공지능(AI) 프로그램은 가까운 미래 의료현장에 큰 변화을 일으킬 것으로 전망된다. 의사의 진단과 의료행위를 보조하면서 환자들이 직접 기술을 체감할 수 있을 것으로 보이기 때문이다. 국제 의학계는 대화형 AI가 의료진의 업무 부담을 크게 덜어줄 것으로 보면서도 잘못된 정보 제공으로 인한 오용 사례에 대비해야 한다고 진단했다. 

 

3일 의학계에 따르면 의학학술지 중 인용지수(IF)가 가장 높은 학술지 중 하나인 '뉴잉글랜드저널오브메디신(NEJM)'은 의료 AI를 전문으로 다루는 자매지 'NEJM AI'를 내년 창간한다. NEJM은 "의학은 AI가 적용되는 다른 분야와는 다른 특성을 갖고 있다"며 "기존 의료체계와 융합되고 개선을 도모하는 과정에선 통제와 윤리적 관리 체계가 필요하다"고 창간 이유를 밝혔다. AI가 의료현장에 적용되기 위해선 정확성과 안전성을 확인하는 연구가 계속해서 이뤄져야 한다는 것이다. 

 

의학 학술지들의 검증에 따르면 대화형 AI 프로그램은 진단과 의료행위를 보조하는 과정에서 높은 효율을 보이면서도 종종 실수하는 모습을 보였다.

 

30일(현지시간) NEJM 온라인판에 게재된 편집부의 특별보고서에는 의사와 환자가 나눈 대화를 챗GPT가 분석한 결과가 소개됐다. 챗GPT는 이 대화를 바탕으로 의사가 환자에게 내린 진단을 요약했다. 권장되는 검사와 처방 내역, 생활 속 건강관리에 필요한 조언 등이다. 이렇게 요약된 내용은 환자의 의무기록으로 사용될 수 있다.

 

보고서에 의하면 챗GPT는 의사의 진단 내용을 전반적으로 훌륭하게 요약해냈다. 하지만 일부 오류도 발견됐다. 챗GPT가 작성한 요약본에선 환자의 체질량지수(BMI)가 명시됐지만 실제 대화 내용에선 이 체질량 지수가 도출된 과정이 없었다. 또 의사는 대화 과정에서 영양실조나 심장합병증 징후에 대해 언급했지만 요약본에선 빠졌다. 의사가 권유한 혈액검사에 대해서도 첫 분석에서 구체적인 근거를 제시하지 못했다.

 

다른 주요 국제 의학학술지도 비슷한 분석 결과를 최근 잇따라 소개했다. '랜싯 디지털헬스'는 지난 1일(현지시간) 발간된 4월호에서 스티븐 알리 영국 모리스톤병원 전문의 연구팀이 챗GPT의 의무기록 성능을 확인한 연구를 게재했다. 연구팀은 피부질환 등과 관련한 38개의 임상 상황을 챗GPT에게 제시하고 요약본을 작성하도록 했다.

 

평가 결과 챗GPT는 일반적인 성인 수준의 요약 능력을 보여줬다. 의사가 작성한 의무기록과도 유사한 수준의 완성도를 보였다. 하지만 연구팀은 이번 연구로는 챗GPT가 가진 오류의 가능성을 충분히 확인하지 못한다고 설명했다. 연구팀은 "의료행위와 관련한 업무 수행은 환자의 질병 발생률과 사망률에 큰 영향을 미칠 수 있기 때문에 면밀한 모니터링이 중요하다"고 강조했다.

 

챗GPT가 잘못된 정보를 제공했을 때 발생할 수 있는 또 다른 문제점은 책임의 소지다. 클라우디아 하우트 미국 노스이스턴대 법학전문대학원 교수는 지난달 27일 국제학술지 '미국의사협회지(JAMA)'에 발표한 기고문을 통해 "의사가 챗GPT와 같은 대화형 인공지능 프로그램을 사용해 환자에 대한 판단을 대체하는 경우 그 책임은 의사 자신에게 돌아갈 수 있다"고 말했다.

 

그는 이어 "의료보조 과정에서 발생한 문제에 대해 미국식품의약국(FDA)과 같은 유관기관은 챗GPT를 개발한 미국 오픈 AI의 개발자들에게 책임을 물을 수도 있지만 대부분 법적으로 미지의 영역이다"고 설명했다.

관련 태그 뉴스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기