[건강상식 허와 실] <48>‘인공지능 만능 의사 왓슨’, 어디까지 사실일까?

한국헬스경제신문 김기석 기자 |


‘셜록보다 똑똑한 닥터 왓슨’

 

인공지능(AI) 의사 닥터 왓슨이 6년 전 국내에 도입될 때 떠돌던 찬사다. 흔히 닥터 왓슨이라 불리는 ‘왓슨 포 온콜로지’는 IBM이 개발한 의료용 인공지능 클라우드 기반 플랫폼이다.

 

닥터 왓슨에 대한 긍정적 평가도 있었다. 그러나 화려한 등장과 달리, 현재는 ‘실패한 혁신’ 또는 ‘성급했던 도전’이라는 냉정한 평가를 받고 있다.

 

초기에는 수만 편의 의학 논문과 임상 데이터를 순식간에 분석하여 의사에게 옵션을 제공해 높게 평가받았다.

 

하지만 시간이 지나면서 실제 의료 현장과의 괴리가 드러나기 시작했다. 왓슨은 미국 메모리얼 슬로언 케터링 암센터(MSKCC)의 데이터로 학습되었다. 이로 인해 한국을 포함한 다른 국가의 의료 보험 체계, 인종적 특성, 선호되는 치료법 등을 제대로 반영하지 못했다.

 

또 의학 기술은 매일 발전하지만, 왓슨이 이를 실시간으로 학습하여 판단에 반영하는 속도가 기대보다 느렸다.

 

2018년 내부 문건에 따르면, 왓슨이 실제 환자에게 위험한 치료법을 권고한 사례들이 발견되면서 신뢰도에 치명적인 타격을 입었다.

 

결국 IBM은 2022년 초, 왓슨 헬스 부문의 데이터를 사모펀드인 프란시스코 파트너스에 분할 매각하며 사실상 의료 AI 사업에서 손을 뗐다. 이는 “AI가 의사를 대체할 것”이라던 초기의 낙관론이 현대 의학의 복잡성을 간과했음을 보여주는 상징적인 사건이 되었다.

 

 

하지만 왓슨의 실패가 AI 의료 자체의 실패는 아니다. 왓슨의 시행착오를 바탕으로 현재는 특정 질환의 영상 판독(X-ray, MRI 분석)이나 신약 개발 등 보다 구체적이고 실질적인 분야에서 성과를 내는 2세대 의료 AI들이 활약하고 있다.

 

결국 왓슨은 ‘의사’가 아니라 ‘의사를 돕는 도구’였다. 의사가 환자의 영상 소견, 조직 검사 결과 등 정보를 입력한 후 '왓슨에게 물어보기'를 클릭하면 10초 안에 강력 추천, 추천, 비추천 등으로 구분해 치료법을 제시할 뿐이다.

 

그리고 최종 결정은 항상 인간인 의사가 했다. 그에 따르는 설명, 책임, 판단 등 모든 게 의사의 몫이다. 한마디로 말하면, 왓슨은 그야말로 ‘똑똑한 참고서’에 가까웠을 뿐이다.

 

그런데 왜 “인간 의사를 뛰어넘었다”는 말이 퍼졌을까?

 

왓슨은 수십만 편의 논문과 치료 기준을 몇 초 만에 비교할 수 있어 기억력이나 속도만 놓고 보면 인간이 따라가기 힘든 건 사실이었기 때문이다.

 

일부 연구에서는 의사들의 치료 계획과 왓슨의 추천이 70~90% 이상 일치하는 결과도 나왔다. 이런 결과들이 와전되면서 “왓슨이 인간 의사보다 더 정확하다”는 이야기로 퍼진 것이다.

 

SNS에 떠도는 이런 말들은 과장 왜곡된 것들이다. 왓슨의 암 진단 정확도가 100%라는 말이 떠도는데 공식적으로 그런 수치는 없다. 또 환자 100%가 AI 의사를 선택했다는 것도 일부 인터뷰나 사례가 과장돼 퍼진 것이다. 대형병원 환자들이 왓슨을 활용하는 길병원으로 몰렸다는 것도 확인된 사실이 아니다.

 

미래에는 AI의사가 인간의사를 대신할 거라는 말은 틀린 것이다. 의사가 사라지는 미래가 온다기 보다는 AI를 잘 활용하는 의사와 그렇지 못한 의사의 차이가 있을 뿐이다. AI는 단지 의사가 더 나은 결정을 내리도록 돕는 아주 빠르고 똑똑한 도구로만 활용될 것으로 보인다.