윗줄 왼쪽부터 시계방향으로 강재우 교수, 김성순 박사, 최용화 석박사통합과정, 박동현 박사과정



강재우 교수 연구팀이 스스로 글을 읽고 전문 지식의 습득이 가능한 인공지능을 개발했다.

 

최근, 텍스트의 형태로 된 정보의 폭증으로 인하여 사람 대신 기계가 글을 읽고 해당 내용을 이해한 뒤, 

이에 대한 질문에 답을 할 수 있는지에 대해 탐구하는 '기계 이해 (machine comprehension)' 연구가 

인공지능 및 자연어 처리 분야에서 활발히 수행되고 있다.


그러나 기존의 기계 이해 연구는 주로 뉴스 기사나 동화책 등 일반적이고 난이도가 낮은 

텍스트에 대해서만 연구되었을 뿐, 생명의료 논문과 같이 고도의 전문 지식이 포함된 

글을 읽고 이해할 수 있는가에 대해서는 의문으로 남아있는 상태였다.


강 교수 연구팀이 개발한 인공지능은 기존의 딥러닝 기반 기계 이해 시스템을 생명의료 분야로 

확장한 것으로, 기계가 수십만 건의 논문을 읽고 스스로 전문 지식을 습득한 뒤 

주어진 질문에 적절히 응답할 수 있도록 만들어졌다. 

또한, 텍스트에 등장한 생명의료 객체에 관련된 상세 정보를 모델에 추가적으로 제공함으로써 

모델이 습득한 지식을 강화하도록 설계됐다.


이 인공지능의 성능 평가 방법은 생명의료 분야의 논문 초록을 주고 해당 논문에 관련된 질문에 대해 

답을 하는 형태로 진행된다. 이 테스트에서 강 교수 연구팀이 개발한 기계 이해 모델은 

암 관련 질문에 대하여 92%의 정확도로 답을 맞혔고, 

사람 전문가(미국 콜로라도대 의과대학 암센터 소속 교수)들은 66%의 정확도에 그쳤다. 

이는 대다수의 인공지능 모델의 목표가 주어진 태스크에서 사람의 성능과 비슷해지는 것을 

목표로 개발되는 것과 대비되는 결과다.


기계 이해 모델은 정확도뿐만 아니라 소요 시간에서도 사람 전문가를 크게 앞섰다. 

총 50문제를 푸는 데 걸린 시간은 기계 이해 시스템이 0.1초미만 (0.06초), 

사람 전문가는 2시간에 육박(115분)함으로써 인공지능 모델이 효율성 면에서도 월등함을 보였다.


다가올 정밀의료 시대의 핵심 경쟁력은 폭증하는 데이터로부터 새로운 지식을 빠르고 정확하게 찾고 

추론해내는 능력에 있다. 이를 위해서 기존에 축적된 방대한 양의 지식뿐만 아니라 

매일 추가되는 새로운 지식을 (생명의료분야에서만 하루 평균 3,000편 이상의 논문이 새롭게 출판) 

끊임없이 학습함으로써 전문가의 의사결정을 지원하는 기계 이해 시스템의 중요성이 

나날이 증대되고 있다.


이번 연구는 고도의 전문지식을 요하는 분야에서 기계 이해 시스템의 가능성을 최초로 탐구하고, 

모델 학습에 필요한 데이터와 알고리즘을 제안하여 후속연구의 기틀을 다졌다는 데에 의의가 있다. 

이번 연구 결과는 2018년 1월 JMIR Medical Informatics 저널에 게재됐다.