“비즈니스에선 챗GPT보다 경량화 AI가 유리”-디지틀조선일보(디조닷컴 dizzo.com)

[인터뷰] 김동환 포티투마루 대표
“거대 언어모델, 범용적이지만 특정 분야에선 취약”

▲ 김동환 포티투마루 대표는 “AI를 비즈니스에 적용하는데 있어 경량화 모델이 효율적”이라고 말했다. /김동원 기자

2016년 알파고 이후 새로운 인공지능(AI) 신드롬이 불고 있다. 미국 AI연구소 ‘오픈AI’는 대화형 AI ‘챗GPT’ 이후 이를 고도화한 ‘GPT-4’를 출시했고, 마이크로소프트(MS) 이러한 오픈AI 기술 오피스365 등 자체 서비스에 연동하며 AI 확산에 나섰다. 이에 질세라 전통 AI 강자 구글도 대화형 AI ‘바드’를 일부 이용자를 대상으로 공개하며 전 세계 서비스 출시를 예고했다.
AI 열풍을 이끄는 이러한 기술들이 공통점은 새로운 내용을 생성한다는 점이다. 기존 AI가 학습한 데이터를 토대로 글과 영상, 이미지를 탐지·분석했다면, 이 기술들은 새로운 글과 이미지를 만들어낸다. 지금까지는 CCTV 영상이나 엑스레이 영상에서 특이점을 탐지하는 데 AI를 사용했다면, 이젠 AI가 사용자의 의도를 이해해 새로운 글과 그림을 만들어내기 시작한 것이다.
이처럼 AI 기술을 활용할 수 있는 범위가 커지면서 많은 기관과 기업이 AI 도입에 나서고 있는 것으로 파악됐다. 미국 구직사이트 글래스도어가 운영하는 소셜 플랫폼 피시볼이 소프트웨어 개발자와 은행원 등 1만 1793명을 대상으로 설문한 결과에 따르면, 응답자 중 43%가 챗GPT 등 AI 도구를 업무에 활용하고 있다고 답했다. 또 시장조사업체 가트너가 기업 인사 담당자 62명을 설문 조사한 결과, 이 중 48%가 챗GPT 등 AI 챗봇 업무 활용 지침을 수립하고 있다고 했다. 국내 정부 기관도 지난 1월 윤석열 대통령이 챗GPT를 업무에 적극 활용하라고 지시한 이후 AI 사용을 늘려가는 추세다.
하지만 실제 기업들은 이러한 생성 AI 기술을 활용하는 데 있어 어려움을 겪고 있는 것으로 나타났다. 챗GPT나 GPT-4의 경우 범용적으로 만들어져 기업 특성에 맞는 비즈니스에 적용하기가 어렵고, 초거대 AI의 경우 한 번 학습하는 데 큰 비용이 들어 주기적인 업데이트가 어렵기 때문이다. 그렇다면 기업들이 생성 AI를 제대로 활용하려면 어떻게 해야 할까. 자연어 기번 질의 생성 AI 등 언어모델 개발을 이끌어 온 김동환 포티투마루 대표를 만나 자세한 이야기를 들어봤다.
포티투마루는 2018년 미국 스탠포드대가 주관한 글로벌 기계독해(MRC) 경진대회 ‘SQuAD2.0’에서 구글 AI팀과 공동 1위를 하고, 2020년 마이크로소프트(MS)가 주최한 언어이해 경진대회 ‘GLGE’에서 1위에 오른 기술력 있는 기업이다. 영국 파이낸셜타임즈(FT)가 선정한 아시아태평양 고성장 기업에서도 2021년과 2022년 한국 AI 기업 중 1위를 기록하며 기술 상용화 부문에서도 인정받고 있다.
▲ 포티투마루는 기계독해(MRC) 기술을 기반으로 질문과 답변을 생성하는 ‘앤서링 AI’ 기술을 개발했다. /포티투마루

- 챗GPT가 인기지만, 실제 업무 적용에 어렵다는 지적이 많다.
“챗GPT는 AI 범용성에서 획기적인 발전을 이뤘지만, 특정 분야의 정확도는 아직 부족하다고 평가된다. 대화를 잘 이끌어나가며 많은 정보를 알려주지만, 그 내용 중 틀린 점도 많다. 챗GPT의 상위 버전인 ‘GPT-4’는 변호사 시험에서 상위 10%를 기록했다고 한다. 이는 AI가 완벽하지 않다는 것을 뜻한다. B 학점은 맞을 수 있지만 A+를 획득하긴 어렵다. 이러한 모델을 실제 비즈니스에 사용하긴 위험성이 따른다. 실제 업무에서는 90점 혹은 99점을 받더라도 사용할 수 없다. 1% 오류가 큰 손실로 이어지기 때문이다. 이러한 위험성 때문에 사무 보조적인 용도론 사용할 수 있어도 고도화된 업무나 비즈니스엔 적용이 어렵다고 평가된다.”
- 고도화된 비즈니스에 사용하기 어렵다는 의미는 무엇인가.
“거대 언어모델이 많은 데이터를 학습시켜서 범용적으로 사용하긴 괜찮지만, 특정 분야에 깊숙이 들어오긴 한계가 있다. 범용적인 AI로 활용할 순 있지만, 특정 분야에 전문적으로 사용하긴 어렵다는 뜻이다. 물론 거대 언어모델도 대규모 학습을 통해 특정 분야 전문가 AI를 만들 수 있다. 의료 분야에 접목한다고 하면 책도 많이 보고 논문도 많이 봤기 때문에 의학 지식이 쌓여 그 분야에 대한 전문가가 될 수 있어서다. 하지만 실제 비즈니스 사용에서는 다른 얘기다. 의료기관을 예로 들면 각 병원은 사용하는 용어와 단어가 달라 경력 많은 직원도 이직했을 때 적응 시간이 필요하다. 금융권도 마찬가지다. 금융 지식이 해박한 사람도 특정 은행에서 종사하려면 그 은행의 시스템과 기술적인 부분을 잘 알아야 한다. 거대 언어모델은 많은 정보를 알지만, 특정 은행과 병원의 시스템은 알지 못한다. 그래서 비즈니스 적용이 어려운 편이다.”
- 각 비즈니스에 적용이 어려운 것은 비용 문제 때문인가.
“맞다. 범용적으로 사용되는 대규모 언어모델을 기업에 특화해 사용하긴 1차적으로 비용부담이 크다. 일례로 챗GPT는 1750억 개의 파라미터(매개변수)를 가진 GPT-3.5를 기반으로 만들어졌다. 오픈AI는 GPT-4의 파라미터는 공개하지 않았지만, 일부 얘기처럼 1조 개까진 아니고 5000억 개 정도가 될 것으로 보인다. 이처럼 크기가 큰 초거대 AI는 데이터 학습에만 막대한 비용이 들어간다. 발생하는 전력량도 상당하다. 이처럼 큰 모델을 실제 기업이 사용하긴 부담스럽다. 우리가 개발한 AI 모델도 상당히 경량화했음에도 불구하고 그래픽처리장치(GPU) 사용 등에 부담이 있다는 피드백을 많이 받는다. 이처럼 대규모 언어모델은 부정적으로 보면 AI 확산하는 데 있어서 허들이 되는 요소도 있다.”
- 그러면 기업들이 AI를 적용하기 위해선 어떻게 하면 좋을까.
“경량화 모델을 사용하는 게 유리하다. 사실 기업이 AI를 만들 때 초거대 AI에 들어가는 데이터처럼 막대한 양을 학습시키지 않는다. 그만큼 충분한 양의 데이터가 없다. 따라서 적은 데이터에서 정확한 정보만 추출해 사용하는 방식을 취한다. 이 과정에선 경량화된 모델을 사용하는 것이 더 효율적이다. 경량화 모델이 유리한 또 다른 이유는 정기적인 업데이트가 쉽다는 점이다. 거대 언어모델은 추가 학습에 엄청난 비용이 든다. 따라서 모델 업데이트가 힘들다. 그런데 기업 비즈니스는 유동적이라 잦은 업데이트가 필요하다. 이 때문에 기업에서는 범용적으로 사용되는 범용 AI 보단 유연한 경량화 모델 사용이 적합하다.”
- 포티투마루는 기계독해(MRC) 기반 질의 생성 AI 등을 기업에 공급하고 있는 것으로 안다.
“전자, 통신, 조선해양, 자동차, 은행, 증권, 유통, 미디어, 법률, 교육, 헬스케어 등 다양한 분야에 기술을 공급하고 있다. MRC는 말 그대로 글을 독해할 수 있는 AI 기술을 뜻한다. 논문, 책, 기사 등 다양한 글을 독해할 수 있다. 우리는 이 기술을 기반으로 질문하고 답도 만드는 기술을 개발했다. 또 워드, 한글, PDF 등 모든 문서 형식을 독해할 수 있게 했다. 각 기업은 이 기술을 활용해 대화형 AI 등 다양한 서비스를 만들어가고 있다. 현대자동차는 자동차 설명서를 우리 모델로 학습해 사용자가 궁금해하는 내용을 실시간으로 답변할 수 있는 기술을 차에 탑재했다. “주유구는 어디 있어?”라고 물으면 설명서를 모두 학습한 AI가 그 위치를 알려준다. 두꺼운 설명서를 사용자가 다 이해하고 있지 않아도 AI와 소통하며 답을 알려주는 기술을 구축한 것이다.”
- MRC 기술이 업무 자동화에 유리할 것 같다.
“그렇다. 병원을 예로 들면 각 업무가 단계적으로 나눠져 있는 경우가 많다. 응급환자가 들어오면 그날 당직 선생은 누구인지, 골절이나 외상은 누구에게 전화해야 하는지 등을 하나하나 찾아보며 업무한다. 그러다 보면 골든타임을 놓치는 경우가 생긴다. 우리 기술을 도입한 한 병원은 의사나 간호사가 환자의 증상이 어떤지 확인하면 그다음은 관제시스템에서 그날 당직이 누군지 체크하고 응급실까지 얼마나 걸리는지, 동선은 어떻게 되는지 등을 AI로 가능하게끔 시스템을 구축해놨다. 조각처럼 나뉘어 있던 업무들이 하나로 자동화된 것이다. 이처럼 기계독해 기반 AI 기술은 다양한 업무의 자동화를 이끌고 있다.”
- MRC가 많이 연구되고 있는 것으로 알지만, 상용화한 기업은 소수다. 그 이유는 무엇인가.
“MRC가 본격적으로 연구된 지는 4~5년 됐기 때문에 많은 곳에서 활발하게 연구하고 있지만, 상용화가 되는 경우는 드물다. 그 이유는 MRC만으로 기술 상용화가 이뤄지는 것은 아니기 때문이다. 독해는 지문을 주고 그다음 질문을 주면 답을 찾는 것이다. 그런데 일상에서 보면 질문이 들어오는 경우는 많지만 답이 입력되는 경우는 적다. 콜 센터만 봐도 사람들이 질문을 하지, 답을 하는 경우는 드물지 않은가. 그래서 지문 검색이라는 기술이 필요하다. 지문에 필요한 내용을 찾아서 엔진에 입력하는 기술이다. 그래야 AI가 답을 찾을 수 있다. 우리는 검색 기술을 약 20년 했기 때문에 이 부분을 해결해 기술을 상용화할 수 있었다.”
- 최근 초거대 AI 기반 생성 기술이 놀라운 속도로 발전하고 있다. 위기의식도 있을 것 같은데.
“앞으로 AI 모델은 계속 커질 것으로 보인다. 사실 파라미터를 늘리는 것은 어려운 일이 아니다. 비용과 시간문제다. GPU 등 컴퓨팅 자원이 충분하고 자금이 있으면 파라미터는 계속 늘려갈 수 있다. 하지만 이러한 거대 언어모델에서 한계가 하나둘 나타나고 있다. 이 때문에 경량화 모델에 관한 연구도 활발히 이뤄지는 중이다. 우리는 경량화 측면에서 기술을 계속 고도화해나갈 것이다. 최근 몇 개 기업에서 GPT 등 거대 언어모델을 사용하다가 다시 우리 기술을 활용하는 경우가 있었다. 거대 언어모델이 좋지만, 특정 분야에서는 퍼포먼스가 비슷해 효율적이지 않다는 판단에서다. 이처럼 우리는 실제 기업이 사용할 수 있는 AI 기술 개발에 집중하겠다.”

김동원 기자 theai@chosun.com

인더스트리

“비즈니스에선 챗GPT보다 경량화 AI가 유리”

최신뉴스