뉴스 바로가기

기사 상세

IT·과학

인공지능 학습용 데이터사업 참여기업, 美CES서 날았다

이재철 기자
입력 : 
2023-01-09 16:22:08

글자크기 설정

데이터가 국부(國富)다 4
매일경제·한국지능정보사회진흥원 공동기획
사진설명
'에이아이포펫·아람휴비스·딥브레인.'

지난 5일(현지시간) 미국 라스베이거스에서 개막한 세계 최대 가전·ICT 박람회인 'CES 2023'에서 이들 한국 기업이 혁신상을 수상해 주목을 받았다.

CES 혁신상은 박람회를 주최하는 전미소비자기술협회(CTA)에서 세계를 선도할 혁신기술과 제품에 수여하는 상이다. 박람회 최고의 영예로, 이 상을 받은 기업에는 한 가지 공통점이 있다. 바로 정부 주도 인공지능(AI) 학습용 데이터를 구축·활용한 기업이라는 점이다. 이 중에서도 에이아이포펫은 전년에 이어 2회 연속 수상하는 쾌거를 이뤘다.

이 회사는 반려동물을 위한 인공지능 홈케어 앱인 '티티케어'로 주목받고 있다. 반려동물의 눈과 피부 사진을 찍어서 티티케어 앱에 올리면 11가지의 눈 질환 관련 이상 징후를 안내받을 수 있다. 이용자는 소중한 반려견이 어떤 피부병 징후가 있는지 파악할 수 있고 이를 토대로 '가까운 동물병원에 가보라'는 조언도 받는다. 이런 서비스를 만들기 위해 막대한 학습용 데이터를 활용했다.

이처럼 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 함께 추진하고 있는 인공지능 학습용 데이터 구축 사업은 핵심 수요 기업인 스타트업과 중소기업에 든든한 힘이 되고 있다.

사진설명
◆ 세계 최대 인공지능 학습용 데이터 개방

지난해 기준 한국어, 영상·이미지, 헬스케어, 농축수산, 재난·안전·환경, 교통·물류 등 6대 분야에서 381종의 학습용 데이터가 개방됐는데 이는 전 세계 최초로 한국이 가장 방대한 학습용 데이터를 구축하고 이를 국민에게 개방한 사례다.

인공지능 통합 플랫폼인 'AI 허브'를 통해 누구나 이용 가능한 해당 데이터들은 그동안 시간과 비용 문제로 인해 데이터를 구하지 못하고 있는 국내 데이터 연구 개발자들에게 단비가 돼 혁신 서비스 출현을 추동하고 있다. 특히 인공지능 학습용 데이터 사업에 참여한 기업들의 비약적인 성장에도 효자 노릇을 톡톡히 하고 있다.

2022년 인공지능 학습용 데이터 구축·활용 종합 성과보고서에 따르면 전 산업 업종에서 중소기업들이 2017~2020년 사이 3.5%의 연평균 매출 감소를 경험했다. 반면 같은 기간 인공지능 학습용 데이터 구축 사업에 참여한 기업들은 7.1% 매출 성장을 거두는 등 현격한 대조를 이뤘다.

사진설명
◆ 타 산업군과 융합 효과로 성장동력 확대

한국지능정보사회진흥원에 따르면 인공지능 학습용 데이터 특성상 인공지능 전문가뿐만 아니라, 이들과 협업해 해당 분야 특성을 짚어주고 알려줄 도메인 전문가가 반드시 필요하다. 이러한 특성으로 인해 사업 참여자들이 타 분야와의 새로운 네트워크가 형성되고 융합이 촉진돼 새로운 부가가치를 창출할 여력이 확대되는 선순환을 이루고 있다는 평가다.

실제 최근 한국지능정보사회진흥원이 발간한 'AI 학습용 데이터 파급효과 분석에 관한 연구' 보고서에 따르면 2000년부터 지난해까지 AI 학습용 데이터 구축에 투입된 정부 투자액 1조3000억원이 산업 생산활동 등에서 8조3000억원의 산출 증대 효과를 가져올 것으로 전망됐다. 부문별로 산업 생산활동에서 4조원의 규모 증대가 이뤄지고 부가가치가 2조원 가까이 늘어나는 것으로 예측됐다.

이와 함께 인공지능 학습용 데이터에 대한 정부와 민간 투자가 함께 이뤄졌을 경우 산업 생산, 부가가치 등에서 일어나는 산출 증대 효과는 9조2000억원으로 전망됐다. 이는 정부 투자만 이뤄졌을 때보다 9000억원 많은 것이다. 연평균 투자 수익률도 166%로 올라갔다.

보고서는 "인공지능 학습용 데이터 구축을 위한 정부의 예산 투자가 민간 부문의 투자를 유인하고 확대하는 마중물로서 역할을 하는 것이 효과적"이라고 분석했다. 아울러 보고서는 인공지능 학습용 데이터 축적이 국민들의 기대수명을 높일 수 있을 것으로도 기대했다.

인공지능 학습용 데이터를 기반으로 암, 알츠하이머병 등을 진단할 수 있는 인공지능 서비스를 개발하면 사망 원인이 되는 질병 발생을 예방하거나 조기 발견을 통해 완치율을 높인다는 기대에서다. 특히 위암, 대장암, 간암, 폐암, 알츠하이머병, 뇌혈관 질환에 대한 영상 데이터가 특정 사망 원인 제거에 영향을 끼칠 수 있는 것으로 제시됐다.

그동안 특정한 지표 없이 체감으로만 느껴지던 인공지능 학습용 데이터 구축 사업으로 인한 경제 성장 기여도가 이 같은 분석을 통해 객관적인 수치로 증명된 것이다.

◆ 사회적 약자 돕는 역할 톡톡

인공지능 학습용 데이터 사업은 비단 성장동력 확충 효과 뿐 아니라 국민이 체감하고 사회적 약자를 돕는 혁신 서비스 출현에도 상당한 역할을 하고 있다.

일례로 KT는 2021년 광주광역시와 함께 'AI 스피커를 활용한 어르신 돌봄 사업'을 추진했는데 광주 지역 어르신의 사투리(방언) 때문에 KT의 AI 스피커가 명령어를 잘 인식하지 못하는 상황이 발생했다. 어르신들의 실제 사투리 음성이 녹음된 데이터를 확보하기가 매우 힘든 환경에서 KT는 인공지능 학습용 데이터 구축 사업에 참여해 전라도 사투리 데이터를 대규모로 구축할 수 있었다. 이를 인공지능 스피커에 학습시켜 실제 광주 어르신의 말씀 인식률을 개선하는 데 성공했다. 이렇게 향상된 기술이 적용된 인공지능 스피커를 통해 지난해 5월께 60대 남성의 구조 요청을 접수하고 인명 구조에 도움을 주기도 했다.

2001년 설립된 소리자바의 경우 속기, 교육, 자막 등 비정보기술(IT) 사업으로 시작해 기존 속기록 데이터를 학습용으로 활용하는 데이터 사업을 시작하며 인공지능·소프트웨어(SW) 기업으로 성장하고 있다. 이 과정에서 인공지능 학습용 데이터 구축 사업에 참여해 청각장애인을 위한 실시간 자막 생성 앱 '이어줌'을 개발해 서비스하고 있다. 이 서비스는 음성 신호를 실시간으로 자막 변환해 제공하는 것으로, 분야별 인식률은 △뉴스 93.31% △다큐 91.68% △드라마 88.10% 등이다. 전체 평균 인식률도 88.92%에 달해 청각장애인이 모바일 환경에서 불편함 없이 미디어 콘텐츠를 볼 수 있도록 돕고 있다.

소리자바 측은 "NIA의 인공지능 데이터 구축 노하우를 토대로 언제 어떤 환경에서도 저작 도구를 개발할 수 있다는 역량과 자신감을 가지게 됐다"고 평가했다.

씨유박스의 경우 안면 이미지 데이터를 구축해 개발한 '안면인식 AI 기술'로 2021년 국내 최초로 미국표준기술연구소(NIST)가 주관하는 얼굴인식 알고리즘 공급업체 평가(FRVT·Face Recognition Vendor Test)에서 최상위권 성적을 달성하는 등 기술력을 인정받았다.

씨유박스가 짧은 기간 안에 세계 최고 수준의 얼굴인식 알고리즘 성능을 확보하게 된 계기 중 가장 큰 역할을 한 것이 바로 NIA와 수행한 인공지능 학습용 데이터 구축 사업이었다. 이를 통해 대규모 학습용 데이터를 제대로 구축하고 이를 효율적으로 활용하는 경험과 노하우를 키웠다. 현재 씨유박스의 얼굴 인식 알고리즘은 여권과 항공권을 제시하지 않고 얼굴 제시만으로 국제선 탑승 수속과 출국신고, 항공기 탑승 등을 완료할 수 있는 수준이다. 이를 바탕으로 인천국제공항 스마트패스 사업을 비롯해 주요 금융사들의 비대면 계좌 개설 등 다양한 분야에서 서비스가 활용되고 있다.

한국지능정보사회진흥원은 "인공지능 학습용 데이터 구축 사업은 이처럼 인공지능 데이터 기술 발전뿐만 아니라 기업의 성장과 산업 생태계 발전, 나아가 국가 경제 발전에까지 기여할 정도로 중요한 사업으로 발돋움했다"며 "그 파급 효과는 산업 전체에서 보다 다양하게 나타날 것"이라고 자신했다.

[이재철 기자]

이 기사가 마음에 들었다면, 좋아요를 눌러주세요.