포스텍 연구팀, '소리→영상·텍스트' 전환 기술 개발...'짹짹' 하자 AI가 참새 영상을

URL복사

'사운드 투 신'(Sound2scene) 기술 개념도 (출처: 오태현 포스텍 교수)

챗GPT, GPT-4가 산업혁명을 이끈 증기기관 발명에 비견되고 있지만, 텍스트와 이미지 중심인 GPT 시리즈가 아직 다루지 못하는 영역이 있다.

바로 영상 생성 기술이다. 그런데 국내 연구진이 영상 인공지능(AI) 기술에서 괄목할만한 성과를 잇달아 내놔 독자적인 파운데이션 모델(근간이 되는 AI) 기술이 귀한 국내 AI 업계에 희소식을 전하고 있다.

14일 AI 업계와 학계에 따르면 오태현 포스텍 교수 연구팀은 AI가 소리만 듣고 시각 장면을 영상으로 재현하는 기술을 오는 6월 캐나다 밴쿠버에서 열리는 세계 최고 권위의 AI 학회 'CVPR'에서 발표할 예정이다.

'사운드 투 신'(Sound2scene)으로 이름 붙인 연구는 말 그대로 소리 정보를 영상으로 바꿔주는 기술에 관한 것이다.

가령 참새 소리를 AI에 입력하면 나뭇가지에 앉아 지저귀는 참새 영상이 자동 생성된다.

오 교수는 "사람은 방 안에서도 바깥에서 들리는 놀이터 아이들 노는 소리, 자동차 경적 등을 듣고 놀이터 풍경이나 자동차가 지나가는 장면을 상상할 수 있듯 인공지능도 소리를 듣고 배경이 되는 장면을 만들어낼 수 있는 것"이라고 설명했다.

하지만 AI라고 해서 아무나 영상을 쉽게 생성할 수 있는 것은 아니다. 영상 생성은 이미지보다 훨씬 역동적이고 고차원적인 데이터와 기술력이 필요한 분야기 때문이다. 스테이블 디퓨전, 미드저니 등 세계적으로 인정 받는 이미지 생성 AI는 나와 있지만 영상 AI는 아직 없는 것은 이 이유에서다.

그는 "소리와 영상의 연관성을 찾기는 매우 어려운 문제로 우리 연구 이전에도 소리로부터 영상을 생성하는 연구가 있었지만, 인식이 불가할 정도의 기술력이 낮은 수준이었다"며 "세계 최초로 인식이 가능한 정도의 소리-영상 전환 기술을 개발한 것"이라고 기술 차별성을 자신했다.

오 교수 연구진은 2019년 목소리로부터 사람 얼굴을 복원하는 기술을 개발한 적이 있다. 이를 확장한 영상 생성 기술이라고 그는 설명했다.

기술 개발을 위해 오 교수 연구진은 다양한 사례에서 발생하는 소리를 모아둔 유튜브 클립 수십만 개를 분석했다.

이 기술을 활용하면 소리라는 데이터에 인식표를 붙이는 '라벨링'을 할 수 있기 때문에 음향 프로듀서가 데이터베이스 내에서 다양한 효과음을 찾을 때 일일이 들어봐야 하던 불편을 덜 수 있다.

오 교수 연구팀은 소리를 텍스트로 묘사하고 읽어주는 AI 모델도 개발했다.

6월 그리스에서 열리는 음성 신호 처리 분야의 권위 있는 학회 'ICASSP'에서 발표될 예정인 '사운드 투 텍스트' 기술은 청각 장애인이 소리 대신 글로 정보를 습득할 수 있도록 돕는 기술로도 주목된다.

연구팀은 영상 생성 기술뿐 아니라 생성형 AI의 데이터 수요 문제를 해결하는 방안도 고안했다고 한다.

소량의 실제 데이터를 활용해 AI가 합성 데이터를 생산하는 파이프라인을 개발한 것으로, 영상 속 움직임이나 3차원 내 거리(뎁스) 추정 등 문제에서 합성 데이터를 써서 실제 데이터로 학습한 모델보다도 뛰어난 AI 모델을 만들 수 있게 된다고 오 교수 연구팀은 설명했다.

이 기술은 지난 3월에 삼성휴먼테크 논문상 동상을 수상하기도 했다.

오 교수 연구팀이 개발한 영상 속 미세한 움직임을 증폭해 크게 보여주는 기술은 포스코 공장에서 시범 활용되고 있기도 하다.

오 교수는 "영상 생성 기술로 로봇의 인지 능력을 고도화하고 합성 데이터 생성 기술로 AI 산업 효율화에 기여할 수 있을 것"이라고 기대했다.

한편, 오 교수는 고등학교를 자퇴하고 자동차 정비공을 하다 미국 매사추세츠공과대학(MIT) 등에서 유학한 뒤 포스텍 교수로 임용된 입지전적인 인물로도 알려져 있다.

헬로티 김진희 기자 |

[인더스트리 솔루션 인사이트] 업계 전문가가 짚어본 스마트 제조 핵심 기술과 대전망

업계 전문가들은 스마트 제조의 핵심을 이루는 기술로 인공지능(AI), 사물인터넷(IoT), 빅데이터 분석, 로보틱스를 꼽는다. 이에 더해 이들의 융합이 제조업의 미래를 재편할 것으로 분석한다. 이 중 AI는 생산 공정 최적화 및 결함 탐지에서 중요한 역할을 하며, IoT는 기계 간 원활한 통신을 가능케해 실시간 데이터 수집 및 분석을 혁신하고 있다. 이어 빅데이터는 생산성 향상과 고장 예측에 필수적인 정보를 제공한다. 아울러 로보틱스는 무인 운영과 정밀 작업을 실현해 작업 환경을 개선하는 데 앞장서는 중이다. 이에 전문가들은 이러한 기술적 발전이 기업들에게 맞춤형 생산과 고객 요구사항에 대응하는 능력을 제공할 것이라 전망한다. [특집] 업계 전문가가 짚어본 스마트 제조 핵심 기술과 대전망 "디지털 트윈은 빅데이터 관리 기술…지멘스 엑셀러레이터로 맞춤형 솔루션 제공" "디지털 트윈, 표준 개발 및 적용이 중요…APS 솔루션으로 스마트 제조 전환 돕는다" "데이터 수집부터 분석까지…시각화 솔루션 '제네시스64'로 편리하게" [INTERVIEW] LS일렉트릭 자동화CIC 이상준 COO "함께 걸어온 도전의 50년 함께 열어갈 미래의 길이 되겠다" 한국지멘스 백광희

[한국머신비전산업협회 24년 3월 협회보] 머신비전의 현재와 미래를 한눈에…제12회 한국머신비전산업전 개최

(사)한국머신비전산업협회(회장 김일목, 이하 KMVIA)는 지난 3월 16번째 협회보를 발간했다. 이번 협회보는 3월 27일부터 29일까지 코엑스에서 개최된 한국머신비전산업전에 출전하는 협회 회원사 내용을 중점적으로 다루고 있다. 한편, 협회는 매년 상반기와 하반기 협회보를 발행하고 있다. 품질 검사에서 가장 활발하게 사용돼 왔던 머신비전 기술. 4차산업혁명 시대 모든 산업에서 머신비전이 중요한 기술로 자리잡고 있다. 특히, 최근에는 딥러닝 등 AI기술이 융합되면서 머신비전 기술도 한단계 진화되고 있다. 3D, 스마트카메라, 센서의 진화, 소형화, 임베디드 비젼, 로봇기반 비젼, AI 융합 등 요즘 머신비전 분야의 핫 키워드다. 협회보에는 회원사 소식 뿐만 아니라 국내외 최신 머신비전 산업 트렌드, 그리고 신제품과 신기술 등 다채로운 정보를 담고 있다. <2024년 3월 협회보 주요 내용> 특집 머신비전의 현재와 미래를 한눈에…제12회 한국머신비전산업전 개최 신규 회원사 인터뷰 픽잇코리아 “로봇 3D 비전 기술로 스마트팩토리 실현 가속화” 포스로직 “세계 최고 이미지 프로세싱 기술로 머신비전 시장 혁신 주도” 파아일랜드 “토탈 엣지 솔루션으로 머신

[인더스트리 솔루션 인사이트] Machine Vision & Metrology 3월호

품질 검사에서 가장 활발하게 사용돼 왔던 머신비전 및 계측 기술. 4차산업혁명 시대 모든 산업에서 머신비전은 중요한 기술로 자리잡고 있다. 특히 딥러닝 등 AI 기술이 융합되면서 머신비전 및 계측 기술도 한 단계 진화하고 있다. 3D, 스마트카메라, 센서의 진화, 소형화, 임베디드 비전, 로봇 기반 비전, AI 융합 등은 머신비전 분야의 핫 키워드다. 머신비전앤메트롤로지는 4차 산업혁명 시대 필수 기술인 머신비전과 계측 기술에 대한 국내외 최신 산업 트렌드, 신제품과 신기술 등 다채로운 정보를 소개한다. NEWS 스마트팩토리 미래 살펴보는 'Factory Innovation Week 2024' POWER INTERVIEW 지브라 테크놀로지스 코리아 서창욱 지사장 "기술력 근간으로 1등 기업 유지하며 비즈니스 확장할 것" 뷰웍스 "맞춤형 광학 솔루션으로 국내 넘어 글로벌으로" 화인스텍 "2D+3D 딥러닝 머신비전 솔루션으로 시장 점유율 확대할 것" SPECIAL REPORT 더 이상 물러설 곳은 없다! 산업 현장 안전 책임지는 '제3의 눈' 3D 카메라, 향후 5년간 머신비전 시장 성장 주도할 전망 헬로티 함수미 기자 |

AI로 진화하는 스마트 팩토리의 미래 : 어드밴텍 WISEPaaS 파트너 서밋

제조기업의 스마트 팩토리 구현 목표는 AI 기술을 만나 더 빠르게 진화하고 있습니다. 이번 웨비나는 AI 진단 솔루션, PHM, 설비 안전관리 및 원격 모니터링과 유지보수, 설비 최적 관리의 다양한 솔루션, 적용 사례와 함께 구체적인 방법에 대해서 어드밴텍과 WISE-PaaS 파트너가 함께 솔루션을 제공합니다. 산업 내 AI 도입을 가속화하는 AI 플랫폼을 바탕으로 이상탐지, 최적화 등 최첨단 AI 솔루션을 제공하는 마키나락스는 AI 비즈니스 가치 창출을 위한 MLOps 전략을 제시합니다. 제조산업 고도화를 위한 AI 분석 솔루션을 제공하는 비스텔리젼스는 실시간 데이터 수집 및 시각화를 통해 스마트 공장을 구축하고 의미 있는 인사이트를 얻는 방법을 소개합니다. 제조분야 자동화시스템, AI 분석 플랫폼 등에서 다각적 서비스를 제공하는 유디엠텍은 공정 재현 및 데이터 분석, 실시간 운영 모니터링 및 데이터 집계 등을 가능케 하는 OPTRA BLACK-BOX와 OPTRA TRACKE을 소개합니다. 퓨처메인은 실제 현장에서 40년간 축적한 전문 엔지니어링 기술력과 첨단 IT기술을 바탕으로, 설비 예지보전의 효과와 실제 사례를 살펴보며 스마트 팩토리에서 설비 최적 관

ZWCAD 완벽한 제조 소프트웨어 : CAD/CAE/CAM

다양화되는 제조 분야의 제품 경쟁력 강화를 위해 공정 과정의 세밀화와 비용 절감이 중요해지며, 설계-시뮬레이션-가공 등 제조 분야의 설계부터 가공까지 전 과정의 협업이 더 중요해지고 있습니다. 이번 웨비나는 '완벽한 제조 소프트웨어: CAD/CAE/CAM'이라는 주제로 다양한 기계 및 제조 업체의 니즈를 충족하는 분야별 솔루션 기반 최적의 소프트웨어를 소개합니다. CAD/CAE/CAM 소프트웨어를 활용했을 때, 기계, 제품, 시트메탈, 구조물, 금형 등 다각화되는 기계 및 제조 분야에 적합한 솔루션으로 제안하고자 합니다. ZWSOFT 소프트웨어를 도입한 금형 및 기계 및 제조 분야의 기업에서 설계 효율을 극대화할 수 있는 최적의 소프트웨어 활용 방안을 확인하실 수 있습니다. 국내에서 ZWSOFT사의 CAD/CAE/CAM 소프트웨어를 통해 어떻게 설계부터 가공까지 작업 효율 향상과 동시에 비용절감을 극대화할 수 있었는지 최적의 소프트웨어 활용 방안을 확인하실 수 있습니다. 헬로티 최재규 기자 |

테크노트