닫기

그랜드배너

실시간뉴스

여의도 미성 28억원…기흥 다가구주택 30명 몰려[경매브리핑]

무한도전 '인간 vs 콤바인'의 추억[생활속산업이야기]

삼성·LG·효성 재벌 나온 ‘솥바위 전설’의 의령전통시장[전국시장자랑]

조용하고 강력하다…‘도시형 프리미엄 SUV’ 렉서스 RX 450h+[타봤어요]

동춘서커스의 놀라운 근황…"월 1만명 찾아오고 있죠"

오늘 전국 흐리고 비…낮 최고 17~22도

SSG닷컴, ‘최정 468 홈런 모먼츠 앨범’ 단독 판매

[카드뉴스]2024년 5월 둘째 주 ‘별자리 운세’

[전립선 방광살리기]가정의 달, 부모님 소변 증상 꼭 챙기세요

순식간에 사라진 36명…나들이객 덮친 ‘살인파도’ [그해 오늘]

이데일리

이데일리

2024년 05월 05일 일요일

실시간뉴스

여의도 미성 28억원…기흥 다가구주택 30명 몰려[경매브리핑]

무한도전 '인간 vs 콤바인'의 추억[생활속산업이야기]

삼성·LG·효성 재벌 나온 ‘솥바위 전설’의 의령전통시장[전국시장자랑]

조용하고 강력하다…‘도시형 프리미엄 SUV’ 렉서스 RX 450h+[타봤어요]

동춘서커스의 놀라운 근황…"월 1만명 찾아오고 있죠"

오늘 전국 흐리고 비…낮 최고 17~22도

SSG닷컴, ‘최정 468 홈런 모먼츠 앨범’ 단독 판매

[카드뉴스]2024년 5월 둘째 주 ‘별자리 운세’

[전립선 방광살리기]가정의 달, 부모님 소변 증상 꼭 챙기세요

순식간에 사라진 36명…나들이객 덮친 ‘살인파도’ [그해 오늘]

menu

경제: 정책; 금융; 채권; 외환; 조세; 산업·통상

사회: 복지·노동·환경; 교육; 지자체; 법조·경찰; 의료·건강; 사회공헌; 사회일반

기업: 전자; 자동차; 생활; 산업; 중소기업; 아웃도어·캠핑; 기업일반

증권: 주식; 종목; 펀드; 국제시황; 글로벌마켓

제약·바이오: 다크호스; 리포트; UP&DOWN; 지금업계는

부동산: 부동산시황; 재테크; 분양정보; 건설업계동향; 부동산정책; 개발·건설

오피니언: 사설; 데스크칼럼; 서소문칼럼; 기자수첩; 인터뷰; 인사·부고

정치: 대통령실·행정; 정당; 국방·외교

IT·과학: 모바일; 방송통신; IT·인터넷; 게임; 과학일반

연예: 방송; 음악; 영화
스포츠: 야구; 축구; 골프; 스포츠일반

글로벌: 경제·금융; 증권; 기업; 정치; 해외토픽; 국제일반

문화: 공연·뮤지컬; 미술·전시; 책; 여행·레저; 패션·뷰티; 웰빙·음식; 라이프; 일반

연재
이슈
포토
영상
오토in
골프in

팜이데일리
마켓in
스냅타임
기자뉴스룸
다문화동포

search

search

: 제주관광공사 지역 프로구단과 스포츠 관광 활성화

마이크로소프트, 질문에 답하고 그려주는 '비주얼챗GPT' 선보여

'깃허브'에 비주얼기초모델 논문, 자료 공개
기존 시각 모델 통합..피드백 반영해 시각적 효과로

등록 2023-03-12 오후 4:58:38

수정 2023-03-12 오후 4:59:15
가 가

강민구 기자

[이데일리 강민구 기자] 마이크로소프트(MS)가 언어를 이해해 답해주고, 그려주고, 수정해 시각화 이미지로 만들어주는 새로운 챗봇 모델을 공개했다.

MS는 최근 오픈소스 공유 플랫폼 ‘깃허브(GitHub)’에 ‘비주얼챗GPT’ 모델을 공개했다. 여러 시각화 모델을 통합한 비주얼기초모델(Visual Foundation Model)의 도움으로 ‘챗GPT’가 사용자가 원하는 시각적 방식으로 표현하도록 돕도록 했다.

‘비주얼챗GPT’ 구현 사례.(자료=‘Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models’ 논문 일부 갈무리)

사용자가 비주얼챗GPT에 이미지를 올리거나 질문을 문자로 입력하면 모델이 해당 이미지와 문자를 분석해 새로운 이미지나 텍스트로 만들어 준다.

가령 사용자가 푸른 옷을 입은 노인의 사진을 올린뒤 “노인이 입은 옷 색깔은 무엇입니까?”라고 물으면 ‘노인이 입은 옷은 파란색입니다.“라고 답해준다. 또는 “그림을 잘 못그리니 사과를 그려달라”라고 하면 사과가 그려진 사진을 만들어준다.

사진 내용 일부도 바꿀 수 있다. 개를 안고 있는 소녀 사진에 대해 “근사하게 보이지만, 개를 고양이로 바꿔달라”고 하면 개만 고양이로 변환된 그림으로 변환한다.

연구진은 “비주얼 기초 모델을 통합해 사용자가 챗GPT와 상호작용할 수 있는 모델을 만들었다”며 “여러 입·출력 모델과 시각적 피드백을 고려한 결과로, 챗GPT가 시각적 역할을 하도록 문을 열어준다”고 설명했다.

‘비주얼챗GPT’ 구현 화면.(자료=GitHub)

주요뉴스

네이버배너

저작권자 © 이데일리 - 무단전재, 재배포 금지 뉴스레터 구독 | 지면 구독

이데일리
추천 뉴스by Taboola

실시간
급상승 뉴스

: 카드뉴스[카드뉴스]2024년 5월 둘째 주 ‘별자리 운세’

오늘의
포토

왼쪽 오른쪽

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

왼쪽 오른쪽

당신의 드림카는?ㅣ오토in
- 조용하고 강력하다…‘도시형 프리미엄 SUV’ 렉서스 RX 450h+[타봤어요]
나이스 샤아앗~ㅣ골프in
- [포토]박단유 '버디 퍼트 떨어져라'

왼쪽 오른쪽

이슈기획 ㅣ 저출산 시대
- 日도 5월 5일 어린이날…어린이 인구 43년째 감소
이슈기획 ㅣ 의사 파업 장기화
- 서울의대 교수 63% "전공의 이탈에 피로 누적, 진료 줄여야"
이슈기획 ㅣ 방시혁-민희진 전면전
- 하이브, 민희진 내홍 속 현금창출력 반토막[마켓인]
이슈기획 ㅣ 이란, 이스라엘 공격
- '가자전쟁 규탄' 튀르키예, "이스라엘과 무역 전면 중단"
이슈기획 ㅣ 720일 만에 첫 영수회담
- 영수회담, 만남 자체로 의미있다고 할 때인가[기자수첩]

알립니다

2024년 이데일리 편집부 편집기자 모집

[마감] 2024년 이데일리 글로벌경제부 인턴기자 모집

이데일리 주식회사 제24기 결산공고

뉴스레터를 신청하세요 확인

이데일리

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원

ⓒ 이데일리. All rights reserved