뷰페이지

“AI, 인터넷 정보 학습료 내”… SNS 대화·기사도 ‘가격표’

“AI, 인터넷 정보 학습료 내”… SNS 대화·기사도 ‘가격표’

김민석 기자
김민석 기자
입력 2023-05-02 01:46
업데이트 2023-05-02 01:46
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

청구서 날리는 업계

‘챗GPT’·‘GPT’ 상표권 출원
AI엔 SNS 대화가 학습 자료 돼
트위터·레딧 대화DB 유료 추진
언론도 동의 없는 뉴스 활용 반대
“인터넷 정보 사고파는 시장 열려”


이미지 확대
챗GPT를 비롯한 초거대 언어 모델 기반 인공지능(AI) 챗봇이 정보기술(IT)업계에 큰 파장을 일으키면서 유료 데이터의 범위가 넓어지고 있다. 과거 당연히 무료로 여겨졌던 소셜미디어상 대화 내용이나 기사에 담긴 정보 등 인터넷의 방대한 기록에 가격표가 붙기 시작하는 것이다.

최근 오픈AI는 챗GPT나 GPT의 상표권을 출원하고 명칭을 무단으로 사용할 수 없게 했다. 앞서 챗GPT의 월 20달러 구독 상품을 출시하고 GPT4 출시와 함께 파라미터 수나 학습한 데이터 셋 등 어떤 정보도 공개하지 않으면서 2015년 출범 당시 추구했던 비영리단체와는 멀어진 모습이 됐다.

이에 트위터와 레딧은 사용자 대화 데이터베이스에 접근할 수 있는 응용프로그램 인터페이스(API)의 유료화를 추진하고 있다. 챗GPT가 IT 업계에 불러온 엄청난 영향과 이를 이용한 오픈AI의 다양한 수익화를 목격한 시장이 더이상 AI에 공짜 학습 자료를 제공할 필요가 없다고 판단하기 시작한 셈이다. 특히 사람처럼 말하는 것이 기술의 지향점인 초거대 언어 모델엔 자연스러운 말투나 구어체 표현 등을 익히는 것이 중요하다. 그래서 소셜미디어에서 사용자들이 생성한 대화 데이터는 아주 방대하고 귀중한 학습 자료가 됐다.

사람들끼리 쉽게 공유하던 정보들도 AI엔 유료로 제공하는 추세도 일어나고 있다. 개발자들이 서로 질문하고 답하는 사이트인 스택오버플로는 대형 AI 회사에 사용자 작업 데이터 접근 비용을 청구할 계획이다. 여기에 미국 언론사를 대표하는 뉴스미디어연합도 회원사가 생산한 저작물로 AI를 학습시킬 경우 라이선스 비용을 지불해야 한다고 선언했다. 월스트리트저널은 이 문제로 오픈AI에 대한 소송을 검토하고 있기도 하다.

이런 흐름은 국내에서 초거대 언어 모델 기반의 AI 서비스를 개발, 수익화하려는 기업에 영향을 미친다. 네이버와 카카오는 당장 오픈AI의 상표권 출원에 따라 ‘서치GPT’(네이버), ‘코(KO)GPT’(카카오) 등 AI 서비스 이름을 바꿔야 한다.

특히 오는 7월 네이버가 공개 예정인 초거대 AI ‘하이퍼클로바X’는 50년치 뉴스와 9년치 블로그 등 막대한 데이터를 학습하는 것으로 알려졌는데, 국내 언론계도 사전 동의 없이 뉴스 서비스 이외의 목적에 데이터를 활용해선 안 된다는 입장이다.

다만 유료 데이터 셋을 가공하는 시장이 커지면 스타트업 등에 기회가 많아지는 효과도 있다. 국내 AI 업계 관계자는 “과거엔 ‘가치 있는 데이터’로 인식되지 않았던 인터넷상의 방대한 정보를 사고파는 ‘시장이 열렸다’는 관점이 커지고 있다”며 “생성형 AI가 늘어날수록 데이터 확보 경쟁이 거칠어지고, 이에 따라 유료화 흐름도 커질 것으로 보인다”고 말했다.
김민석 기자
2023-05-02 19면

많이 본 뉴스

‘금융투자소득세’ 당신의 생각은?
금융투자소득세는 주식, 채권, 파생상품 등의 투자로 5000만원 이상의 이익을 실현했을 때 초과분에 한해 20%의 금투세와 2%의 지방소득세를, 3억원 이상은 초과분의 25% 금투세와 2.5%의 지방소득세를 내는 것이 골자입니다. 내년 시행을 앞두고 제도 도입과 유예, 폐지를 주장하는 목소리가 맞서고 있습니다. 당신의 생각은?
제도를 시행해야 한다
일정 기간 유예해야 한다
제도를 폐지해야 한다
모르겠다
광고삭제
위로