한국항공대학교 소프트웨어학과

생성형 인공지능(AI) 기술 경쟁이 본격화되면서 글로벌 빅테크 기업들이 시장 주도권 확보를 위해 분주히 움직이는 모양새다. 오픈AI와 구글이 앞다퉈 신기술을 선보이면서 AI 대중화도 빠르게 진행되는 분위기다.

16일 업계에 따르면 오픈AI는 지난 15일(현지시간) 문장을 최대 1분 길이 동영상으로 만들어주는 멀티모달 AI '소라(Sora)'를 공개했다. 기존 비디오 생성 AI가 4초 단위의 영상만 제작했던 것에 비해 생성 능력이 많이 향상됐다.

소라는 텍스트만으로 동영상을 생성할 수 있고 기존의 이미지를 동영상으로 생성할 수도 있다. 기존 동영상을 확장하거나 누락된 프레임을 채울 수도 있다. 다만 소라는 제한된 수의 창작자에게만 일단 허용된다. 실제 출시에 앞서 안전성 여부를 평가하기 위해서다.

앞서 페이스북 모회사 메타와 구글, 스타트업 런어웨이 AI 등도 '텍스트 투 비디오(Text to Video)' 모델을 개발한 바 있다. 오픈AI는 소라가 기존 모델보다 명령어의 맥락을 더 잘 파악할 수 있다는 것을 강점으로 내세우고 있다.

오픈AI는 "소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 묘사를 통해 복잡한 장면을 생성할 수 있다"며 "소라가 일반인공지능(AGI) 달성을 위한 중요한 이정표가 될 것"이라고 밝혔다.

이에 질세라 구글도 차세대 AI 모델 '제미나이 1.0 프로'의 업데이트 버전인 '제미나이 1.5 프로'를 공개하며 대응에 나섰다. 지난 8일 최상위 모델 '울트라 1.0'을 공개한 지 일주일 만이다.

제미나이는 학습 규모에 따라 나노, 프로, 울트라 3종류로 나뉜다. AI 모델이 한 번에 처리할 수 있는 정보의 양을 '콘텍스트 윈도(context window)'라고 하는데, 이는 단어·이미지·영상·오디오·코드 등의 의미를 가진 '토큰(token)'이라는 단위로 구성된다.

이날 공개한 제미나이 1.5 프로는 텍스트·이미지·음성·영상을 생성하는 중급 멀티모달 모델로, 한 번에 최대 100만 개의 토큰을 처리할 수 있다. 이는 현존 최대 수치로, 기존 제미나이 1.0 프로(3만2천 개), 경쟁사 오픈AI의 GPT-4 터보(12만8천 개)에 비해 월등하다.

제미나이 1.5 프로는 개발자를 위한 AI 개발 도구인 '구글 AI스튜디오'와 기업들이 AI 모델을 활용할 수 있는 플랫폼 '버텍스 AI'를 통해 프리뷰 버전으로 제공된다. 정식 버전에서는 12만8천 개 토큰이 기본 제공되고, 구매 옵션으로 토큰을 늘릴 수 있다.

구글은 "1시간의 비디오, 11시간의 오디오, 3만줄 이상의 코드, 70만 단어 이상의 코드베이스를 한 번에 처리할 수 있는 용량"이라며 "기존 모델을 개선하면서 구글의 최신 AI 모델인 '제미나이 1.0 울트라'와 비슷한 수준으로 성능을 높였다"고 설명했다.

메타는 지난 해 11월 이미지 생성 모델인 '에뮤(Emu)'의 기능을 개선해 텍스트로 영상을 편집하고 생성할 수 있는 기능을 추가했다. 이를 페이스북, 인스타그램에 연내 적용할 예정이다.

메타는 "에뮤는 지난해 출시한 영상 도구 '메이크-어-비디오' 시스템보다 한 단계 더 발전한 기능"이라고 말했다.

또 메타는 같은 해 5월 MTIA(Meta Training and Inference Accelerator)라는 자체 설계 칩을 처음 공개하며 AI 개발에 주력하고 있음을 알리기도 했다. 올해는 엔비디아의 고성능 그래픽처리장치(GPU) 등을 수십만 개를 구입해 지금보다 더 강력한 AI 모델을 개발한다는 방침이다.

메타 외에도 구글은 최신 칩(TPUv5p)을 자사 대규모 언어 모델(LLM)인 제미나이에 적용했다. 마이크로소프트(MS)도 '마이아 100'이라는 칩을 공개한 바 있다. 챗GPT 개발사 오픈AI는 자체 칩을 개발·생산하기 위한 네트워크를 구축하기 위해 삼성전자, SK하이닉스 등 글로벌 반도체 기업들과 논의 중이다.

업계 관계자는 "현재 AI 칩 시장은 엔비디아가 80% 가까이 장악하고 있다"며 "AI 모델을 훈련하는 데 필요한 AI 칩 공급 부족 등으로 주요 기업들이 자체 칩을 개발하고 있다"고 설명했다.

업계에선 글로벌 빅테크들의 경쟁이 AI를 넘어 검색 등 더 다양한 분야로 확대될 것으로 예상했다. 오픈AI는 최근 구글이 장악하고 있는 검색 시장을 노리고 마이크로소프트(MS) 검색엔진인 '빙'을 기반으로 검색 서비스를 개발 중인 것으로 알려졌다.

업계 관계자는 "생성AI 문서와 이미지에 이어 영상을 생성하는 분야에서도 AI 기술 주도권 경쟁이 치열한 분위기"라며 "빅테크간 경쟁 격화에 AI 기술력이 더욱 빠르게 고도화되고 있다"고 밝혔다.

학과/분야 뉴스

[기사] "AI 주도권 우리가 잡는다"…글로벌 빅테크, 신기술 경쟁 치열

[기사] 30만 AI 개발자 모인다...엔비디아 'GTC 2024' 임박

[기사] AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"