학과/분야 뉴스

  • 학과 소식
  • 학과/분야 뉴스

[기사] 홍수 예측하고, AI가 작곡과 소설 창작까지…구글의 AI는 이런 것까지 한다

  • 소프트웨어학과
  • 2022-11-03
구글 AI 행사. /구글 유튜브 캡처

말만 하면 AI(인공지능)가 동영상을 만들어주고, 동영상에 삽입될 음악을 창작해주며, 이와 관련한 소설을 작성한다. 방언만 사용하는 아프리카 소수 부족과 번역 앱을 통해 의사소통을 한다. 비가 오면 어느 강에서 홍수가 날지 미리 알 수 있다.

이는 구글이 AI를 통해 만드는 미래의 모습이다. 2일(현지시각) 세계 최대 검색 기업 구글이 미 뉴욕 구글 오피스에서 ‘AI 연례 컨퍼런스’를 열고 강화된 AI 기능을 대거 공개했다. 실생활에 하나둘씩 적용되는 AI 기술의 활용 범위를 대폭 확장한 것이 특징이다. 전설적인 프로그래머로 알려진 구글의 제프 딘 부사장 겸 시니어펠로우는 “AI의 발전이 지금 당장은 매우 빠르게 느껴질 수 있지만 사실은 오랜 발전 과정에서 나온 것”이라며 “신경망 아키텍처, 머신러닝 알고리즘, 머신러닝 하드웨어의 발전은 AI가 실제 삶 속 문제를 해결하는 데 도움이 되고 있다”고 했다. 

구글은 이날 최근 테크 업계의 가장 큰 화두인 ‘제너레이티브(생성) AI’ 기술을 대거 공개했다. 사람이 문자로 명령을 입력하면 AI가 이미지나 동영상, 음악 등을 창작해 내놓는 것이다.

구글은 올 5월 문자-이미지 변환 AI 모델인 이매젠을 공개한 데 이어, 이날 텍스트 명령으로 고해상도 영상을 만들어내는 ‘이매젠 비디오’와 ‘페나키’ 모델을 공개했다. 구글의 모델로 만든 동영상은 메타 등 다른 업체가 만든 문자-동영상 변환 AI 모델보다 고화질이고, 재생 시간이 더 길다. 이날 구글은 여러 개의 영상을 보여줬는데 그 중 하나인 45초짜리 동영상에서는 나뭇가지에 걸린 파란색 풍선이 보이다가 카메라가 왼쪽으로 이동하며 동물원 속 기린의 모습을 보여준다. TV나 영화에서 보는 화질에는 미치지 못하지만 나름 자연스럽다. 

구글은 또 6초 분량의 음성만 있으면 이를 기반으로 사람의 목소리를 재현하고, 피아노 음악까지 만들어주는 ‘오디오LM 기술’, 구글의 AI 언어모델인 람다를 활용해 짧은 문장을 던지면 AI가 다음 문장을 만들어내는 ‘워드크래프트’도 선보였다. 구글은 “워드크래프트는 전문 작가들과 협업하고 있다”고 했다.

구글은 또 사람이 언어로 명령하면, AI가 스스로 코딩을 하는 기능도 공개했다. 일반 코드뿐만 아니라 로봇 동작을 제어할 수 있는 코드도 능숙하게 짜낸다.