[디지털투데이 AI리포터] 스터빌리티 AI는 GPT-3.5와 견줄만한 성능을 보이는 2개의 대규모 언어 모델인 프리윌리(FreeWilly)1·2를 공개했다.
스터빌리티 AI가 선보인 LLM 프리윌리(FreeWilly) [사진: 스터빌리티 AI]
프리윌리1은 메타의 라마-65B를 기반으로 한 합성 데이터셋을 사용해 지도 학습 세밀 조정(SFT)을 통해 조정됐으며 프리윌리2는 라마2 70B를 통해 개발됐다.
두 모델은 다양한 벤치마크 테스트에서 GPT-3.5와 비교 가능한 성능을 보여준다고 온라인매체 기가진이 24일 전했다.
상식과 추론 능력을 검증하는 헬라스웩(HellaSwag) 테스트에서 GPT-3.5 기반 챗GPT는 85.5%의 성능을 보여준 반면, 프리윌리2는 이를 능가한 86.4%의 성능을 달성했다.
또한 AI 언어 능력을 검증하는 테스트인 MMLU 테스트에선 프리윌리2가 68.8%의 성능을 보여줬다. 챗GPT는 이보다 근소하게 앞선 70$%의 성능을 기록했다.
미국판 수능인 SAT 시험 항목에서는 프리윌리2는 (수학 과목을 제외하고) GPT-3.5와 동등하거나 더 높은 성능을 보여줬다. 스터빌리티 AI는 안전 조치를 더욱 강화하기 위해 외부 소스로부터의 피드백을 적극적으로 받고 있다.
출처 : 디지털투데이 (DigitalToday)(http://www.digitaltoday.co.kr)
글로벌 통신사 특급 동맹 출범…"AI 생태계 이끄는 게임체인저
‘글로벌 텔코 AI 얼라이언스 서밋’ 개최
SK·도이치텔레콤·e&·싱텔 최고경영진 출동
생성형 AI로 가치 창출 목표
SK와 글로벌 통신사들이 인공지능(AI) 산업을 선도하기 위해 원팀으로 뭉쳤다. '글로벌 텔코 AI 얼라이언스'를 구성하고 성장동력 확보에 나섰다.
SK텔레콤은 27일 서울 워커힐에서 '글로벌 텔코 AI 얼라이언스 CEO 서밋'을 열고 도이치텔레콤, 이앤(e&), 싱텔 등 통신사들과 ‘글로벌 텔코 AI 얼라이언스’를 출범했다고 27일 밝혔다.
‘글로벌 텔코 AI 얼라이언스 CEO 서밋’에 참석한 각 사 대표들이 MOU 서명 후 기념촬영을 하고 있다. [사진제공=SKT]
최태원 SK그룹 회장이 주재한 이번 서밋에는 유영상 SKT 사장을 비롯해 클라우디아 네맛 도이치텔레콤 부회장, 하템 도비다 e&그룹 최고경영자(CEO), 위엔 콴 문 싱텔 그룹 CEO 등이 온·오프라인으로 참석했다.
도이치텔레콤은 독일, 미국 등 전 세계 12개국에서 사업을 하는 글로벌 최대 통신사 중 하나다. e&그룹은 중동, 아시아, 아프리카에 걸쳐 16개국에 통신 서비스를 제공하고 있다. 싱텔은 호주, 인도, 인도네시아, 태국 등 21개국에서 활동하는 아시아 대표 통신사다. 원팀 통신사들의 가입자를 모두 더하면 12만명에 달한다.
글로벌 대표 통신 4사 AI 혁신 MOU 체결
이번 서밋에서 SKT, 도이치텔레콤, e&, 싱텔은 ‘글로벌 텔코 AI 얼라이언스’를 발족하고 AI 사업 협력을 위한 양해각서(MOU)를 체결했다. 첫째, 4사는 각자의 핵심 AI 역량을 기반으로 ‘텔코 AI 플랫폼’을 공동 개발한다. ‘텔코 AI 플랫폼’은 통신사별로 AI 에이전트를 개발하기 위한 거대언어모델(LLM, Large Language Model) 공동 구축을 포함해 새로운 AI 서비스 기획에 중추 역할을 담당하게 된다. 거대 플랫폼 개발에 따로 시간과 비용을 쏟지 않은 대신, 공통 플랫폼 위에서 AI 서비스를 유연하게 현지화·고도화해 고객의 사용 가치를 높이는 데 주력한다. 또 이에 수반되는 거대언어모델 제공·조달, 데이터 및 AI 전문 인력 지원 등 다각적인 협력을 추진한다.
둘째, 텔코 AI 플랫폼을 공동 개발하기 위해 신규 투자, 공동 연구개발(R&D) 등 분야별 논의를 위한 워킹 그룹을 운영한다. 셋째로 국가별 AI 서비스 개발을 위한 퍼블리싱, 버티컬 서비스 제휴, 마케팅 운영 등에서도 협력한다. "글로벌 AI 생태계 확장 이끄는 게임 체인저"
‘글로벌 텔코 AI 얼라이언스’는 생성형 AI 촉발로 글로벌 경쟁이 심화하는 가운데 AI 기반의 변화와 혁신 없이 살아남기 힘들다는 데 공감대 위에 추진됐다. 또 플랫폼 연계, 비즈니스 모델 확장, 시스템 자동화 등 빠르게 변화하는 산업 환경 속에서 유연한 디지털 전환이 어려운 만큼 기업 간 힘을 모아야 한다는 점에도 뜻을 같이했다. 이는 지난 6월 한국 대표 AI 스타트업들과 발표한 ‘K-AI 얼라이언스’ 동맹 강화에 이어, SKT가 AI 혁신을 위해 추진하는 두 번째 초협력이다.
‘글로벌 텔코 AI 얼라이언스’ 통신사들은 전통적인 통신업을 AI로 재정의해 유무선 통신과 미디어 등 기존 핵심 사업을 AI로 대전환, 새로운 성장 동력을 확보해야 한다는 데 뜻을 모았다. 새로운 AI 비즈니스 창출과 그에 따른 새로운 고객 경험 가치 제공, AI 에코시스템 구축 등을 통해 미래 가치를 키워야 한다는 데 공감했다.
최태원 회장은 글로벌 텔코 기업 리더들을 만나 새롭고 혁신적인 커뮤니케이션 경험을 제공하는 AI 기업으로 변모할 것을 제안하며 힘을 모아야 한다고 강조했다.
클라우디아 네맛 도이치텔레콤 부회장은 “우리의 고객과 산업에 있어 생성형 AI가 가진 잠재력을 극대화하기 위해 우리는 텔코 AI 얼라이언스를 통해 통신사향 애플리케이션을 개발하길 기대한다”며, “이번 얼라이언스 출범은 우리 산업의 중요한 이정표가 될 것”이라고 밝혔다.
칼리파 알 샴시 이앤라이프(e& life) CEO는 “AI는 통신산업을 재편하고 혁신할 수 있는 엄청난 잠재력을 보유하고 있고 이번 얼라이언스 출범은 이러한 변화를 위한 여정의 출발점이 될 것”이라며, “우리의 공통된 목표는 산업의 패러다임을 재정의하고 AI 기반 비즈니스 모델 발굴을 통해 새로운 성장 동력을 구축하고 미래 가치 창출에 주력하는 것”이라고 말했다.
위엔 콴 문 싱텔 그룹 CEO는 “이번 얼라이언스를 통해 우리는 고객과 기업 모두에게 혁신적인 혜택을 제공하는 AI 서비스 개발을 가속화할 수 있을 것으로 기대한다”며 “고도화된 5G 네트워크를 기반으로 AI를 활용해서 고객 서비스와 생산성을 향상하기 위해 노력할 것”이라고 전했다.
유영상 SKT 사장은 “이번 얼라이언스 출범은 글로벌 파트너사들과 함께 성장하며 비즈니스 모델을 혁신해 나갈 수 있는 새로운 여정의 출발점을 마련했다는 데 의미가 있다“며 “전 산업 영역에서 AI 대전환을 통해 고객에게 새로운 경험과 가치를 제공하는 등 글로벌 AI 생태계 확장을 이끄는 게임 체인저가 될 것”이라고 밝혔다.
출처 : https://www.asiae.co.kr/article/IT/202307271650391332 오수연 기자 syoh@asiae.co.kr
생성AI 개발 업체들, 합성 데이터 주목한다...왜?
[사진: 셔터스톡]
디지털투데이 황치규 기자] 거대언어모델(LLM) 훈련에 필요한 대규모 데이터를 확보하려는 생성AI 업체들 움직임이 분주한 가운데, 컴퓨터가 생성한 합성 데이터((Synthetic Data)에 대한 관심이 고조되고 있다.
LLM 개발 업체들은 모델 훈련에 필요한 데이터 확보 일환으로 웹에서 긁어온 데이터나 사람이 생생한 데이터를 넘어 합성 데이터 활용을 주목하는 모습이다.
파이낸셜타임스(FT) 최근 보도를 보면 마이크로소프트, 오픈AI, 코히어 같은 회사들이 현재 LLM 개발에 합성 데이터 사용을 테스트하고 있다.
합성 데이터 관련한 AI 업계 행보는 몇 가지 현실을 밑바탕에 깔고 있다. 우선 인터넷에 공개돼 있는 데이터플 편하게 가져오기가 점점 힘들어지고 있다.
현재 오픈AI 챗GPT나 구글 바드 같은 챗봇에 투입된 LLM은 주로 인터넷에서 긁어온 데이터 기반으로 훈련된다. 이들 LLM 훈련에 내용된 데이터는 디지털화된 책, 뉴스 기사, 블로그, 검색 쿼리, 트위터 및 레딧 포스트, 유튜브 비디오와 플리커 이미지 등을 포함하고 있다.
이후 사람이 피드백을 제공하는 인간 피드백형 강화학습(Reinforcement Learning from Human Feedback, RLHF) 프로세스를 거친다. RLHF는 AI 모델에 생성한 결과에 대해 사람이 좋은지 나쁜지 피드백을 주고 이를 기반으로 모델을 최적화하는 방법이다. 오픈AI도 챗GPT 구현할 때 이를 활용한 것으로 알려져 있다.
하지만 AI 회사들이 LLL 훈련에 인터넷 데이터를 마음 대로 가져가는 것에 대한 반발도 적지 않다. AI 회사들이 공개돼 있는 데이터를 긁어가는 스크래핑((scraping)을 둘러싸고 레딧 같은 업체들은 강하게 반발하며 API 가격 인상 카드까지 뽑아들었다.
LLM 개발사들이 합성 데이터 활용에 나선 것은 이같은 상황과 무관치 않아 보인다. FT에 따르면 샘 알트먼 오픈AI CEO는 5월 영국 런던에서 열린 한 행사에서 규제 당국이 챗GPT가 프라이버시를 침해했을 가능성에 대해 조사하는 것을 우려하는지에 대한 질문을 일축하며 "조만간 모든 데이터는 합성 데이터일 것이다"고 말했다.
생성AI 훈련에 필요한 고품질 데이터를 확보하는 비용이 만만치 않다는 것도 AI 회사들이 합성 데이터로 눈을 돌리는 요인으로 부상했다. 생성AI 성능을 지금보다 크게 끌어 올리려면 양질의 데이터셋이 필수다.
이들 데이터셋은 과학자, 의사, 작가, 배우 또는 엔지니어 같은 전문가들 도움을 받거나 제약회사, 은행, 유통사 등 대기업들이 보유한 사적인 데이터를 통해 얻을 수 있는데, 실탄이 나름 든든한 회사라고 해도 비용 측면에서 부담일 수 있다.이런 상황에서 합성 데이터는 LLM 업체들이 데이터 확보에 따르는 진입 장벽을 우회할 수 있는 수단이 될 수 있다는 얘기다.
코미즈 코히어 CEO에 따르면 코히어 뿐만 아니라 몇몇 생성 AI 개발 업체들은 사람이 미세 조정하고 수정한 합성 데이터를 활용하고 있다. 널리 알려지지 않았지만 이미 상당한 규모로 활용되고 있다는게 그의 설명이다.
FT에 따르면 그는 첨단 수학에 대한 모델 훈련을 예로 들었다. 코히어는 서로 대화하는 2개 AI 모델을 활용하고 있는데, 한 모델은 수학 강사, 다른 한 모델은 학생 역할을 한다.
고메즈 CEO는 "이들 모델은 삼각법에 대한 대회를 하고 있다. 모두 합성이다. 모두가 모델이 단지 상상한 것들이다. 이때 사람이 대화를 살펴보고 잘못된 게 있다면 수정한다"고 전했다.
마이크로소프트 리서치가 최근 내놓 논문 2편에 따르면 합성 데이터는 오픈AI GPT-4나 구글 팜(PaLM)-2와 같은 대규모 소프트웨어보다 단순하고 크기가 적은 모델들을 훈련하는데 사용될 수 있다.
합성 데이터를 주특기로 하는 스타트업들도 나오고 있다. 스케일AI와 그레텔AI(Gretel.ai)와 같은 기업들은 이미 서비스형 합성 데이터를 제공 중이다.
그레텔의 경우 미국 국가 안보국(NSA)와 중앙정보국(CIA) 출신 정보 애널리스트들이 설립한 곳인데, 구글, HSBC, 라이엇게임즈, 일루미나 등과 협력하고 있다고 FT는 전했다. 그리텔 CEO 알리 골스한에 따르면 합성 데이터에서 핵심 요소는 데이터셋에서 모든 개인들 프프라이버시를 보호하면서도 통계계적인 무결성은 유지하는 것이다. 잘 만들어진 합성 데이터는 기존 데이터에서 편향과 불균형도 제거할 수 있다.
하지만 모든 합성 데이터가 현실 데이터를 개선하거나 반영하도록 신중하게 큐레이션되지는 않을 것이란 지적도 있다. FT는 옥스포드와 게임브리지 대학들 연구를 인용해 AI가 자체 생성한 결과로 AI 모델을 훈련하는 것은 거짓과 조작을 포함할 수 있고 시간이 가면서 기술을 오염시켜 되돌릴 수 없는 결함으로 이어질 수 있다고 전했다.
출처 : 디지털투데이 (DigitalToday)(http://www.digitaltoday.co.kr)